散文網(wǎng) » 生活 »日常 » Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？

2023-07-12 00:15 作者:考研保研直通車(chē) 0人讀過(guò) | 我要投稿

說(shuō)到Python編程語(yǔ)言，使用Python語(yǔ)言主要使用的是數(shù)據(jù)科學(xué)領(lǐng)域的從業(yè)者。

Python編程語(yǔ)言之所以在數(shù)據(jù)科學(xué)領(lǐng)域十分火熱，源于Python語(yǔ)言的三大數(shù)據(jù)科學(xué)工作包，NumPy，Pandas，SciPy。

以下是三個(gè)工具包的功能簡(jiǎn)介：

NumPy：NumPy 是 Python 中最常用的數(shù)值計(jì)算庫(kù)之一。它提供了一個(gè)高效的多維數(shù)組對(duì)象和用于操作數(shù)組的函數(shù)，使得在 Python 中進(jìn)行數(shù)值計(jì)算變得更加簡(jiǎn)單和高效。

Pandas：Pandas 是一個(gè)功能強(qiáng)大且靈活的數(shù)據(jù)分析工具，廣泛用于數(shù)據(jù)清洗、整理和處理。Pandas 提供了豐富的數(shù)據(jù)操作和轉(zhuǎn)換函數(shù)，可以進(jìn)行數(shù)據(jù)的選擇、過(guò)濾、聚合、合并等操作，方便進(jìn)行數(shù)據(jù)預(yù)處理和分析。

SciPy：SciPy 提供了許多模塊和子模塊，包括線性代數(shù)、數(shù)值積分、優(yōu)化、信號(hào)處理、圖像處理、統(tǒng)計(jì)學(xué)等領(lǐng)域的函數(shù)和工具。常用于數(shù)據(jù)分析、數(shù)值計(jì)算、科學(xué)計(jì)算以及機(jī)器學(xué)習(xí)等領(lǐng)域。

對(duì)于數(shù)據(jù)科學(xué)行業(yè)的從業(yè)者掌握Pandas，Numpy，SciPy三大數(shù)據(jù)科學(xué)工具包是最基本的技能之一。

Numpy工具包主要用于矩陣的變換，而SciPy工具包則是應(yīng)用于圖像處理領(lǐng)域。但是真正對(duì)實(shí)際的數(shù)據(jù)清洗，整理以及處理的操作使用的是pandas工具包，同時(shí)業(yè)務(wù)方的底層數(shù)據(jù)集通常是以csv格式的表格文件進(jìn)行存儲(chǔ)的。

我們以下的一個(gè)實(shí)際的代碼例子，來(lái)親自感受一下Pandas工具包的實(shí)際用法與教程。

需求：對(duì)電影評(píng)分表格數(shù)據(jù)處理，加載電影數(shù)據(jù)集的數(shù)據(jù)，計(jì)算平均評(píng)分，同時(shí)對(duì)不同評(píng)分?jǐn)?shù)量的電影進(jìn)行數(shù)量統(tǒng)計(jì)，并繪制餅狀圖。

備注：電影評(píng)分表格數(shù)據(jù)內(nèi)容，表格數(shù)據(jù)中包含三列，電影序號(hào)，電影名稱(chēng)，電影評(píng)分。

1. 加載表格數(shù)據(jù)集的數(shù)據(jù)內(nèi)容并打印

# 加載數(shù)據(jù)集
data = pd.read_csv('movies.csv')
# 展示前幾行數(shù)據(jù)
print(data.head())

運(yùn)行結(jié)果：

movie_id title rating
0 1 The Shawshank Redemption 9.2
1 2 The Godfather 9.1
2 3 The Dark Knight 9.0
3 4 12 Angry Men 8.9
4 5 Pulp Fiction 8.9

2. 計(jì)算平均評(píng)分

# 計(jì)算平均評(píng)分
average_rating = data['rating'].mean()
print('平均評(píng)分:', average_rating)

運(yùn)行結(jié)果：

平均評(píng)分: 8.919999999999998

3. 統(tǒng)計(jì)不同評(píng)分的數(shù)量

rating_counts = data['rating'].value_counts()
print('評(píng)分統(tǒng)計(jì):')
print(rating_counts)

運(yùn)行結(jié)果：

評(píng)分統(tǒng)計(jì):
8.9 4
8.8 2
9.2 1
9.1 1
9.0 1
8.7 1

4. 將電影評(píng)分的分布繪制為餅狀圖

# 繪制評(píng)分分布餅狀圖
plt.pie(rating_counts.values, labels=rating_counts.index, autopct='%1.1f%%', startangle=90)
plt.title('電影評(píng)分分布')

運(yùn)行結(jié)果：

怎么樣，Pandas代碼工具包進(jìn)行表格數(shù)據(jù)的處理能力，效果是不是十分不錯(cuò)呢？而且感覺(jué)很酷炫！

不過(guò)Pandas代碼工具包還是需要一定的編程基礎(chǔ)的，由于還需要定義繪制圖片的字體以及布局等，所以即使這樣幾個(gè)簡(jiǎn)單的處理，也寫(xiě)了大約60行的代碼。

那么，有沒(méi)有什么辦法，直接讓代碼自動(dòng)生成或者處理我們的數(shù)據(jù)需求？

當(dāng)然了！在AI的洪流時(shí)代，沒(méi)有什么是不可能！Pandas與ChatGPY兩個(gè)工具包，進(jìn)行強(qiáng)強(qiáng)結(jié)合。

現(xiàn)在已經(jīng)誕生了“ChatGPT+Pandas”結(jié)合的：Pandas-ai工具包，實(shí)現(xiàn)了人工智能輔助我們做數(shù)據(jù)分析！

到底是什么效果，我們一起來(lái)看一看！

1. PandasAI安裝命令

pip install pandasai

2. 準(zhǔn)備基礎(chǔ)表格的數(shù)據(jù)，引用了官網(wǎng)的各國(guó)GDP數(shù)據(jù)

import pandas as pd
from pandasai import PandasAI

# 隨機(jī)初始化各國(guó)名稱(chēng)，GDP數(shù)據(jù)，幸福指數(shù)數(shù)據(jù)
df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
"happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 6.12]
})

from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token="YOUR_API_TOKEN")

pandas_ai = PandasAI(llm, conversational=False)
pandas_ai(df, prompt='Which are the 5 happiest countries?')

api_token="YOUR_API_TOKEN"中的字符串替換為自己的API KEY,生成方法很簡(jiǎn)單，如下圖：

以上代碼的運(yùn)行結(jié)果如下圖所示

According to the data, the top 5 happiest countries are the United States, Canada, Australia, United Kingdom, and Germany.

3. 不僅可以直接進(jìn)行對(duì)話(huà)的文字回答，PandasAI的工具包還可以直接進(jìn)行圖片生成

pandas_ai.run(df, "Plot the histogram of countries showing for each the gpd, using different colors for each bar")

以上代碼的運(yùn)行結(jié)果如下圖所示：

4. 并且PandasAI工具包不僅僅支持英文對(duì)答，中文也是支持的

pandas_ai.run(df, "哪個(gè)國(guó)家的GDP最少？使用中文回答")

運(yùn)行結(jié)果輸出：

哪個(gè)國(guó)家的GDP最少？日本。

怎么樣？是不是十分的神奇？在ChatGPT的大模型時(shí)代，真的沒(méi)有任何行業(yè)不受沖擊的。

作為一名程序員要學(xué)會(huì)擁抱變化，使用Pandas+ChatGPT去提高自己的工作效率，因?yàn)闀r(shí)代在發(fā)展進(jìn)步！

標(biāo)簽：

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？的評(píng)論 (共條)

愛(ài)情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩(shī)歌空間日志經(jīng)典語(yǔ)句愛(ài)情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？的評(píng)論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？

本文作者的其他文章

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？的評(píng)論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI，數(shù)據(jù)分析師行業(yè)要變天了？的評(píng)論 (共條)