最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI,數(shù)據(jù)分析師行業(yè)要變天了?

2023-07-12 00:15 作者:考研保研直通車(chē)  | 我要投稿

說(shuō)到Python編程語(yǔ)言,使用Python語(yǔ)言主要使用的是數(shù)據(jù)科學(xué)領(lǐng)域的從業(yè)者。


Python編程語(yǔ)言之所以在數(shù)據(jù)科學(xué)領(lǐng)域十分火熱,源于Python語(yǔ)言的三大數(shù)據(jù)科學(xué)工作包,NumPy,Pandas,SciPy。


以下是三個(gè)工具包的功能簡(jiǎn)介:


NumPy:NumPy 是 Python 中最常用的數(shù)值計(jì)算庫(kù)之一。它提供了一個(gè)高效的多維數(shù)組對(duì)象和用于操作數(shù)組的函數(shù),使得在 Python 中進(jìn)行數(shù)值計(jì)算變得更加簡(jiǎn)單和高效。





Pandas:Pandas 是一個(gè)功能強(qiáng)大且靈活的數(shù)據(jù)分析工具,廣泛用于數(shù)據(jù)清洗、整理和處理。Pandas 提供了豐富的數(shù)據(jù)操作和轉(zhuǎn)換函數(shù),可以進(jìn)行數(shù)據(jù)的選擇、過(guò)濾、聚合、合并等操作,方便進(jìn)行數(shù)據(jù)預(yù)處理和分析。





SciPy:SciPy 提供了許多模塊和子模塊,包括線性代數(shù)、數(shù)值積分、優(yōu)化、信號(hào)處理、圖像處理、統(tǒng)計(jì)學(xué)等領(lǐng)域的函數(shù)和工具。常用于數(shù)據(jù)分析、數(shù)值計(jì)算、科學(xué)計(jì)算以及機(jī)器學(xué)習(xí)等領(lǐng)域。





對(duì)于數(shù)據(jù)科學(xué)行業(yè)的從業(yè)者掌握Pandas,Numpy,SciPy三大數(shù)據(jù)科學(xué)工具包是最基本的技能之一。


Numpy工具包主要用于矩陣的變換,而SciPy工具包則是應(yīng)用于圖像處理領(lǐng)域。但是真正對(duì)實(shí)際的數(shù)據(jù)清洗,整理以及處理的操作使用的是pandas工具包,同時(shí)業(yè)務(wù)方的底層數(shù)據(jù)集通常是以csv格式的表格文件進(jìn)行存儲(chǔ)的。


我們以下的一個(gè)實(shí)際的代碼例子,來(lái)親自感受一下Pandas工具包的實(shí)際用法與教程。


需求:對(duì)電影評(píng)分表格數(shù)據(jù)處理,加載電影數(shù)據(jù)集的數(shù)據(jù),計(jì)算平均評(píng)分,同時(shí)對(duì)不同評(píng)分?jǐn)?shù)量的電影進(jìn)行數(shù)量統(tǒng)計(jì),并繪制餅狀圖。


備注:電影評(píng)分表格數(shù)據(jù)內(nèi)容,表格數(shù)據(jù)中包含三列,電影序號(hào),電影名稱(chēng),電影評(píng)分。





1. 加載表格數(shù)據(jù)集的數(shù)據(jù)內(nèi)容并打印

# 加載數(shù)據(jù)集
data = pd.read_csv('movies.csv')
# 展示前幾行數(shù)據(jù)
print(data.head())


運(yùn)行結(jié)果:

movie_id title rating
0 1 The Shawshank Redemption 9.2
1 2 The Godfather 9.1
2 3 The Dark Knight 9.0
3 4 12 Angry Men 8.9
4 5 Pulp Fiction 8.9


2. 計(jì)算平均評(píng)分

# 計(jì)算平均評(píng)分
average_rating = data['rating'].mean()
print('平均評(píng)分:', average_rating)


運(yùn)行結(jié)果:

平均評(píng)分: 8.919999999999998


3. 統(tǒng)計(jì)不同評(píng)分的數(shù)量

rating_counts = data['rating'].value_counts()
print('評(píng)分統(tǒng)計(jì):')
print(rating_counts)


運(yùn)行結(jié)果:

評(píng)分統(tǒng)計(jì):
8.9 4
8.8 2
9.2 1
9.1 1
9.0 1
8.7 1


4. 將電影評(píng)分的分布繪制為餅狀圖

# 繪制評(píng)分分布餅狀圖
plt.pie(rating_counts.values, labels=rating_counts.index, autopct='%1.1f%%', startangle=90)
plt.title('電影評(píng)分分布')


運(yùn)行結(jié)果:



怎么樣,Pandas代碼工具包進(jìn)行表格數(shù)據(jù)的處理能力,效果是不是十分不錯(cuò)呢?而且感覺(jué)很酷炫!


不過(guò)Pandas代碼工具包還是需要一定的編程基礎(chǔ)的,由于還需要定義繪制圖片的字體以及布局等,所以即使這樣幾個(gè)簡(jiǎn)單的處理,也寫(xiě)了大約60行的代碼。


那么,有沒(méi)有什么辦法,直接讓代碼自動(dòng)生成或者處理我們的數(shù)據(jù)需求?


當(dāng)然了!在AI的洪流時(shí)代,沒(méi)有什么是不可能!Pandas與ChatGPY兩個(gè)工具包,進(jìn)行強(qiáng)強(qiáng)結(jié)合。


現(xiàn)在已經(jīng)誕生了“ChatGPT+Pandas”結(jié)合的:Pandas-ai工具包,實(shí)現(xiàn)了人工智能輔助我們做數(shù)據(jù)分析!

到底是什么效果,我們一起來(lái)看一看!


1. PandasAI安裝命令

pip install pandasai


2. 準(zhǔn)備基礎(chǔ)表格的數(shù)據(jù),引用了官網(wǎng)的各國(guó)GDP數(shù)據(jù)

import pandas as pd
from pandasai import PandasAI


# 隨機(jī)初始化各國(guó)名稱(chēng),GDP數(shù)據(jù),幸福指數(shù)數(shù)據(jù)
df = pd.DataFrame({
"country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
"gdp": [19294482071552, 2891615567872, 2411255037952, 3435817336832, 1745433788416, 1181205135360, 1607402389504, 1490967855104, 4380756541440, 14631844184064],
"happiness_index": [6.94, 7.16, 6.66, 7.07, 6.38, 6.4, 7.23, 7.22, 5.87, 6.12]
})


from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token="YOUR_API_TOKEN")


pandas_ai = PandasAI(llm, conversational=False)
pandas_ai(df, prompt='Which are the 5 happiest countries?')


api_token="YOUR_API_TOKEN"中的字符串替換為自己的API KEY,生成方法很簡(jiǎn)單,如下圖:





以上代碼的運(yùn)行結(jié)果如下圖所示

According to the data, the top 5 happiest countries are the United States, Canada, Australia, United Kingdom, and Germany.


3. 不僅可以直接進(jìn)行對(duì)話(huà)的文字回答,PandasAI的工具包還可以直接進(jìn)行圖片生成

pandas_ai.run(df, "Plot the histogram of countries showing for each the gpd, using different colors for each bar")


以上代碼的運(yùn)行結(jié)果如下圖所示:



4. 并且PandasAI工具包不僅僅支持英文對(duì)答,中文也是支持的

pandas_ai.run(df, "哪個(gè)國(guó)家的GDP最少?使用中文回答")


運(yùn)行結(jié)果輸出:

哪個(gè)國(guó)家的GDP最少?日本。


怎么樣?是不是十分的神奇?在ChatGPT的大模型時(shí)代,真的沒(méi)有任何行業(yè)不受沖擊的。


作為一名程序員要學(xué)會(huì)擁抱變化,使用Pandas+ChatGPT去提高自己的工作效率,因?yàn)闀r(shí)代在發(fā)展進(jìn)步!


Pandas+ChatGPT強(qiáng)強(qiáng)結(jié)合誕生PandasAI,數(shù)據(jù)分析師行業(yè)要變天了?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
蓬溪县| 桐庐县| 四平市| 和平县| 通海县| 黄大仙区| 灌南县| 桂东县| 屏山县| 大竹县| 湘潭县| 海口市| 邵阳市| 磐石市| 开封市| 长岭县| 开阳县| 闵行区| 甘德县| 朔州市| 东丰县| 德昌县| 沂南县| 读书| 高唐县| 库伦旗| 灵石县| 清水河县| 阿尔山市| 淮南市| 道孚县| 隆化县| 勐海县| 遵义市| 新兴县| 华亭县| 嘉禾县| 本溪| 临邑县| 常熟市| 嘉禾县|