數(shù)據(jù)技術(shù)課堂2021數(shù)據(jù)分析實戰(zhàn)
2022-09-28 14:25 作者:janet19961217 | 我要投稿
1.1 認(rèn)識和理解數(shù)據(jù)
In [?]
import seaborn as snsimport pandas as pd# tit = sns.load_dataset("titanic") ?# 從網(wǎng)站直接下載。# 或者直接通過函數(shù)加載。data = pd.read_csv("work/titanic.csv") ?# 加載后的文件是一個dataframe 格式的文件。
In [?]
##觀察和理解數(shù)據(jù)# data.shape ?#觀察數(shù)據(jù)規(guī)模# data.describe() #數(shù)據(jù)分布描述# data.head(5) #前五條數(shù)據(jù)記錄
In [?]
data.columns ?# 列出所有字段# 學(xué)習(xí)相關(guān)知識,了解每個字段的含義。
Index(['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare',
? ? ? 'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town',
? ? ? 'alive', 'alone'],
? ? ?dtype='object')
標(biāo)簽: