三文快速入門Pandas

Get新知識:
dataframe 常用函數(shù)
head() 和 tail()
head 用于查看前幾行數(shù)據(jù),可以傳入整型參數(shù)查看指定前幾行的數(shù)據(jù),tail 查看后幾行數(shù)據(jù),原理同head類似。
unique() 和 nunique()
unique() 用于顯示當(dāng)前數(shù)據(jù) 中全部的唯一值,nunique() 用于查看當(dāng)前數(shù)據(jù)有幾個(gè)唯一值。
count() 和 value_counts()
count() 返回當(dāng)前數(shù)據(jù)的 非空數(shù)據(jù)的個(gè)數(shù),value_counts() 返回當(dāng)前數(shù)據(jù)每種類別各有幾條數(shù)據(jù)。
descripe() 和 info()
describe() 用于查看數(shù)據(jù)源的統(tǒng)計(jì)信息,包括均值方差標(biāo)準(zhǔn)差四分位數(shù)等統(tǒng)計(jì)信息,info() 可用于查看每列數(shù)據(jù)類型,缺省值情況等基本信息。
descripe() 也可以指定分位數(shù)
idxmax() 和 nlargest()
idxmax() 返回最大值的索引,idxmin 功能類似。nlargest() 返回前幾個(gè)數(shù)值最大的數(shù)據(jù),可以傳參指定個(gè)數(shù)。
clip() 和 replace()
clip() 方法接受兩個(gè)整型參數(shù),第一個(gè)指明小于該數(shù)值數(shù)據(jù)全部以該數(shù)據(jù)替代,第二個(gè)指明大于該數(shù)值全部以該數(shù)據(jù)替代。df['Math'].clip(33,80)
replace() 方法是對指定值進(jìn)行替換。
df['Address'].replace(['street_1','street_2'],['one','two'])
df.replace({'Address':{'street_1':'one','street_2':'two'}})
兩種寫法功能一致。
sort_index() 和 sort_values()
sort_index() 方法以數(shù)據(jù)源的行標(biāo)簽進(jìn)行排序,按行操作進(jìn)行排序,ascending 指定是否升序,默認(rèn)升序。
sort_values() 方法以數(shù)據(jù)源某幾列的數(shù)據(jù)進(jìn)行排序,默認(rèn)升序,可以同時(shí)傳入多列按多列進(jìn)行排序。
df2 = df1.sort_index(ascending=False)
print(df2)
df3 = df1.sort_values(by="ax", ascending=False)
print(df3)