pandas pd.cut()與pd.qcut()
1、pd.cut函數(shù)有7個參數(shù),主要用于對數(shù)據從最大值到最小值進行等距劃分
?pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)
參數(shù):
x : 輸入待cut的一維數(shù)組
bins : cut的段數(shù),一般為整型,但也可以為序列向量。
right : 布爾值,確定右區(qū)間是否開閉,取True時右區(qū)間閉合
labels : 數(shù)組或布爾值,默認為None,用來標識分后的bins,長度必須與結果bins相等,返回值為整數(shù)或者對bins的標識
retbins : 布爾值,可選。是否返回數(shù)值所在分組,Ture則返回
precision : 整型,bins小數(shù)精度,也就是數(shù)據以幾位小數(shù)顯示
include_lowest : 布爾類型,是否包含左區(qū)間
2、pd.qcut函數(shù),按照數(shù)據出現(xiàn)頻率百分比劃分,比如要把數(shù)據分為四份,則四段分別是數(shù)據的0-25%,25%-50%,50%-75%,75%-100%
pd.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')
代碼示例:
運行結果如圖:
可以看到cut列各個分段之間間距相等,qcut由于數(shù)據中‘2’較多,所以2附近間距較小,2之后的分段間距較大。?
?

轉載https://blog.csdn.net/qq_37089628/article/details/86501234
