黑馬博學谷【季度鉑金會員】JavaEE
符)是無關緊要的觀察。這樣的觀察是無用的數(shù)據(jù),可以直接刪除。
(2) 修復數(shù)據(jù)集中的結構錯誤。
結構性錯誤是指測量和數(shù)據(jù)傳輸過程中的排字錯誤、相同的屬性名稱不同、標簽類型不正確、大小寫不一致等。例如,模型應處理大寫的拼寫錯誤和不一致(如“BBBb”和“BBBB”) ?") 作為同一類別,而不是兩個不同的類別。
(3) 處理丟失的數(shù)據(jù)。
收集到的數(shù)據(jù)中的一件重要事情是“缺失數(shù)據(jù)”。數(shù)據(jù)集中的缺失值不能簡單地忽略,缺失的數(shù)據(jù)必須以某種方式處理。比如刪除有缺失值的觀察或根據(jù)過去或其他觀察估計缺失值。
Python 數(shù)據(jù)分析 ???
Python 語言數(shù)據(jù)分析庫目前非常廣泛,從科學計算領域的 Numpy 和 Scipy?
標簽: