愛(ài)數(shù)據(jù) 數(shù)據(jù)產(chǎn)品經(jīng)理入職解決方案
? ?第一步:數(shù)據(jù)審查
? ? ? ? 該步驟檢查數(shù)據(jù)的數(shù)量(記錄數(shù))是否滿足分析的最低要求,變量值的內(nèi)容是否與研究的要求一致,是否全面,包括利用描述性統(tǒng)計(jì)分析,檢查各個(gè)變量的數(shù)據(jù)類型,變量值的最大值、最小值、平均數(shù)、中位數(shù)等,數(shù)據(jù)個(gè)數(shù)、缺失值或空值個(gè)數(shù)等。
? ? ? ? 第二步:數(shù)據(jù)清理
? ? ? ? 該步驟針對(duì)數(shù)據(jù)審查過(guò)程中發(fā)現(xiàn)的明顯錯(cuò)誤值、缺失值、異常值、可疑數(shù)據(jù),選用適當(dāng)?shù)姆椒ㄟM(jìn)行“清理”,使“臟”數(shù)據(jù)變?yōu)椤案蓛簟睌?shù)據(jù),保證后續(xù)的數(shù)據(jù)分析得出可靠的結(jié)論。當(dāng)然,數(shù)據(jù)清理還包括對(duì)重復(fù)記錄進(jìn)行刪除。
標(biāo)簽: