博學(xué)谷年度鉆石會員數(shù)據(jù)分析進(jìn)階
2. 數(shù)據(jù)分析的步驟有哪些?
? ??????明確分析的目的和內(nèi)容:數(shù)據(jù)分析的對象是誰?數(shù)據(jù)分析的商業(yè)目的是什么?最后的結(jié)果要解決什么樣的業(yè)務(wù)問題?對數(shù)據(jù)分析目的的把握,是數(shù)據(jù)分析項目成敗的關(guān)鍵。
? ? ? ??數(shù)據(jù)收集:按照確定的數(shù)據(jù)分析和框架內(nèi)容,有目的地收集、整合相關(guān)數(shù)據(jù)的過程,它數(shù)據(jù)分析的基礎(chǔ)。
? ? ? ??數(shù)據(jù)預(yù)處理:對收集到的數(shù)據(jù)進(jìn)行加工、整理,以便開展數(shù)據(jù)分析,它是數(shù)據(jù)分析前必不可少的階段。處理的過程可概括起來包括數(shù)據(jù)審查、數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)驗證四個步驟。
????????第一步:數(shù)據(jù)審查
? ? ? ? 該步驟檢查數(shù)據(jù)的數(shù)量(記錄數(shù))是否滿足分析的最低要求,變量值的內(nèi)容是否與研究的要求一致,是否全面,包括利用描述性統(tǒng)計分析,檢查各個變量的數(shù)據(jù)類型,變量值的最大值、最小值、平均數(shù)、中位數(shù)等,數(shù)據(jù)個數(shù)、缺失值或空值個數(shù)等。
? ? ? ? 第二步:數(shù)據(jù)清理
? ? ? ? 該步驟針對數(shù)據(jù)審查過程中發(fā)現(xiàn)的明顯錯誤值、缺失值、異常值、可疑數(shù)據(jù),選用適當(dāng)?shù)姆椒ㄟM(jìn)行“清理”,使“臟”數(shù)據(jù)變?yōu)椤案蓛簟睌?shù)據(jù),保證后續(xù)的數(shù)據(jù)分析得出可靠的結(jié)論。當(dāng)然,數(shù)據(jù)清理還包括對重復(fù)記錄進(jìn)行刪除。