Power Query清洗標(biāo)題行錯(cuò)位的數(shù)據(jù)
案例來(lái)源于一位同學(xué)的一種設(shè)備,去敏后格式如下:指標(biāo)涉及100多個(gè),每次測(cè)量的指標(biāo)不一樣,也就是說(shuō),設(shè)備除了“數(shù)據(jù)編號(hào)”外,其他標(biāo)題名稱錯(cuò)位存放于同一工作表中。另外,每個(gè)編號(hào)的條目數(shù)量(行數(shù))不一樣,大部分1條,但有的是2條或3條。

經(jīng)Power Query處理后,結(jié)果如下:

處理的原理是:依據(jù)Power Query按照列名識(shí)別數(shù)據(jù)的特點(diǎn),將每個(gè)數(shù)據(jù)編號(hào)分組,拆分為獨(dú)立的表格,然后獨(dú)立小表格提升標(biāo)題后合并。實(shí)施過(guò)程如下。
將數(shù)據(jù)源導(dǎo)入Power Query后添加索引列,用于識(shí)別每個(gè)“數(shù)據(jù)編號(hào)”出現(xiàn)的位置。

篩選列1的數(shù)據(jù)編號(hào)內(nèi)容,界面只留下了所有標(biāo)題,為這個(gè)篩選后的表再建一個(gè)索引,命名為“分組”,后期表格將按照此分組拆分。


Power Query的每一步操作生成的步驟可以看作一個(gè)表,不同的表之間可以相互調(diào)用。前面已經(jīng)有了四個(gè)步驟對(duì)應(yīng)四個(gè)表?,F(xiàn)在的問(wèn)題是,最后的步驟使得界面停留在僅剩標(biāo)題的狀態(tài),數(shù)據(jù)被篩選掉了。而需要的結(jié)果是,對(duì)原始表進(jìn)行分組索引。

所以,我們需要將“分組索引”表生成的“分組”添加到“全部數(shù)據(jù)索引”表中,添加的方式是合并查詢,在分組索引后新增以下公式:
展開(kāi)后如下圖所示:

接著使用向下填充功能填充空白,全部數(shù)據(jù)即實(shí)現(xiàn)了編號(hào)和分組。

除了合并查詢,還可以使用自定義函數(shù)的方法對(duì)數(shù)據(jù)分組編號(hào),詳見(jiàn)pqfans.com施陽(yáng)老師的文章。這兩種方法都不好理解,最簡(jiǎn)單最容易理解的方法其實(shí)是直接在Excel界面中的數(shù)據(jù)源加一列:

分組編號(hào)確立后,使用分組依據(jù)功能將表格內(nèi)容縮回:

添加自定義列刪除每個(gè)表的分組編號(hào)(只保留數(shù)據(jù)源內(nèi)容),然后提升標(biāo)題,展開(kāi)自定義列后即可得到文章開(kāi)頭的清洗結(jié)果。
