Pandas分類級聯(lián)關(guān)系分析
2023-08-12 17:19 作者:yangmqglobe | 我要投稿


這是我的做法,主要的思路是把每一行的各個層級分割出來,這樣想怎么統(tǒng)計,都可以。
首先要把各個層級抽提出來,使用str下的extractall利用正則表達(dá)式提取各個層級(不是箭頭的字符子串)。得到的長數(shù)據(jù)使用unstack堆疊起來。這里有個小問題,因為返回的dataframe有雙層列名,所以拋棄第一層。
經(jīng)過以上步驟,每一行的每個層級就被分開了,這樣就可以做自己想要的統(tǒng)計啦,比如UP這里的這種統(tǒng)計。
標(biāo)簽: