Python之自動化報表

人生苦短,我用python。
相信做過報表的都對其煩不勝煩,周報,月報,季報;一期期的報表,一次次的心酸淚,煩不勝煩。至于作者是怎么知道的,因為我也是這個苦逼報表大軍的一員。
是這樣的,當時參與公司的一個項目,我的任務(wù)是出報表,聽到任務(wù)時,心中頓時樂開了花,嗚呼,這個簡單,不就是出個報表嗎。So easy!可拿到歷史數(shù)據(jù)做成的表格頓時就不淡定了,一共是6個excel,每個excel是4-5個sheet,每個sheet里還有一堆花花綠綠的表格需要填寫,心里頓時不淡定了。完成整個任務(wù)之后,唯一感覺到的是,痛苦麻木。
之后通過網(wǎng)絡(luò)查詢資料,發(fā)現(xiàn)這個報表居然可以自動化。接著花了一個星期的時間將報表自動化,當最后一個表格自動化代碼寫完后,打開python,運行程序,不得不說,一個字爽,再也不用一點一點的往sheet里弄數(shù)據(jù)了。
好了,接下來就為大家介紹今天的主角,xlwings。
先簡單的看一下最終生成的表格效果吧。

下面我們就來看看這個案例吧。
以下是我們的原始數(shù)據(jù),一共以三個sheet,每個sheet,這三個sheet分別是原煤,原油,天然氣的數(shù)據(jù)。,指標有產(chǎn)量當期值,產(chǎn)量累計值,產(chǎn)量同比增長,產(chǎn)量累計增長。
這些數(shù)據(jù)都是可以在國家統(tǒng)計局里下載出來的,有興趣的小伙伴可以自行下載。這個案例是讓我們將數(shù)據(jù)以上表格的形式輸出,指標名稱是白色,單元格是黑色,此外數(shù)據(jù)中,紅色是大于平均值進行得標注,藍色是小于平均值進行的標注,表格字體為宋體。



首先呢,先導入相關(guān)庫,用python讀取原始數(shù)據(jù)。

就數(shù)據(jù)而言,已經(jīng)離我們要的最終表格差的不遠了,就差一點點細節(jié)了。
是時候上我們的主角xlwings,xlwings能夠非常方便的讀寫excel文件中的數(shù)據(jù),最重要的是它可以對單元的格式進行修改,可以與pandas無縫連接。
使用xlwings庫創(chuàng)建一個excel工作簿,在工作簿中創(chuàng)建一個表,表的名稱為finally_data。
然后將上面利用pandas整合的數(shù)據(jù)復制到finally_data表格中,當然了將數(shù)據(jù)復制到表格中,在此看來有三種方式。
第一種:將一個數(shù)據(jù)看成一個單位,一個一個寫入創(chuàng)建的表格中,此時需要注意的是,每一個數(shù)據(jù)在excel的位置和在dataframe表格中的位置,以免出現(xiàn)錯誤。
第二種:將一行數(shù)據(jù)看成一個單位,此時需要注意的是,每行數(shù)據(jù)的第一個在excel中的位置,參考復制粘貼形式。
第三種:將一張表的數(shù)據(jù)看成一個單位,本質(zhì)上與第二種沒什么區(qū)別,都是切片式傳入數(shù)據(jù),但是第三種方法是一二維數(shù)組的形式寫入。

三者均能達到我們想要結(jié)果,各有優(yōu)劣,作者喜歡的是第三種。達到這一步的時候,剩下的就是對表格內(nèi)單元格的格式進行修改了。
再對單元格進行修改之前,我們要先求出來原煤產(chǎn)量當期值,原油產(chǎn)量長期值,天然氣產(chǎn)量當期值,這三列數(shù)據(jù)中大于平均值和小于平均值的數(shù)據(jù)在Dataframe的位置,同時得出該數(shù)據(jù)在excel的位置,方便在進行單元格的格式修改。

終于所有的條件全部滿足了,最后可以對表格的格式進行修改了。
首先就是將字體全部改成宋體同時在表格中有數(shù)據(jù)的區(qū)域加上邊框。
第二步就是將第一行的字體變成白色,單元格填充黑色。
最后一步就是將大于均值的數(shù)據(jù)字體改成紅色,小于均值的字體改成藍色。然后在進行保存。

結(jié)果出來后,符合我們的要求。本次案例完整結(jié)束,當然了真正入手一個完整的自動化報表項目,遠不止這么簡單,中間還會出現(xiàn)一下別的問題。如果想要了解更多請持續(xù)關(guān)注我們哦。
關(guān)注我即刻了解更多數(shù)據(jù)分析知識
更多數(shù)據(jù)分析內(nèi)容
掃描碼即可了解