用最騷的操作批量保存Office文檔中的圖片

由本文衍生的Python代碼開源在?https://github.com/Mark9804/OfficeImageExtractor?
前段時間因為大創(chuàng)項目的考核需要,我象征性地開了一個公眾號用來象征性地發(fā)一些奇奇怪怪的文章。
公眾號的文章嘛自然要圖文并茂,幾位供稿人也是這么想的,于是那段時間每天我都能看到四篇圖文并茂的Word文檔。問題是那個時候新媒體管家這插件還不是很好用,從Word生成公眾號文章的每張圖都是裂開的(坑人微信也不允許直接復(fù)制粘貼圖片)……迫于無奈,我只能把文檔中的所有圖片全部導(dǎo)出,手動插入到文章中。
有一說一,Word、PowerPoint以及Excel確實提供了右鍵圖片另存為的方式,但只是保存一張圖的話還好,每天十張二十張的話很容易工傷的。于是為了我的頭發(fā),也為了我的纖纖玉手(?),我得到了這么一個騷操作:先將Office文檔以壓縮包的形式解壓,再把圖片一次性復(fù)制出來。
嗯,是的,所有Office文檔(不包括Access)的本質(zhì)就是個壓縮包。

在把文檔后綴名改成.zip之后,大部分的解壓軟件就可以正常識別了。以Word文檔為例的話,打開壓縮包→word文件夾→media文件夾之后就可以看到所有的圖片啦~

PPT和Excel也可以用相同的方式打開,不過他們的存儲路徑不太一樣。

唯一讓我覺得遺憾的是這個方式只對Office 2007之后的文檔格式才有效(97 - 2003版本的文檔格式是完全不一樣的),但是只要使用Python添上一些細節(jié),我就可以從右鍵另存為選擇文件夾更改文件名確認保存的輪回當中解放出來了,嗯。

附有注釋的Python代碼和構(gòu)建好的程序我已經(jīng)放在了文章開頭。如果真的拿這份代碼在這里開講Python編程基礎(chǔ),那可真成了硬核教程了……利用Python,這個步驟被簡化為“選擇文件→拖拽到程序上→完成”,媽媽再也不用擔(dān)心我的手指了。
——————由于硬盤不好使,下面的動圖有輕微閃光內(nèi)容———————
