epub文件的漫畫(huà)資源,提取圖片時(shí)的順序整理方法
記錄一下之前遇到的問(wèn)題,其實(shí)這個(gè)和epub文字小說(shuō)排序也是差不多原理。
希望能幫到遇到同樣問(wèn)題的人,這邊也會(huì)簡(jiǎn)單講下原理。
前幾天下載漫畫(huà)資源想放到電腦上看,但是發(fā)現(xiàn)資源格式是epub格式的。
雖然電腦上可以用wps打開(kāi),手機(jī)上也可以用那種有帶小說(shuō)閱讀器的插件打開(kāi)。
但是觀感還是特別蛋疼,因?yàn)椴荒茈S意放大縮小。
所以我想過(guò)將圖片都提取出來(lái)。
其實(shí)epub格式就是一個(gè)整合包,里面包含了所有的網(wǎng)頁(yè)資源。如圖:

如果是漫畫(huà)資源的話,所有的圖片都在image文件夾內(nèi)。
但是直接打開(kāi)的話就會(huì)發(fā)現(xiàn)里面所有的圖片順序都是亂的,并不能正常的閱讀。

而html文價(jià)夾中的html文件打開(kāi)所見(jiàn)的才是正序。

打開(kāi)每個(gè)html文件可獲得到那張對(duì)應(yīng)次序的圖片的url,也就能鎖定圖片的文件名

那么其實(shí)只需要獲取每一個(gè)html文件中的圖片名,再將其對(duì)應(yīng)的圖片文件改為對(duì)應(yīng)的html的文件名就可以做到整理其順序。
這里我找到了以前一位遇到同樣問(wèn)題的大佬給寫(xiě)的腳本(撿到現(xiàn)成的了嘿嘿,不用自己動(dòng)手了
鏈接:https://github.com/powersee/epub-image-rename/blob/master/rename.py

原理其實(shí)很容易理解,用python運(yùn)行這段代碼。
需要注意的是string_in_html那里需要填寫(xiě)的是圖片名字的共有部分并且是在“-”之前的部分。比如我這里需要填寫(xiě)的就只是vol

之前就差點(diǎn)誤解了這段注釋里寫(xiě)的意思==
最后結(jié)果:

就可以愉快的又舒心的直接看漫畫(huà)了~~