51ctoPHP網(wǎng)站漏洞挖掘從入門到精通
運(yùn)行結(jié)果:
Tesseract Open Source OCR Engine v3.05.01 with Leptonica
Python3WebSpider
我們調(diào)用了 tesseract 命令,第一個(gè)參數(shù)為圖片名稱,第二個(gè)參數(shù) result 為結(jié)果保存的目標(biāo)文件名稱,-l 指定使用的語(yǔ)言包,在此使用 eng 英文,然后再用 cat 命令將結(jié)果輸出。
第二行的運(yùn)行結(jié)果便是圖片的識(shí)別結(jié)果,Python3WebSpider。
我們可以看到這時(shí)已經(jīng)成功將圖片文字轉(zhuǎn)為電子文本了。
然后我們還可以利用 Python 代碼來(lái)測(cè)試,這里就需要借助于 Tesserocr 庫(kù)了,測(cè)試代碼如下:
import tesserocr
from PIL import Image
image = Image.open('image.png')
print(tesserocr.image_to_text(image))
標(biāo)簽: