OCR識別圖中文字工具-iText Mac版

itext mac中文版是一款從圖片中識別文字的OCR(光學(xué)字符識別)工具。通過截圖、拖拽圖片,即可以從掃描版的PDF等任意圖片中識字,并且可以很好的解決摘抄和批注需求。而且itext mac版使用騰訊、Google 雙引擎,識別效果驚人地準(zhǔn)確。


iText for mac特別版官方介紹
iText Pro Mac版擁有大量的和吸引人的功能,完美融合macOS。iText Pro是一個(gè)小巧的、直觀的、精煉的文本編輯器,簡單的字處理軟件,它完全用Cocoa重寫。您可以使用iText從PDF中提取文本,在紙張上的文檔,在書中的頁面和任何其他圖像。


iText for mac版軟件特點(diǎn)
iText 是一款從圖片中識別文字的 OCR 工具。
典型使用場景:
從掃描版 PDF 中提取文字
從朋友發(fā)來的圖片中識別文字
從任意圖片中識字


iText for mac特別版功能介紹
輕松選擇圖像
iText支持多種方式選擇圖像,操作非常方便。
捕獲屏幕
iText內(nèi)置屏幕捕獲工具。只需按下快捷鍵??1,捕獲屏幕上的任何區(qū)域,即可提取其中的文本。提示:已識別的文本已復(fù)制到系統(tǒng)剪貼板。你可以直接粘貼。
將圖像拖動(dòng)到菜單欄圖標(biāo)
例如,當(dāng)您在Twitter中看到圖像并想要提取內(nèi)部的文本或數(shù)字時(shí),只需將圖像拖動(dòng)到iText的菜單欄圖標(biāo),您就可以得到您想要的內(nèi)容。
選擇圖像文件
當(dāng)然,您也可以選擇要識別的圖片文件。但是,在這種情況下,優(yōu)選上述拖動(dòng)。
持續(xù)認(rèn)可
例如,在PDF中截取不同位置的屏幕截圖,iText將依次識別文本并自動(dòng)連接結(jié)果。
由Google提供支持
首先,我排除了脫機(jī)識別庫,因?yàn)殡x線庫已經(jīng)死了,無法自我改進(jìn)。接下來,在許多在線OCR服務(wù)中,我比較了微軟,谷歌等產(chǎn)品。最后,我選擇了Google的服務(wù),因?yàn)樗浅?qiáng)大,可以識別50多種語言。
- 對于普通的自然語言,例如書頁,新聞稿,識別結(jié)果非常準(zhǔn)確,甚至高達(dá)100%。
- 對于復(fù)雜排版,特別是對于特殊字符(例如,程序源代碼),識別結(jié)果不是那么好,您可能需要在識別后手動(dòng)修改結(jié)果。
- 例如,對于一條垂直線,機(jī)器無法區(qū)分小寫字母l或大寫字母I(順便說一句,你能識別它們嗎?); 相反,機(jī)器需要理解上下文以優(yōu)化結(jié)果。但是現(xiàn)在機(jī)器很難理解程序源代碼之類的非自然語言。
優(yōu)化識別結(jié)果
OCR服務(wù)可以準(zhǔn)確地識別圖像中的文本,但不能用于進(jìn)一步識別,例如段落識別等。
因此,iText包含自己的算法來優(yōu)化結(jié)果,例如,
- 自動(dòng)識別段落。
- 刪除英文單詞和標(biāo)點(diǎn)符號之間的額外空格。
- 將英文的第一個(gè)字母大寫。
預(yù)覽原始圖像以進(jìn)行校對
由于目前的OCR技術(shù)不能始終100%識別文本,因此有必要檢查原始圖像以修改結(jié)果。在iText中,您可以:
- 拖動(dòng)圖像附近的結(jié)果窗口。
- 在結(jié)果窗口的左側(cè)顯示圖像。
自動(dòng)翻譯
識別圖像中的文本后,iText可以自動(dòng)將它們翻譯成100多種語言,由Google提供支持。