最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

PaddleOCR實現(xiàn)批量文件識別和輸出(存入Excel)

2023-10-07 16:32 作者:AcePlay  | 我要投稿

前言

? ? ? ?為找到一款自用的開源OCR,體驗百度的PaddleOCR基礎(chǔ)功能后,可以滿足圖片文字識別的需求;本篇總結(jié)一些在Windows 10(64位)環(huán)境下的使用經(jīng)驗,實現(xiàn)批量文件識別和輸出(存入Excel)。


PaddeOCR安裝

? ? ? ?登陸官網(wǎng)(https://www.paddlepaddle.org.cn),進入相應(yīng)頁面查看安裝教程,按操作說明安裝部署PaddleOCR(需要python環(huán)境),本篇不作介紹。

官網(wǎng)頁面


修改說明

? ? ? ?PaddleOCR安裝部署完成后,可以使用教程中的腳本運行,對一個指定的圖片進行文字識別,并生成一個新圖片,該圖片包含識別結(jié)果和說明。


教程腳本運行后生成的圖片


? ? ? ?所以按教程的腳本使用,無法直接使用提取出的文字(因為包含在圖片中);其次每次運行只操作一個文件,不夠效率?;谝陨蟽蓚€原因,需要我們自己修改來實現(xiàn)以下效果:

? ? (1)啟動OCR

? ? ? ?每次要運行教程腳本,需要先打開命令行,進入anaconda3的PaddleOCR環(huán)境(教程推薦使用anaconda3),再用python運行.py教程腳本;所以將以上過程編輯為.bat文件,雙擊運行就可以簡化以上重復(fù)步驟。

? ? (2)文件批量操作

? ? ??教程腳本代碼只執(zhí)行一次文件操作,所以修改代碼使其對文件批量操作。

? ? (3)將所有結(jié)果輸出至Excel

? ? ? 修改教程腳本代碼,使輸出結(jié)果(文字部分)存入Excel,方便使用。


具體操作

????(1)編輯啟動腳本

????????新建一個txt文件,并寫入以下腳本,再修改后綴名為.bat文件。

????(2)修改OCR源代碼

????????在PaddleOCR安裝目錄下,找到并用記事本打開paddleocr.py,修改其中對應(yīng)的函數(shù),事先備份paddleocr.py。

????(3)編輯運行文件

????????新建一個txt文件,并寫入以下腳本,再修改后綴名為.py文件(例:OCRoutput.py),再放入PaddleOCR安裝目錄下。

? ? (4)使用過程(案例)

? ? ????PaddleOCR安裝目錄下新建的img文件夾,放入2個測試圖片:Example-1.png和Example-2.png,運行第一步中的腳本(OCRBat.bat),等待程序運行完,打開result.xlsx確認結(jié)果。

新建img文件夾并放入2個圖片
Example-1.png
Example-2.png
等腳本運行完
確認結(jié)果


總結(jié)

? ? ? ?本篇僅使用教程中【快速開始】介紹的基礎(chǔ)識別功能,還不涉及深度學習和訓(xùn)練等功能,有進一步需求的小伙伴可以繼續(xù)深入研究和使用。

PaddleOCR實現(xiàn)批量文件識別和輸出(存入Excel)的評論 (共 條)

分享到微博請遵守國家法律
来安县| 都安| 肥西县| 汶上县| 静海县| 清远市| 江山市| 开封市| 慈溪市| 梁河县| 颍上县| 沁水县| 方城县| 龙江县| 四川省| 阿克陶县| 凉城县| 二连浩特市| 桃园市| 贵德县| 临安市| 卢湾区| 南宫市| 舟山市| 桂平市| 罗田县| 沙湾县| 翁源县| 凭祥市| 体育| 横峰县| 东至县| 皮山县| 华蓥市| 阜新市| 新建县| 忻州市| 长海县| 武义县| 樟树市| 黎平县|