如何快速使用paddleOCR進(jìn)行文字識別?
如何快速使用paddleOCR進(jìn)行文字識別?
1.環(huán)境:
??cuda11.6,cudnn8.4,tensorrt8.4.1.5,openCV4.6.0,git 2.34, cmake3.24.2,vs2019
?
2.使用paddleOCR
???--1.下載最新版paddleOCR
?????網(wǎng)站:https://github.com/PaddlePaddle/PaddleOCR
??????進(jìn)入到指定目錄
??????????cd D:\AI\paddleOCR
??????????git clone https://github.com/PaddlePaddle/PaddleOCR.git
???????或者手動在github上下載解壓。
?
???--2.下載最新 paddleInference推理庫
???????根據(jù)系統(tǒng)要求下載對應(yīng)系統(tǒng)的ocr推理庫, 這里我們選擇windows預(yù)測庫中C++預(yù)測庫:avx_mkl_cuda11.6_cudnn8.4_avx_mkl-trt8.4.1.5
??
?--3.下載模型
在paddleOCR的github主頁readme中找到PP-OCR Series Model List,下載最新模型ch_PP-OCRv3_xx,該模型適合Mobile 和Server,分別下載Detection mode,Direction classifier和Recognition model,并解壓到model文件中。
?
???--4.編譯和生成paddleOCR項目
???(1)?啟動Cmake:雙擊啟動cmake-gui或者cmd中運行cmake-gui,打開cmake。
???(2)選擇source和build路徑:
(3)?點擊 configure,選擇編譯器,首次編譯會檢查環(huán)境,系統(tǒng)會自動顯示無法識別的環(huán)境,將以下紅框內(nèi)的變量按照自己的實際路徑進(jìn)行填寫,重新點擊configure,完成編譯無報錯即為成功。
(4)?點擊Generate生成對應(yīng)的項目文件。
(5)?點擊open project,使用vs1029打開已生成的項目。
編譯過程可參考官方編譯教程。
?

--5.項目運行
將debug改為release,將ppocr改為啟動項,生成解決方案。
?

在生

成的程序目錄下添加對應(yīng)的dll文件。
?
運行cmd,輸入CHCP 65001,將終端切換為支持中文的utf-8,
然后運行
ppocr.exe --det_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_det_infer ??--rec_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_rec_infer??--cls_model_dir=D:\AI\paddleOCR\model\ch_ppocr_mobile_v2.0_cls_infer??--rec_char_dict_path=D:\AI\paddleOCR\PaddleOCR-release-2.6\PaddleOCR-release-2.6\ppocr\utils\ppocr_keys_v1.txt?????--use_angle_cls=true ??--det=true ??--rec=true ?--cls=true ?--use_gpu=true ?--use_tensorrt=true ?--image_dir=D:\AI\paddleOCR\model\pic\p1
?
運行的到最終結(jié)果:
?


?