如何快速使用paddleOCR進(jìn)行文字識別？

2023-08-06 16:39 作者:喜歡玩AI的東哥 0人讀過 | 我要投稿

1.環(huán)境：

??cuda11.6，cudnn8.4，tensorrt8.4.1.5，openCV4.6.0，git 2.34, cmake3.24.2，vs2019

?

2.使用paddleOCR

???--1.下載最新版paddleOCR

?????網(wǎng)站:https://github.com/PaddlePaddle/PaddleOCR

??????進(jìn)入到指定目錄

??????????cd D:\AI\paddleOCR

??????????git clone https://github.com/PaddlePaddle/PaddleOCR.git

???????或者手動在github上下載解壓。

?

???--2.下載最新 paddleInference推理庫

???????根據(jù)系統(tǒng)要求下載對應(yīng)系統(tǒng)的ocr推理庫, 這里我們選擇windows預(yù)測庫中C++預(yù)測庫：avx_mkl_cuda11.6_cudnn8.4_avx_mkl-trt8.4.1.5

??

?--3.下載模型

在paddleOCR的github主頁readme中找到PP-OCR Series Model List，下載最新模型ch_PP-OCRv3_xx，該模型適合Mobile 和Server，分別下載Detection mode，Direction classifier和Recognition model，并解壓到model文件中。

?

???--4.編譯和生成paddleOCR項目

???(1)?啟動Cmake：雙擊啟動cmake-gui或者cmd中運行cmake-gui，打開cmake。

???(2)選擇source和build路徑:

(3)?點擊 configure，選擇編譯器，首次編譯會檢查環(huán)境，系統(tǒng)會自動顯示無法識別的環(huán)境，將以下紅框內(nèi)的變量按照自己的實際路徑進(jìn)行填寫，重新點擊configure，完成編譯無報錯即為成功。

(4)?點擊Generate生成對應(yīng)的項目文件。

(5)?點擊open project，使用vs1029打開已生成的項目。

編譯過程可參考官方編譯教程。

?

--5.項目運行

將debug改為release，將ppocr改為啟動項，生成解決方案。

?

在生

成的程序目錄下添加對應(yīng)的dll文件。

?

運行cmd，輸入CHCP 65001，將終端切換為支持中文的utf-8，

然后運行

ppocr.exe --det_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_det_infer ??--rec_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_rec_infer??--cls_model_dir=D:\AI\paddleOCR\model\ch_ppocr_mobile_v2.0_cls_infer??--rec_char_dict_path=D:\AI\paddleOCR\PaddleOCR-release-2.6\PaddleOCR-release-2.6\ppocr\utils\ppocr_keys_v1.txt?????--use_angle_cls=true ??--det=true ??--rec=true ?--cls=true ?--use_gpu=true ?--use_tensorrt=true ?--image_dir=D:\AI\paddleOCR\model\pic\p1

?

運行的到最終結(jié)果:

?