OCR處理代碼
import pytesseract
import CV2
# 讀取圖片img = CV2.imread('photo.jpg')
# 預(yù)處理圖片gray = CV2.cvtColor(img, CV2.COLOR_BGR2GRAY) ?# 轉(zhuǎn)為灰度圖像blur = CV2.GaussianBlur(gray, (5,5), 0) ?# 高斯模糊平滑圖像thresh = CV2.adaptiveThreshold(blur, 255, CV2.ADAPTIVE_THRESH_GAUSSIAN_C, CV2.THRESH_BINARY_INV, 11, 2) ?# 自適應(yīng)閾值二值化圖像
# OCR 處理去除噪點kernel = np.ones((3,3), np.uint8) ?erosion = CV2.erode(thresh, kernel, iterations=1) ?# 腐蝕操作去除噪點 ?dilation = CV2.dilate(erosion, kernel, iterations=1) ?# 膨脹操作保留字符特征
# 進行 OCR 識別text = pytesseract.image_to_string(dilation,)
# 輸出結(jié)果print(text)```
此例中使用了 OpenCV 圖像處理庫進行圖片預(yù)處理操作,包括灰度化、高斯模糊平滑、自適應(yīng)閾值二值化等處理。然后使用 Tesseract OCR 庫進行 OCR 處理,其中 `lang` 參數(shù)指定 OCR 識別時使用的語言,這里指定為中文。最后輸出結(jié)果即可。使用 OCR 技術(shù)時可能需要進行多次實驗調(diào)整,以獲得最佳的處理結(jié)果。