金鳴表格識(shí)別中何時(shí)應(yīng)勾選“手寫”選項(xiàng)?
1. 數(shù)據(jù)集差異:手寫文字識(shí)別依賴于手寫文字的數(shù)據(jù)集,包含各種不同人的手寫樣本;印刷文字識(shí)別則依賴于印刷文字的數(shù)據(jù)集,這些數(shù)據(jù)集通常是從印刷物、書籍或文檔中獲取的。
2. 特征提取:手寫文字識(shí)別需要提取手寫字母和數(shù)字的特征,如筆畫的形狀、方向等;而印刷文字識(shí)別則依賴于印刷字體的特征,如筆畫的粗細(xì)、形狀、曲線等。
3. 模型訓(xùn)練:手寫文字由于字體形狀差異較大,通常不會(huì)很工整,識(shí)別算法除了使用光學(xué)識(shí)別原理外,還主要依賴深度學(xué)習(xí)技術(shù),如卷積神經(jīng)網(wǎng)絡(luò)(CNN)等進(jìn)行訓(xùn)練;而印刷文字由于字體工整,識(shí)別算法可以使用傳統(tǒng)的機(jī)器學(xué)習(xí)算法,如支持向量機(jī)(SVM)等。
4. 難度:手寫文字識(shí)別比印刷文字識(shí)別更具挑戰(zhàn)性,因?yàn)槭謱懳淖滞ǔ4嬖诤艽蟮淖儺愋?,不同人的書寫風(fēng)格差異較大,而印刷文字則非常規(guī)范和統(tǒng)一,識(shí)別難度較低。
由此可見,手寫文字識(shí)別和印刷文字識(shí)別在數(shù)據(jù)集、特征提取、模型訓(xùn)練和難度等方面都存在較大的差異,需要使用不同的算法和技術(shù)來(lái)進(jìn)行識(shí)別,所以金鳴識(shí)別系統(tǒng)會(huì)將手寫識(shí)別獨(dú)立出來(lái),讓用戶根據(jù)圖片中的文字是否手寫來(lái)進(jìn)行自由選擇。
在金鳴識(shí)別的表格識(shí)別模塊中,如果您的待識(shí)別圖片主要文字為手寫的,我們建議用戶勾選“手寫”,這樣,程序會(huì)調(diào)用手寫識(shí)別算法,從而獲得更準(zhǔn)確的文字識(shí)別結(jié)果,而如果圖片中沒(méi)有手寫文字或只有極為個(gè)別的文字為手寫的,則不建議勾選“手寫”,因?yàn)槲覀兩厦嬲f(shuō)了,手寫識(shí)別和印刷體文字識(shí)別是完全不同的算法,如果我們將手寫識(shí)別算法強(qiáng)行用于印刷體的文字識(shí)別,反而會(huì)影響其識(shí)別的準(zhǔn)確率和效果。