最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【圖像識(shí)別】基于支持向量機(jī)SVM實(shí)現(xiàn)漢字識(shí)別matlab源碼

2021-08-08 09:54 作者:Matlab工程師  | 我要投稿

前言

漢字歷史悠久,流傳四海,是我們書面交流的絕對(duì)主體。自蔡
倫改進(jìn)紙張以來,兩千年的時(shí)間里,漢字最重要的載體是纖維紙。
毫無疑問,較之前的龜甲竹簡(jiǎn)而言,紙張更便宜,更輕便,更適合
傳播。纖維紙結(jié)合印刷術(shù),構(gòu)成了知識(shí)文化傳播的主要方式。
然而步入新世紀(jì)后,我們有了電腦,有了電子書,有了電子
筆,最重要的,我們有了發(fā)達(dá)的互聯(lián)網(wǎng)。技術(shù)革命正在快速蠶食紙
張?jiān)械膬?yōu)勢(shì)地位,纖維紙竟有了淘汰的可能。
但是,至少到目前為止,傳統(tǒng)方式下的書籍仍然承載著巨大的
信息流量,紙張對(duì)于我們依舊不可或缺,這便需要有能夠把信息在
兩者間流轉(zhuǎn)的方法。
我們組本次設(shè)計(jì)的內(nèi)容便是在探討一種傳統(tǒng)書籍內(nèi)容轉(zhuǎn)移到電
子文檔的方法——漢字識(shí)別

1 實(shí)驗(yàn)?zāi)繕?biāo)和實(shí)驗(yàn)方法

1.實(shí)驗(yàn)?zāi)繕?biāo):通過設(shè)計(jì),能夠有效地識(shí)別出圖片中的漢字。
2.實(shí)驗(yàn)平臺(tái):MATLAB

2 實(shí)驗(yàn)原理(具體原理略)

2.1 圖像二值化

2.2 開操作

2.3 圖像分割

2.4 貝葉斯公式法分類器

3 實(shí)驗(yàn)方案(總體流程圖、具體步驟等)

1.1 算法一流程圖

1.1.1 創(chuàng)建字庫

在這里插入圖片描述

1.1.2 識(shí)別漢字

在這里插入圖片描述

1.1.3 提取字庫特征向量

在這里插入圖片描述

1.2 算法一步驟

①選擇一段寫在紙張上的文字,拍照截圖
②把帶有漢字的圖像處理成標(biāo)準(zhǔn)格式。最好的結(jié)果是只留有漢字部分而切除其余空白,并清 理斑點(diǎn)修補(bǔ)線條。
③為了每次單獨(dú)識(shí)別一個(gè)漢字,將每個(gè)漢字都分離切割出來,成為一個(gè)待處理的方塊圖像組
④對(duì)比漢字庫與一個(gè)個(gè)分離出的漢字方塊圖像,找到最相似的結(jié)果(漢字庫同樣是分離出的 漢字方塊圖像。在實(shí)驗(yàn)前預(yù)先輸入標(biāo)準(zhǔn)漢字圖像,并輸入每一個(gè)漢字圖像代表漢字,的程序 會(huì)自動(dòng)分割出一個(gè)個(gè)漢字方塊圖像,并按順序存放于庫文件夾中。 )
⑤輸出對(duì)比出的最相似結(jié)果,并附上原圖像

1.3 算法二流程圖

1.3.1 提取字庫特征向量

在這里插入圖片描述

1.3.2 識(shí)別漢字

在這里插入圖片描述

1.4 算法二步驟

(1) 將一個(gè)手寫的字(假設(shè)這個(gè)字為“數(shù)”)的大方塊切割為 10*10 個(gè)小方塊。每一個(gè) 小方塊都包含了一個(gè)字的一部分信息。
開始
輸入帶漢字的 圖像
預(yù)處理階段 (修補(bǔ)線段、 去除噪點(diǎn))
切割字塊
特征提取
貝葉斯分類器 進(jìn)行比較
輸出結(jié)果
結(jié)束
12 / 34

(2) 每一部分的小方塊里的黑像素與白像素的數(shù)量之比為小方塊所蘊(yùn)含的信息; (3) 設(shè)立一個(gè)閾值 K。如果一個(gè)小方塊內(nèi),黑像素的數(shù)量大于 K,則令小方塊狀態(tài)為 1, 表示有筆畫經(jīng)過;否則為 0,表示沒有筆畫經(jīng)過; (4) 現(xiàn)在,我們得到了一個(gè)字的 100 個(gè)小方塊的狀態(tài)值,將狀態(tài)值存入一個(gè)數(shù)組 shu[i],0<=i<=100; (5) 設(shè)立數(shù)據(jù)庫。將足夠多的訓(xùn)練用字(全是“數(shù)”)的圖片進(jìn)行(1)~(4)的處理步 驟,于是,我們改造之前的數(shù)組,得到一個(gè)新二維數(shù)組 shu[j][i]作為數(shù)據(jù)庫,j 為訓(xùn)練 圖片序號(hào); (6) 利用數(shù)據(jù)庫,我們可以統(tǒng)計(jì)出“數(shù)”字的筆畫經(jīng)過某一個(gè)小方塊的概率,并記錄下 來; (7) 我們又通過重復(fù)(1)~(6)的步驟,將其他的漢字(非“數(shù)”)也求出概率來; (8) 到此,我們建立了一個(gè)的數(shù)據(jù)庫,這個(gè)數(shù)據(jù)庫里包含了不同漢字的筆畫經(jīng)過不同位 置的概率,將其作為特征向量,如果想給漢字增加特征向量,重復(fù)以上步驟即可。 (9) 輸入漢字 X 試圖識(shí)別。重復(fù)(1)~(4),得到一個(gè)數(shù)組。這個(gè)數(shù)組內(nèi)包含有 X 的 筆畫信息供以比對(duì),作為特征向量; (10) 接下來,進(jìn)行筆畫信息比對(duì)。利用貝葉斯分析,計(jì)算出在這種筆畫信息下是某一種 字的可能性; (11) 利用貝葉斯分類器將數(shù)據(jù)庫中特征向量比對(duì)一遍,找出最有可能的字即為結(jié)果。

clc,clear,close for i=1:5 ? ?imp=imread(['.\字庫',num2str(i),'.jpg']); ? ?create_database(imp,i); end load templet pattern; aa=imread('example_1.png'); [word cnum]=get_picture(aa); %cc=imresize(aa,[120 90]); for i=1:cnum ? ?class=bayesBinaryTest(word{i}); ? ?Code(i)=pattern(class).name; end figure(3); imshow(aa); tt=title(['識(shí)別文字: ', Code(1:cnum)],'Color','b');



【圖像識(shí)別】基于支持向量機(jī)SVM實(shí)現(xiàn)漢字識(shí)別matlab源碼的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
彩票| 湘阴县| 三明市| 铁力市| 灵山县| 叶城县| 洛川县| 仁怀市| 潼关县| 华蓥市| 于都县| 安阳县| 桓台县| 微山县| 商河县| 顺昌县| 泗洪县| 东宁县| 武宁县| 海门市| 阳曲县| 万盛区| 沭阳县| 政和县| 临颍县| 项城市| 繁昌县| 运城市| 中山市| 砀山县| 闸北区| 五家渠市| 齐河县| 西乌珠穆沁旗| 威海市| 辛集市| 黎川县| 泽州县| 扬中市| 加查县| 巴楚县|