五筆字型輸入法(維基共享資源及維基教科書(shū)?)



五筆字型輸入法(簡(jiǎn)稱五筆)是王永民在1983年8月發(fā)明的一種漢字輸入法。因?yàn)榘l(fā)明人姓王,所以也稱為“王碼五筆”。五筆字型完全依據(jù)筆畫(huà)和字形特征對(duì)漢字進(jìn)行編碼,是典型的形碼輸入法。五筆是目前中國(guó)以及一些東南亞國(guó)家如新加坡、馬來(lái)西亞等國(guó)的最常用的漢字輸入法之一。五筆相比于拼音輸入法具有低重碼率的特點(diǎn),熟練后可快速輸入漢字。五筆字型自1983年誕生以來(lái),先后推出三個(gè)版本:86五筆、98五筆和新世紀(jì)五筆。本教程以98規(guī)范王碼(98五筆)為基礎(chǔ),同時(shí)介紹86和新世紀(jì)。
?
五筆字根是五筆輸入法的基本單元,86版使用234個(gè)字根,98版使用259個(gè)字根,新世紀(jì)版使用了226個(gè)字根。
?
基本字根在組成漢字時(shí),按照它們之間的位置關(guān)系可以分成四類結(jié)構(gòu)。
?
單:基本字根本身就單獨(dú)成為一個(gè)漢字。這種情況包括鍵名字和成字字根。如:口、木、竹等。
散:指構(gòu)成漢字的基本字根之間可以保持一定的距離。如:漢、湘、結(jié)、別、安、意等。
連:指一個(gè)基本字根連一單筆畫(huà)。如:“丿”連“目”成為“自”。
交:指幾個(gè)基本字根交叉套迭之后構(gòu)成的漢字。如“申”是由“日”交“丨”,“夷”由“一”交“弓”交“人”交叉構(gòu)成。
在五筆中,漢字分為左右型、上下型和雜合型漢字。
?
五筆將漢字筆劃分為五個(gè)區(qū):即:橫(同提)、豎、撇、捺(同點(diǎn))、折五區(qū)。把字根或碼元按一定規(guī)律分布在25個(gè)字母鍵上(即標(biāo)準(zhǔn)的QWERTY鍵盤(pán),不包括Z)。取碼時(shí)最長(zhǎng)四碼,最短一碼。
?
鍵名字
鍵名是指各鍵位左上角的黑體字根,它們是組字頻度較高,而形體上又有一定代表性的字根,它們中絕大多數(shù)本身就是漢字,只要把它們所在鍵連擊四次就可以了。如:王:11 11 11 11(GGGG)
?
成字字根
在每個(gè)鍵位上,除了一個(gè)鍵名字根外,還有數(shù)量不等的幾種其它字根,它們中間的一部分其本身也是一個(gè)漢字,我們稱之為成字字根。 輸入方法:鍵名代碼+首筆代碼+次筆代碼+末筆代碼(如果該字根只有兩筆畫(huà),則補(bǔ)空格鍵結(jié)束)
?
86版五筆字根
?
1區(qū)橫起筆 11G 王旁青頭戔(兼)五一 12F 土士二干十寸雨 13D 大犬三(羊)古石廠 14S 木丁西 15A 工戈草頭右框七
2區(qū)豎起筆 21H 目具上止卜虎皮 22J 日早兩豎與蟲(chóng)依 23K 口與川,字根稀 24L 田甲方框四車力 25M 山由貝,下框幾
3區(qū)撇起筆 31T 禾竹一撇雙人立,反文條頭共三一 32R 白手看頭三二斤 33E 月彡(衫)乃用家衣底 34W 人和八,三四里 35Q 金勺缺點(diǎn)無(wú)尾魚(yú),犬旁留兒一點(diǎn)夕,氏無(wú)七(妻)
4區(qū)點(diǎn)起筆 41Y 言文方廣在四一,高頭一捺誰(shuí)人去 42U 立辛兩點(diǎn)六門(mén)疒(?。?43I 水旁興頭小倒立 44O 火業(yè)頭,四點(diǎn)米 45P 之字軍蓋道建底,摘礻(示)衤(衣)
5區(qū)折起筆 51N 已半巳滿不出己,左框折尸心和羽 52B 子耳了也框向上 53V 女刀九臼山朝西 54C 又巴馬,丟矢矣 55X 慈母無(wú)心弓和匕,幼無(wú)力
98版五筆字根
?
1區(qū)橫起筆 11 G 王旁青頭五夫一 12 F 土干十寸未甘雨 13 D 大犬戊其古石廠 14 S 木丁西甫一四里 15 A 工戈草頭右框七
2區(qū)豎起筆 21 H 目上卜止虎頭具 22 J 日早兩豎與蟲(chóng)依 23 K 口中兩川三個(gè)豎 24 L 田甲方框四車?yán)铩?5 M 山由貝骨下框里
3區(qū)撇起筆 31 T 禾竹反文雙人立 32 R 白斤氣丘叉手提 33 E 月用力豸毛衣臼 34 W 人八登頭單人幾 35 Q 金夕鳥(niǎo)兒犭邊魚(yú)
4區(qū)點(diǎn)起筆 41 Y 言文方點(diǎn)誰(shuí)人去 42 U 立辛六羊病門(mén)里 43 I 水族三點(diǎn)鱉頭小 44 O 火業(yè)廣鹿四點(diǎn)米 45 P 之字寶蓋補(bǔ)礻衤
5區(qū)折起筆 51 N 已類左框心尸羽 52 B 子耳了也乃框皮 53 V 女刀九艮山西倒 54 C 又巴牛厶馬失蹄 55 X 幺母貫頭弓和匕
?
新世紀(jì)版五筆字根
1區(qū)橫起筆 11 G 王旁青頭五一提 12 F 土士二干十寸雨 13 D 大三肆頭古石廠 14 S 木丁西邊要無(wú)女 15 A 工戈草頭右框七
2區(qū)豎起筆 21 H 目止具頭卜虎皮 22 J 日曰兩豎與蟲(chóng)依 23 K 口中兩川三個(gè)豎 24 L 田框四車甲單底 25 M 山由貝骨下框里
3區(qū)撇起筆 31 T 禾竹牛旁臥人立 32 R 白斤氣頭叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭風(fēng)頭幾 35 Q 金夕犭兒包頭魚(yú)
4區(qū)點(diǎn)起筆 41 Y 言文方點(diǎn)在四一 42 U 立帶兩點(diǎn)病門(mén)里 43 I 水邊一族三點(diǎn)小 44 O 火變?nèi)龖B(tài)廣二米 45 P 之字寶蓋補(bǔ)示衣
5區(qū)折起筆 51 N 已類左框心尸羽 52 B 子耳了也乃齒底 53 V 女刀九巡錄無(wú)水 54 C 又巴甬矣馬失蹄 55 X 幺母絞絲弓三匕
單字輸入
除鍵名字和成字字根漢字之外的漢字,如果一個(gè)字可以取夠四個(gè)字根,就全部用字根鍵入,只有在不足四個(gè)字根的情況下,才有必要追加識(shí)別碼。
末筆字型識(shí)別碼
當(dāng)一個(gè)字拆不夠4個(gè)碼元時(shí),它的輸入編碼是:先打完碼元,再追加一個(gè)“末筆字型識(shí)別碼”,簡(jiǎn)稱“識(shí)別碼”。末筆字型識(shí)別碼由漢字的末筆畫(huà)代碼和字型代碼組成。
?
末筆畫(huà)代碼看這個(gè)字的末筆畫(huà)的結(jié)構(gòu)來(lái)決定的:
?
橫 1
豎 2
撇 3
捺 4
折 5
字型代碼是看此字的結(jié)構(gòu)來(lái)的決定的:
?
左右結(jié)構(gòu)型 1
上下結(jié)構(gòu)型 2
其他結(jié)構(gòu)型 3
最后組合起來(lái)就是識(shí)別碼。例如"好"字,他最后筆畫(huà)為“一”,所以末筆畫(huà)代碼就是“1”,好是左右型結(jié)構(gòu)的漢字,所以“好”字的字型代碼也是“1”,所以“好”識(shí)別碼就是“11”,在“G”鍵上。
?
拆分原則
能散不連
兼顧直觀
能連不交
取大優(yōu)先
詞組的錄入
雙字詞
取第一字的前兩位編碼和第二字的前兩位編碼,如“北”(UXN)+“京”(YIU)=“北京”(UXYI)
?
三字詞
取第一字的第一位編碼,第二位的第一位編碼,第三字的前兩位編碼,如“毛”(TFNV)+“澤”(ICFH)+“東”(AII)=“毛澤東”(TIAI)
?
四字詞
取每一個(gè)字的第一位編碼,如“六”(UYGY)+“十”(FGH)+“四”(LHNG)+“卦”(FFHY)=“六十四卦”(UFLF)
?
多字詞
取一、二、三、末字的第一位編碼,如“中”(KHK)+“國(guó)”(LGYI)+“共”(AWU)+“產(chǎn)”(UTE)+“黨”(IPKQ)=“中國(guó)共產(chǎn)黨”(KLAI)
?
簡(jiǎn)碼字
指一些較常用字可以用一、二或三字母編碼打出,分別稱為一、二、三級(jí)簡(jiǎn)碼
?
一級(jí)簡(jiǎn)碼包含漢語(yǔ)(尤其是官方語(yǔ)體)最常用字中的25個(gè),為了盡可能全面地安排最常用的漢字,部分一級(jí)簡(jiǎn)碼并非是該字全碼的首位。
?
但所有的二級(jí)或三級(jí)簡(jiǎn)碼均為該字全碼的前二或三位
?
一級(jí)簡(jiǎn)碼如下,86版、98版和新世紀(jì)版通用
?
編碼?????? A???? B???? C???? D???? E???? F???? G???? H???? I????? J????? K???? L?????? M??? N??? O??? P???? Q??? R???? S???? T???? U???? V???? W??? X???? Y
文字?????? 工?? 了?? 以?? 在?? 有?? 地?? 一?? 上?? 不?? 是?? 中?? 國(guó)?????? 同?? 民?? 為?? 這?? 我?? 的?? 要?? 和?? 產(chǎn)?? 發(fā)?? 人?? 經(jīng)?? 主
速記口訣:一地在要工 上是中國(guó)同 和的有人我 主產(chǎn)不為這 民了發(fā)以經(jīng)gong
?
“Z”鍵
由于五筆字型中,采用五種筆劃,每個(gè)字根或碼元只取前兩劃定位它們?cè)阪I盤(pán)上的位置,所以五筆字型漢字編碼只用到了5×5=25個(gè)字母鍵。每個(gè)字的編碼中都沒(méi)有“Z”。后來(lái)大部分五筆輸入軟件都附與Z鍵查詢功能,又叫作“萬(wàn)能鍵”或“萬(wàn)能學(xué)習(xí)鍵”。初學(xué)者可以在對(duì)某個(gè)字不確定其拆分時(shí),使用“Z”鍵代替不確定的字根或碼元。也有一些五筆輸入法使用“Z”鍵來(lái)實(shí)現(xiàn)拼音反查五筆或符號(hào)輸入功能。早期DOS系統(tǒng)中Z鍵可以用在任何位置,然現(xiàn)今大多數(shù)五筆輸入法中Z鍵均無(wú)法在首位作為不確定的字根代替碼。一些輸入法中若在首位輸入Z則跳出特殊符號(hào)選擇列表。
?
“L”鍵
與“Z”鍵的用途為大多數(shù)熟知不同,“L”鍵在五筆編碼中也有許多人不太了解的特殊用途:
?
單筆畫(huà)字
編碼方案對(duì)單筆畫(huà)字的編碼規(guī)定為“兩個(gè)單筆畫(huà)字母加兩個(gè)L”,如一(GGLL)、丨(HHLL)、丿(TTLL)、丶(YYLL)、乙(NNLL)。由于豎、撇、捺構(gòu)成的字不為大多數(shù)人認(rèn)識(shí),而“一”字有一級(jí)簡(jiǎn)碼(G),乙字又不常用(偶爾用到時(shí),一般不記得正確編碼的輸入者常會(huì)用別的輸入法代替輸入),所以這一編碼方案細(xì)節(jié)常被人忽略。
解決某些重碼問(wèn)題
詞組“勞動(dòng)”與“蔻”字,如果按編碼方案,其編碼均為(APFC),因早期的五筆輸入法不支持詞組與單字重碼,按照一般的規(guī)定,重碼時(shí)應(yīng)是以單字優(yōu)先,可是相比之下,“勞動(dòng)”是常用詞,而“蔻”字幾乎不會(huì)單獨(dú)出現(xiàn),通常總是以詞組“豆蔻”的形式出現(xiàn),所以,為了方便輸入以及減少重碼,在最終方案中蔻字的編碼被強(qiáng)制設(shè)為(APFL),但近年來(lái)因五筆輸入法支持詞組與單字重碼,部分輸入方案已將“蔻”字編碼改為APFC。
類似地,早期版本的五筆將“靨”字的編碼強(qiáng)制設(shè)為(DDDL),以避免和鍵名字“大”(DDDD)重復(fù).
?
筆畫(huà)“?”(提),一般寫(xiě)法當(dāng)作“丶”(點(diǎn)),有時(shí)手寫(xiě)體豎鉤(亅)以“一”(橫)或“乙”(折)代替。
象”字,簡(jiǎn)體字寫(xiě)法中間為口(K),而實(shí)際用橫日(J)