【統(tǒng)計數(shù)據(jù)】八種形碼方案在不同量級詞庫下的重碼測試
如果有輸入法愛好者路過,這些數(shù)據(jù)或許幫得上你……
為方便理解,還是先介紹材料和方法為好。
一、工具和材料
(1)多多碼表編輯器 V3.2
擁有「轉換碼表格式」「由單字碼表和純詞庫生成詞庫碼表」等功能。

(2)單字碼表
收集了八種有代表性形碼方案的單字碼表,用于生成詞庫。其中單字編碼無重復,且根據(jù)組詞規(guī)則每字至少2碼。八種形碼方案分別為:
①五筆字型86版
②鄭碼
③09五筆第一代(編碼取自《形碼測評系統(tǒng)》)
④09五筆第二代(原版)
⑤藍寶石(2020.8.2版)
⑥虎碼(2022.5.24版)
⑦匠碼 - 新紀元A版 V1.03(2020.5.20版)
⑧希碼(22.4版)

(3)詞庫
選取了不同量級的詞庫,分別是:
①qq五筆默認詞庫(近7萬詞組)
②092五筆M詞庫(約10萬詞組)
③虎碼官方詞庫(近16萬詞組)
④九重魔鶴詞庫(近24萬詞組)
二、操作流程
(1)借助多多碼表編輯器,生成8×4個碼表。
(2)借助Excel,統(tǒng)計每個編碼出現(xiàn)的次數(shù)。


三、統(tǒng)計結果
閱讀提示:每種形碼方案都不只是一套字根和規(guī)則,還有為之精選的詞庫。
(1)按詞庫分組








(2)按方案分組
















(3)生成無重詞條的能力

標簽: