[oeasy]python0122_日韓字符_日文假名_JIS_Shift_韓國諺文
日文假名和韓國諺文
回憶上次內(nèi)容
上次回顧了非ascii的拉丁字符編碼的進(jìn)化過程
0-127 是 ascii 的領(lǐng)域
世界各地編碼分布
由iso組織制定
無法同時(shí)顯示俄文和法文
從iso-8859-1
到iso-8859-16
拉丁字符擴(kuò)展 ascii 共 16 種
此時(shí)中日韓的文字也需要進(jìn)入計(jì)算機(jī)
象形文字的字符集超級(jí)巨大
日本、韓國也用漢字
數(shù)量2萬起步

真能把 如此巨大的字符集
編碼進(jìn)入計(jì)算機(jī)嗎???
文字
日本漢字我們可以直接看懂

地鐵里的 標(biāo)記

日文中 為什么
這么多漢字呢?
遣唐使
皇子公卿僧侶
都要 專門
來中國 朝圣
學(xué)文化

日文 很多詞
都 能看懂
管 老師 叫做 先生
管 火車 叫做 機(jī)車
管 學(xué)習(xí) 叫做 勉強(qiáng)
管 辣 叫 辛

特別辣
叫 激辛
這些漢字怎么來的呢?
空海和尚
從日本來的 留學(xué)僧
不但學(xué)習(xí) 漢語佛法
也學(xué)習(xí) 漢字書法

并把這些文化帶回日本
可以 記錄下來了
漢字 成為 書寫符號(hào)
口頭系統(tǒng)的 日語
正如同
將腓尼基的口語記錄下來
使用圣書體的一些字型
萬葉集
“葉” 是 “世”
即時(shí)代
希望能流傳到萬世
各種各樣的歌
敬畏自然山神、河神 的歌
男女戀愛 的歌
挽歌

漢字
才能 都寫下來
數(shù)量很多
記起來、寫起來也比較復(fù)雜
只有 最有文化的人
自己 寫東西 的時(shí)候
來 假借
有些字 忘了 怎么寫
就拿一個(gè) 同音字
日語假名
假借的 次數(shù) 多了
就 固定了下來
形成了
專門的 日語拼音 字符

假名
不同的時(shí)代
不同的地域
存在著多個(gè)體系
平假名
直到明治33年
發(fā)行公文才得以統(tǒng)一
萬葉仮名(假名)
《枕草子》
《源氏物語》
草書風(fēng)格的符號(hào)
有女性的柔美
抄文眾多

把寫法也固定了下來
成為鉛字
萬葉仮名(假名)
現(xiàn)代假名系統(tǒng) 中的 平假名
形成了
除了平假名之外
還有片假名
片假名
片假名來自 漢字 的 一片
也是一種 假名系統(tǒng)
有 硬朗的 楷書 轉(zhuǎn)化而來

明治維新時(shí)期
大量歐美外來語涌入日本
日語只取其讀音
用片假名將其表示出來
假名系統(tǒng)
是 拼音文字 系統(tǒng)
字符數(shù)量 不多
最初的日文編碼
在ascii的基礎(chǔ)上
把片假名加了上去
字型什么樣呢?
假名字形碼
可以把這些片假名輸出出來嗎?
輸出假名
下面的代碼是將a1到e0
然后再將字節(jié)解碼
封包進(jìn)入一個(gè)字節(jié)
可以動(dòng)手試試
以后我們會(huì)詳細(xì)講解封包解包
范圍[0xa1, 0xe0)
勇者斗惡龍
當(dāng)時(shí)的日文
能顯示出ascii和假名的字型
就已經(jīng)很厲害
想顯示出中文字型
是不可能的
日本漢字
是中文的拼音文字
只是假名都加在一起就至少 100+
128 根本不夠用
更何況日文里面用日本漢字
雖然只有2000個(gè)不到
但是是文化的象征
不過假名畢竟是假的
日文中最厲害的還是漢字
漢字文化
日語中混有各種漢字

感覺根本不用翻譯

也會(huì)造一些日本漢字
漢字發(fā)音含義凪なぎ風(fēng)平 浪靜雫しずく水滴 如雨下躾しつけ教育榊さかき寺廟里的 樹
評(píng)選年度漢字

所以日文中的字符直接超過2000+
1 個(gè)字節(jié) 是不夠了
至少需要 2 個(gè)字節(jié)

日本規(guī)格協(xié)會(huì)制定標(biāo)準(zhǔn)
JIS X 0212
點(diǎn)陣字庫 產(chǎn)生了
日本漢字的黑體模式
無襯線黑體風(fēng)格
無襯線
注重實(shí)效
注重清晰度
黑體
任何字帖一般都有兩種風(fēng)格
板正規(guī)范的生硬風(fēng)格
圓潤靈動(dòng)的手寫風(fēng)格
手寫風(fēng)格
不像大寫字母
那么生硬
就像小寫字母
那么圓滑
韓文字符又是如何編碼的呢?
韓文
韓文也是一種拼音文字
從此韓文有了諺文
基礎(chǔ)字母有二十四個(gè)
符號(hào)是朝鮮王朝世宗大王時(shí)創(chuàng)作的
但是韓國士大夫會(huì)寫漢字
不愿意推廣諺文
拼音
不過拼音文字
更容易一些
諺文書寫 普及速度 比漢字書寫 快得多
拼音 是有結(jié)構(gòu)的
諺文結(jié)構(gòu)
諺文是由表音符號(hào)組合而成的
有各種間架結(jié)構(gòu)
這些聲旁都發(fā)什么音呢?
聲音
韓文名字
宋仲基(???)
金喜善(???)
李英愛(???)
阿一古(???)
圓圈不發(fā)音
從此就連哎呦喂(阿一古)
都有了標(biāo)準(zhǔn)發(fā)音方法
用拼音文字把讀音固化下來
諺文有多少字符呢?
諺文字符
聲母韻母拼寫在一起算一個(gè)
共 554 個(gè)
而且這還不算朝鮮漢字
這554個(gè)基礎(chǔ)字符導(dǎo)致
1 個(gè)字節(jié)不夠
2 個(gè)字節(jié)才夠
韓文的字符集為
KS X 1001
總結(jié)
日韓各有 編碼格式
有諺文
有朝鮮漢字
數(shù)量超過500
一個(gè)字節(jié) 放不下
字符數(shù)量超過20000+
有假名
有日本漢字
五十音
一字節(jié) 可以勉強(qiáng)放下
字符數(shù)量超過20000+
日本
韓國
作為 漢字源頭的中國
究竟應(yīng)該 如何對(duì)漢字 進(jìn)行編碼 呢???
我們下次再說!*
藍(lán)橋->https://www.lanqiao.cn/courses/3584
github->https://github.com/overmind1980/oeasy-python-tutorial
gitee->https://gitee.com/overmind1980/oeasypython