[oeasy]python0127_中文系統(tǒng)_gbk_BIG5_南極星_內(nèi)碼轉(zhuǎn)化
中文系統(tǒng)bgk
回憶上次內(nèi)容
漢字字形通過
點陣式打字機
像素級尋址的屏幕
進入了計算機的世界

在海峽對岸的臺灣同胞
也進入了漢字時代
他們會使用GB2312編碼嗎?
能互通嗎???
中國臺灣
BIG5 碼
是由 5 個公司聯(lián)合制作的
收錄次序 取決于 頻率
然后是 筆畫數(shù)
然后是 康熙字典
同時用 BIG5 編碼和解碼也是沒有問題的
但如果用BIG5編碼
卻用gb2312解碼就會有問題

不過存儲的內(nèi)容在文件里
系統(tǒng)不知道用什么解碼時
默認自動會用 gb2312 解碼
這就造成了自動亂碼
反之亦然
我們用 gb2312 編碼的文字
用 gb2312 可以打開
但是用 BIG5 打開就是亂碼
也需要轉(zhuǎn)化

轉(zhuǎn)化工具是有的
能解決問題但很麻煩
大量的輸入輸出編碼解碼的問題
令人頭大

確實麻煩
解決辦法
麻煩的地方正是機會所在

當(dāng)時如果日文游戲或者臺灣地區(qū)的游戲不能玩
可能是因為字符編碼格式不一致
可以用南極星調(diào)整字符編碼格式
把不同編碼格式進行轉(zhuǎn)化
把字節(jié)按照正確的方式進行解碼
就可以玩啦
沒有個標準整合一下嗎?
GBK
GBK 即漢字內(nèi)碼擴展規(guī)范
在GB2312的基礎(chǔ)上擴展了繁體字符集
K 為漢語拼音 Kuo Zhan(擴展)中“擴”字的聲母
英文全稱 Chinese Internal Code Specification
最初是微軟搞的
雖然不是國家標準
卻是事實上的技術(shù)規(guī)范

共收入 21886 個漢字和圖形符號
GB 2312 中的全部漢字、非漢字符號
BIG5 中的全部漢字(繁體兼容 GBK1)
將 漢字、日本漢字、朝鮮漢字融合了
合計 20902 個漢字
標準并不是一蹴而就的
標準的煙花
正如ASA X3.4-1963
最終到ascii
到 ASA X3.4-1965

GB也在不斷進化
到GB/T 1355-2021
這是小麥粉標準的進化
從GB/T 1355-86
從GB2312-1986
這是中文字符標準的進化
再到GBK
但是還是有問題
GBK雖然兼容了BIG5 中的全部漢字
用GBK打開BIG5編碼的文件還是亂碼
但是無法兼容編碼
問題
如果新GBK兼容了BIG5編碼
就無法向前兼容gb2312

這無解了嗎?
時間自會給我們答案
老天自有安排!
推薦一款 點陣字庫
中文點陣
最小也需要 7x7 像素

這個風(fēng)格很獨特
字體辨識度
字體辨識度

字體樣式
1994年的《魔獸爭霸》
字體不但可以有襯線
而且可以有立體感
像素字體在RGB顯卡的支持下

配色也很細膩
中文隸書
智冠公司出品的《三國演義》

使用隸書和車馬符號
代表那個三國時代
終端時代的中文超文本編輯器

當(dāng)時的wps系統(tǒng)
wps
當(dāng)時還沒有所見即所得

使用一些編輯標記
制作富文本
只有打印預(yù)覽才能查看效果
中文之星
還可以做藝術(shù)字特效
總結(jié)
中國的簡體和繁體漢字
字符數(shù)量都超級大
彼此還認對方為亂碼
如果有一種編碼 將所有的字符都能編進去就好了
中日韓(CJK)
簡體繁體
歐洲各種拼音
梵文
阿拉伯文
等等等都包括進去
能有么???
我們下次再說!??
藍橋->https://www.lanqiao.cn/courses/3584
github->https://github.com/overmind1980/oeasy-python-tutorial
gitee->https://gitee.com/overmind1980/oeasypython