[oeasy]python0123_中文字符_文字編碼_gb2312_激光照排技術_王選
中文編碼GB2312
回憶上次內容
上次回顧了 日韓各有 編碼格式
有諺文
有朝鮮漢字
數(shù)量超過500
一個字節(jié) 放不下
字符數(shù)量超過20000+
有假名
有日本漢字
五十音
一字節(jié) 可以勉強放下
字符數(shù)量超過20000+
日本
韓國

作為 漢字源頭的中國
究竟應該 如何對漢字 進行編碼 呢???
漢字
漢字起源于甲骨文
是世界上唯一還在使用的象形文字
真的很不容易

寫的本意 就是 畫
寫意
寫生
這就是最初的
象形字
六書
以象形為基礎
指事
會意
形聲
轉注
假借

字的結構是什么呢?
間架結構
上下
左右
內外

字型相當復雜
筆畫也千姿百態(tài)
漢字筆畫
筆畫也比較復雜

運筆藏鋒都很有講究
中國大陸地區(qū)
中國大陸地區(qū)最早使用 GB/T 2312-1980
當時參考了比我們先進的日本JIS 字符集
1980 年 指定的國標 (GuoBiao)
1981 年 5 月 1 日開始使用

GB2312 編碼共收錄漢字 6763 個
其中一級漢字 3755 個
二級漢字 3008 個
這么多字怎么排呢?
區(qū)位
01-09 區(qū)為特殊符號
先把ascii的128個字符讓出去
然后在留有一些制表的字符
還留了相當多的空余
16-55 區(qū)為一級漢字
按拼音排序
56-87 區(qū)為二級漢字
按部首/筆畫排序

出了漢字之外,還收錄了
拉丁字母
希臘字母
日文平假名及片假名字母
俄語西里爾字母
真的很全了
可是這gb2312
具體是如何編解碼的呢???
應用

如果是0-127以內的ascii字符
標志位為0
1個字節(jié)存儲

如果是ascii以外的字符
標志位為1
2個字節(jié)存儲
編解碼
編解碼方法一致就可以
解鈴還須系鈴人

同時用 gb2312 編解碼是沒有問題的
這篇 制定標準的文檔
當時怎么打印出來的呢?
制定內碼標準的 時候 就有 字形 了嗎?
鉛字
雖然 計算機 在當時 還 沒有普及
但是 出版行業(yè) 已經(jīng) 工業(yè)化 了

印刷廠 使用 鉛活字 進行排版
鑄字工
拼版工
還有揀字工
揀字工
印刷家譜 從 一個大盒子 就夠了

字 再多些
要用 轉輪排字盤

字 再多些呢?
撿字室
大 印刷廠
字模 特別多

甚至 要放
好 幾面墻
好 幾張桌子
開端
這 也 曾被
使用26個字母的 西方文明 嘲諷

出書確實不易
撿好了 字
排好了 版
先 打個樣
再來 校對
再 澆鉛板
最后 印刷
最初的
書籍
雜志
報紙
試卷
都是這樣 ? ?印刷出來 的
到了 印刷 gb2312-80標準的 1980年
已經(jīng)啟用了新的技術
機械打字機
從 輪轉排字盤
到 謝衛(wèi)樓 發(fā)明的 中文打字機

再到 舒震東
在前人的研究基礎上經(jīng)過創(chuàng)新
得到的 舒式打字機
中文字符 的數(shù)量
是 一個難關
直到
照相技術 的 發(fā)展
照片排版
使用 照片底片 進行排版
也面臨檢字的工作
照片排版技術本身也在迭代
激光照排
這次使用 激光 掃描照片
每一個小字型都是一個照片
根據(jù)漢字內碼找到漢字對應的激光照片
然后再把激光照片像活字一樣排版
這就是激光照排技術
用照片排版的方式
制作了這樣一個漢字編碼的文檔
標準定了立刻就能用起來么?
過程
凡事都有個過程
95年定的gbk
98年才逐漸推行開來
但還是有些生僻字沒有相應的字型
內碼從無到有
字形碼也從無到有
感謝前輩
感謝王選與陳堃銶前輩的技藝
激光照排技術 可以
印刷中文書籍 和 報紙 了
總結
簡體和繁體的漢字
字符數(shù)量都超級大
感謝王選和陳堃銶等前輩發(fā)明了激光照排技術
中文排版從此使用上了gb2312編碼
紙張之外
顯示器是更先進的輸出設備
計算機是如何在顯示器上顯示的呢???
我們下次再說!??
藍橋->https://www.lanqiao.cn/courses/3584
github->https://github.com/overmind1980/oeasy-python-tutorial
gitee->https://gitee.com/overmind1980/oeasypython