[oeasy]python0 113_字符編碼_VT100控制碼_iso_8859_1_拉丁字符_latin
拉丁字符
回憶上次內(nèi)容
上次回顧了字型編碼的進化過程
終于讓 字母、數(shù)字、標點 明確了字型
7-bit 的 點陣字庫
但是 7-bit 的 ascii中
沒有
法文字符的位置

如果擴展位為1
有各自不同的 擴展方式
不同的計算機廠商
這噩夢
比法語不兼容 更可怕!??
這以后 編碼就越來越多了
互認對方為亂碼
法文字符
直接 變成亂碼
完全被 不同的字符集
這可怎么辦呢???
那可是法國?。?/h1>法國畢竟 曾是 與英國全球爭霸的對手
美國 從英國獨立 最早靠的
沒有法文字符的位置?
找路易十五要的 軍事和經(jīng)濟支持
還是 富蘭克林來法國
現(xiàn)在美國字符集ascii里面
傷心的法國人 不由得回憶起那場海戰(zhàn)
特拉法爾加海戰(zhàn)
如果當(dāng)年法國拿破侖選用富爾頓的火輪船
那特拉法爾加海戰(zhàn)會被改寫
如果 結(jié)局改寫
美利堅 可能是 法國殖民地

英國應(yīng)該 無法和法國 在海上爭霸
最終 世界語言是法語
美國 入學(xué)考的不是TOEFL
而是 TOFFL

再往前
英國就更非主流了
征服者威廉
法蘭克王國 諾曼地區(qū)的公爵威廉
成了 不列顛島的征服者威廉
跨過英吉利海峽

不列顛島 北高南低
擋住北邊的冷風(fēng)
非常 適合生存
從來就 不乏 征服者
英倫
伊比利亞、凱爾特、羅馬、昂撒、丹麥、法國諾曼都曾征服不列顛
英格蘭島的名字 來自于 盎格魯部落
English
England
當(dāng)時昂撒 是 凱爾特人 搬來的救兵
假途滅虢 占了這個南方平坦的寶島
說 這是我們盎格魯人的島
盎格魯島人說的語言

英國的文化 本就是 多民族、宗教雜糅出來的一個混合體
從不希望 歐洲大陸出現(xiàn)強大的帝國
那就會 威脅到島上的安全
英國對于 歐洲各國制衡之術(shù)
又被后來的美國 學(xué)去制衡 整個歐亞大陸
不過說到底 所有文化的開局 都是從非洲走出來的
最最開始都是 從無機物 偶然變成 有機物
但是 電子信息化到數(shù)字化 是一個新的大環(huán)境
法文字符 的編碼方式 會統(tǒng)一 嗎?
先回顧 ASCII的基本情況
ascii
目前最熟悉的編碼是 ascii
編碼
包括控制字符、大小寫字符、數(shù)字、符號
字節(jié)中 第 1
位 為 0
從0x00
-0x7F
后 7 位
這里面 沒有法文字符

但如果第 1
位是 1
又會如何呢?
嘗試輸出
找到一個數(shù)字 0xa7
找到 數(shù)字對應(yīng)的字符
這是個 章節(jié)符號

也可以形成
一個閉環(huán)
閉環(huán)
這規(guī)律
還可以 有一定的空
間
還可以 對應(yīng)更多字符
和ascii 一樣的
也就是說 這個字節(jié)里面除了 ascii 的 128 個字符之外

等于是 把ascii編碼 給擴展了
編碼格式
跨國跨語言的事情 怎么辦?
還是要 看用戶數(shù)量

Dec公司的 VT100
質(zhì)量 過硬
價格 實惠
終成 新一代機皇
機皇的影響力
新的終端
就必須兼容VT100
包括VT100中 一項新功能

這CSI
不就是 控制序列\(zhòng)e 嗎?
事實上的標準
VT100 是當(dāng)時 最流行的終端
不但支持 常用的轉(zhuǎn)義字符
還創(chuàng)造出 VT100控制碼
法國畢竟 曾是 與英國全球爭霸的對手
美國 從英國獨立 最早靠的
沒有法文字符的位置?
找路易十五要的 軍事和經(jīng)濟支持
還是 富蘭克林來法國
現(xiàn)在美國字符集ascii里面
傷心的法國人 不由得回憶起那場海戰(zhàn)
如果當(dāng)年法國拿破侖選用富爾頓的火輪船
那特拉法爾加海戰(zhàn)會被改寫
如果 結(jié)局改寫
美利堅 可能是 法國殖民地

英國應(yīng)該 無法和法國 在海上爭霸
最終 世界語言是法語
美國 入學(xué)考的不是TOEFL
而是 TOFFL

再往前
英國就更非主流了
法蘭克王國 諾曼地區(qū)的公爵威廉
成了 不列顛島的征服者威廉
跨過英吉利海峽

不列顛島 北高南低
擋住北邊的冷風(fēng)
非常 適合生存
從來就 不乏 征服者
伊比利亞、凱爾特、羅馬、昂撒、丹麥、法國諾曼都曾征服不列顛
英格蘭島的名字 來自于 盎格魯部落
English
England
當(dāng)時昂撒 是 凱爾特人 搬來的救兵
假途滅虢 占了這個南方平坦的寶島
說 這是我們盎格魯人的島
盎格魯島人說的語言

英國的文化 本就是 多民族、宗教雜糅出來的一個混合體
從不希望 歐洲大陸出現(xiàn)強大的帝國
那就會 威脅到島上的安全
英國對于 歐洲各國制衡之術(shù)
又被后來的美國 學(xué)去制衡 整個歐亞大陸
不過說到底 所有文化的開局 都是從非洲走出來的
最最開始都是 從無機物 偶然變成 有機物
但是 電子信息化到數(shù)字化 是一個新的大環(huán)境
法文字符 的編碼方式 會統(tǒng)一 嗎?
先回顧 ASCII的基本情況
目前最熟悉的編碼是 ascii
編碼
包括控制字符、大小寫字符、數(shù)字、符號
字節(jié)中 第 1
位 為 0
從
0x00
-0x7F
后 7 位
這里面 沒有法文字符

但如果第 1
位是 1
又會如何呢?
找到一個數(shù)字 0xa7
找到 數(shù)字對應(yīng)的字符
這是個 章節(jié)符號

也可以形成
一個閉環(huán)
這規(guī)律
還可以 有一定的
空
間還可以 對應(yīng)更多字符
和ascii 一樣的
也就是說 這個字節(jié)里面除了 ascii 的 128 個字符之外

等于是 把ascii編碼 給擴展了
跨國跨語言的事情 怎么辦?
還是要 看用戶數(shù)量

Dec公司的 VT100
質(zhì)量 過硬
價格 實惠
終成 新一代機皇
新的終端
就必須兼容VT100
包括VT100中 一項新功能

這CSI
不就是 控制序列\(zhòng)e 嗎?
VT100 是當(dāng)時 最流行的終端
不但支持 常用的轉(zhuǎn)義字符
還創(chuàng)造出 VT100控制碼
\033[0m ? ? ? ?// 關(guān)閉所有屬性 \033[1m ? ? ? ?// 設(shè)置為高亮 \033[4m ? ? ? ?// 下劃線 \033[5m ? ? ? ?// 閃爍 \033[7m ? ? ? ?// 反顯 \033[8m ? ? ? ?// 消隱 \033[nA ? ? ? ?// 光標上移 n 行 \033[nB ? ? ? ?// 光標下移 n 行 \033[nC ? ? ? ?// 光標右移 n 行 \033[nD ? ? ? ?// 光標左移 n 行 \033[y;xH ? ?// 設(shè)置光標位置 \033[2J ? ? ? ?// 清屏
這就是 后來CSI的雛形 ??
Control Sequence Introducer
有了這個 就可以控制
字體
位置
顏色
慢慢 DEC的VT100標準
就成了 計算機終端的標準
ISO組織
總部在 瑞士日內(nèi)瓦湖的 ISO組織
發(fā)展出 iso-8859-1 字符集
負責(zé) 跨國跨公司的標準化
在Dec所用 編碼格式的基礎(chǔ) 上
為什么 選擇Dec的 編碼格式?
因為 VT100是 當(dāng)時的 一代機皇
用戶數(shù)量 就是 事實上的標準
根據(jù) dec公司的 字符集
生成了 擴展ascii字符集(charset)
前一半(0-127)
沒有動
還是ascii
后一半(128-255)
換成了 西歐北歐各國拉丁字符
這個 編碼
叫做 iso-8859-1
也叫做 latin-1
latin-1覆蓋的 范圍如何呢?
覆蓋范圍
西歐北歐語族都可以覆蓋到
拉丁人的羅曼語族(法意西葡)
日耳曼人的日耳曼語族(瑞丹挪德冰)
凱爾特人的蓋爾語族(蘇愛)

latin-1
拉丁語(法意西葡)我們好理解
拉丁正宗

北歐 這么多國家
為什么 都使用拉丁字符呢?
北歐 不是有 自己的一套符文系統(tǒng)嗎?

日耳曼語族 不是和 拉丁語族 并列的嗎?
總結(jié)
這次回顧了 非ascii的拉丁字符編碼的進化過程
0-127 是 ascii 的領(lǐng)域
西歐、北歐語言 大多使用 拉丁字符
由iso組織 制定iso-8859-1

北歐 原來 不是有自己的盧恩文字(Runes)符文系統(tǒng)嗎?
我們下次再說!*
藍橋->https://www.lanqiao.cn/courses/3584
github->https://github.com/overmind1980/oeasy-python-tutorial
gitee->https://gitee.com/overmind1980/oeasypython