急急如律…急著超統(tǒng)一碼16版的字體?典跡權(quán)暫??東方廚對(duì)Unicode的貢獻(xiàn)
當(dāng)前(2023-6-3)統(tǒng)一碼最新版是?15.0。不過(guò)看一下管道表
[ www.unicode.org/alloc/Pipeline.html ][Pipeline],15.1版和16版已經(jīng)在準(zhǔn)備了。據(jù)
[ www.unicode.org/versions/beta.html ],15.1版計(jì)劃于?2023年7月4日?結(jié)束β輪審核,于?9月12日?發(fā)布。而我此前的?Monu Hani 9.5?已經(jīng)支持了部分15.1版字符,也把路線圖里預(yù)留區(qū)段名稱漢化了……

等不及啦!咱們現(xiàn)在就要支持統(tǒng)一碼16版的字體!
以前沒(méi)機(jī)會(huì),但現(xiàn)在我剛好有兩個(gè)字體?Monu Last?典跡末境??與?Monu Temp?典跡權(quán)暫??可以達(dá)成這個(gè)目的。字體文件都已放在?[ github.com/MY1L/Unicode ]


?典跡末境?(下稱?Last?)以前介紹過(guò)不止一次了,略,這次更新到8.120版以支持15.0.2版SMP、15.0.1版SIP\TIP路線圖。
2EBF0..2EE4F; 中日韓統(tǒng)一表意擴(kuò)充壬|CJK Unified Ideographs Extension I(預(yù)定)
38000..3AB9F; 篆書(shū)|Seal Script(暫改至當(dāng)前)
原暫定在35400..36BFF的甲骨區(qū)段沒(méi)了??

而?典跡權(quán)暫?(下稱?Temp?)如其名,這個(gè)是沒(méi)轍了的四處取材混成字體。這類(lèi)混合字體的技術(shù)難點(diǎn)在于如我以前所說(shuō),upm(每“—”長(zhǎng)度置單位數(shù))不同的字體沒(méi)法無(wú)損合并的,需要特殊的技巧——不過(guò)外行不在乎內(nèi)行不需要,此處略去。
看一下?[Pipeline],決定先支持這幾個(gè)已正式被UTC或WG2接受的統(tǒng)一碼16版預(yù)留區(qū)段:
105C0..105FF; 托茲里|Todhri
10D40..10D8F; 加拉伊|Garay
11BC0..11BFF; 蘇努瓦爾|Sunuwar
16100..1613F; 古隆凱瑪|Gurung Khema
16D40..16D7F; 基勒特賴|Kirat Rai
1CC00..1CEBF; 遺留電腦符號(hào)補(bǔ)充|Symbols for Legacy Computing Supplement
1E5D0..1E5FF; 奧爾奧諾爾|Ol Onal
以及不知道將來(lái)哪一版的區(qū)段:
11DB0..11DEF; 托隆西基|Tolong Siki
這下不僅支持還超越16版了??

托茲里|又是牧師弄的一種阿爾巴尼亞+希臘字母表,下文會(huì)提及。[ www.omniglot.com/writing/todhri.htm ]右上角例圖開(kāi)頭有誤。

葉密豪襯線體“Uni105C0Todhri”與手寫(xiě)體差別較大,?Last?參考了手寫(xiě)體和?Noto?哈尼菲羅興亞的【??】

?Temp?用了?Uni105C0Todhri-Regular,upm1000,手動(dòng)補(bǔ)碼。


加拉伊|有點(diǎn)麻煩,這文字排版上太飄逸了,大寫(xiě)的占位巨大,?Temp?下次一定。


蘇努瓦爾|尼泊爾和錫金用的文字之一,ISO 15924:Sunu。曾用名杰蒂切(Jenticha),統(tǒng)一碼提案認(rèn)為此名稱不適合(Other candidates for the Unicode identifier are given below. Their lack of suitability for this purpose is also provided.)

?Temp?用了?AP?的?Sunuwar 0.7: 10-9-2021,upm1000,圖略,形如上表。

古隆凱瑪|也是尼泊爾和錫金用的文字。先前動(dòng)態(tài)特意說(shuō)過(guò),且提問(wèn)過(guò)譯名,這里從略。

?Temp?用了?khema 2019,upm2048,手動(dòng)轉(zhuǎn)碼。字體細(xì)節(jié)質(zhì)量不佳,弧形拐彎是鋸齒。


基勒特賴|這個(gè)還是錫金……sil.org?為他們做了?OFL授權(quán)的字體?Kanchenjunga。上面那些“字體”不少是劣質(zhì)的掃描版,而這個(gè)字體質(zhì)量合格,不用重做了。

?Temp?用了?Kanchenjunga?Ver0.100,upm2048,圖略,形如上表。

奧爾奧諾爾|統(tǒng)一碼提案指出該文種其實(shí)還有一些在英語(yǔ)里比較不適宜的名稱,和統(tǒng)一碼已收錄的?奧爾奇基|?? ????|Ol Chiki 與 納格蒙達(dá)里|??????????????|Nag Mundari 有關(guān)。如果你看不見(jiàn)前面的2種文字,表示你需要到[ github.com/MY1L/Unicode ]下載幾個(gè)字體安裝了。


?Temp?用了?Ol Onal Krishna,upm2048,手動(dòng)轉(zhuǎn)碼。


托隆西基|也是印度某些邦的文種。這個(gè)就不知道統(tǒng)一碼哪一版會(huì)收了,應(yīng)該早于篆書(shū)。


?Temp?用了?Uni11DB0TolongSiki : 16-12-2022,upm1000,字體質(zhì)量極差,圖略,形如上表。
咦,標(biāo)題里提到的東方廚呢?

遺留電腦符號(hào)補(bǔ)充|這個(gè)區(qū)段還是對(duì)過(guò)去的各色微機(jī)符號(hào)作兼容,那時(shí)某些“圖片”文件、游戲貼圖實(shí)際是純文本字符畫(huà)。
www.unicode.org/L2/L2022/22016.htm#170-C15
? www.unicode.org/cgi-bin/GetMatchingDocs.pl?L2/21-235
?? [ www.unicode.org/L2/L2021/21235-terminals-supplement.pdf ][21235]
8. Finiteness. We have received concerns that there may be no end to the number of unencoded?characters found in old microcomputers and terminals, leading to no end of future proposals?should these characters be accepted. We believe this is not the case, for the following reasons.
譯:關(guān)于上限。常見(jiàn)擔(dān)憂是,在舊微機(jī)和終端中發(fā)現(xiàn)的未編碼字符數(shù)量可能無(wú)窮多,如果這些也被收錄,未來(lái)的提案將永無(wú)止境。我們認(rèn)為情況并非如此,原因如下。(下略)
統(tǒng)一碼提案判斷,過(guò)去的電腦符號(hào)不是無(wú)窮無(wú)盡也不是全都要收的,比如吃豆人游戲符號(hào)因?yàn)榘鏅?quán)問(wèn)題和克林貢文一樣不能收。但貪吃蛇沒(méi)得版權(quán),因此該圖一樂(lè)區(qū)段用貪吃蛇作為象征再好不過(guò)。
該?[21235]?提案涉及:
? ?2400..243F;控制圖符(追加碼位3個(gè),表見(jiàn)21頁(yè))
? ?1CC00..1CEBF;遺留電腦符號(hào)補(bǔ)充
? ?1F800..1F8FF;增補(bǔ)箭頭丙(追加碼位9個(gè),表見(jiàn)32頁(yè))
? ?1FB00..1FBFF;遺留電腦符號(hào)(追加碼位,?Temp?都填滿了)
為了增加說(shuō)服力,提議者附了各種字證插圖,比如這張看著像?DIYUSI,但衣服上卻標(biāo)著?MZ※?的字符畫(huà):

去年本打算拿上面這張圖當(dāng)車(chē)萬(wàn)圖發(fā)動(dòng)態(tài)釣魚(yú),但多翻兩頁(yè)就發(fā)現(xiàn):這就是車(chē)萬(wàn)_00.txt(※ 指一種夏普?MZ?的“圖片”格式),該角色種族是釣瓶落。這下釣到啦。

?Temp?主要用了提案者之一開(kāi)發(fā)的?OFL授權(quán)字體?Kreative Square Ver2023.01.02,upm720,順帶一提?Noto?直接用了其繪制的遺留電腦符號(hào)。

現(xiàn)在,可以參照碼表用?典跡權(quán)暫?拼出諸如托隆西基的“Tolong Siki(?????????? ????????)”或貪吃蛇,用?典跡末境?顯示路線圖碼位。
那么,急的代價(jià)是什么?
代價(jià)是這些碼位對(duì)應(yīng)的字形完全沒(méi)有保證,有被徹底推翻的可能。
比如這是2017年,位于當(dāng)時(shí)路線圖中的契丹小字:

而2020年13.0正式版的契丹小字,沒(méi)一個(gè)字的碼位與上圖一樣。

www.unicode.org/pending/pending.htmlCaution: use of proposed or accepted characters is at implementers' own risk; the repertoire and allocation of the characters may change before they are adopted in the Unicode Standard.
警告:使用路線圖中建議的字符,其風(fēng)險(xiǎn)由使用者自行承擔(dān);碼位分配在統(tǒng)一碼標(biāo)準(zhǔn)發(fā)布之前不保證沒(méi)變化。
還需注意:雖然?典跡權(quán)暫?有些字形是我畫(huà)的,還有一些取自?OFL開(kāi)放授權(quán)的字體,但你應(yīng)當(dāng)默認(rèn)本字體幾乎所有字形均無(wú)許可,自己學(xué)術(shù)研究用用就行了,不能以任何方式用于商業(yè)用途(used in any way in any product or publication)
而?典跡末境?就好使多了,是我的?OFL授權(quán)的字體。
題外話
我想以上可以解釋為何我對(duì)人造語(yǔ)言(簡(jiǎn)稱?Conlang)不感興趣。現(xiàn)實(shí)中或歷史上使用,卻未被統(tǒng)一碼接納的文種實(shí)在太多太多,還想有生之年看到這些文種都被收錄或拒收。
在我看來(lái)許多造語(yǔ)毫無(wú)創(chuàng)意,相比統(tǒng)一碼路線圖里有意思的文種不值得研究。順帶,我覺(jué)得國(guó)內(nèi)某造語(yǔ)發(fā)明的一些字母與托茲里雷同。
能讓我感興趣的造語(yǔ),其創(chuàng)意應(yīng)當(dāng)不低于?Undiine(波者魚(yú)皮文;溫蒂妮文),該造語(yǔ)可以做到:無(wú)法口頭表達(dá)(non-verbal);限非人類(lèi)智慧體使用("spoken" by non-human entities);在水中表述("spoken" underwater),除了字體設(shè)計(jì)不太行外,很有意思:
[ www.omniglot.com/conscripts/undine.htm ]


虛構(gòu)作品中可作為三體人文種的設(shè)計(jì)借鑒。