淺談個(gè)人對(duì)AI和文字模型看法

GPT是一個(gè)強(qiáng)大的語言模型,信息工具,建立在大型數(shù)據(jù)中心CPU-GPU計(jì)算構(gòu)造上的,ASCII(American Standard Code for Information Interchange,美國(guó)信息互換標(biāo)準(zhǔn)代碼,ASCⅡ)是基于拉丁字母的一套電腦編碼系統(tǒng)。它主要用于顯示現(xiàn)代英語和其他西歐語言。它是現(xiàn)今最通用的單字節(jié)編碼系統(tǒng),基底還是16進(jìn)制轉(zhuǎn)化字母,自計(jì)算機(jī)技術(shù)革命以來積累了大半個(gè)世紀(jì),16進(jìn)制對(duì)應(yīng)國(guó)產(chǎn)字體編碼系統(tǒng)的發(fā)展基本沒有,甚至進(jìn)制都是別人的研究成果,自研的各類架構(gòu)X86,ARM,RISC-V之類的cpu無一例外全部是基于ASCII編碼標(biāo)準(zhǔn),根本沒有漢字標(biāo)準(zhǔn),也就是說國(guó)內(nèi)互聯(lián)網(wǎng)和99%信息系統(tǒng)全部是構(gòu)筑在字母搭建框架上,簡(jiǎn)而言之現(xiàn)在手機(jī)屏幕上的每個(gè)字都是16進(jìn)制轉(zhuǎn)字母再轉(zhuǎn)漢字而來,計(jì)算機(jī)互聯(lián)網(wǎng)革命,智能手機(jī)出現(xiàn)對(duì)人的生活和社會(huì)帶來的影響可見一斑。但是這個(gè)框架我們拿來用了一切也還是別人的東西,只要這個(gè)框架自研出來所謂的中文語言模型或者叫AI,他也是字母再翻譯過來的東西,AI學(xué)習(xí)消耗的計(jì)算力加入了轉(zhuǎn)譯數(shù)據(jù)量肯定是指數(shù)級(jí)的增大。之所以叫語言模型他是要基于真正的語言文字來進(jìn)行邏輯演算推理得出結(jié)論,所以GPT的漢字解答,就算他自己根據(jù)學(xué)習(xí)到的漢族文字表述規(guī)律來修正過,也多少有點(diǎn)翻譯出來的感覺,而且寫文言詩并不押韻??v觀熟悉通訊只能說自家是底子都沒有,硬要說科學(xué)無國(guó)界是全人類共同的科技成果,那別人必定會(huì)加個(gè)門檻。進(jìn)制編碼這套東西已經(jīng)由別人定型,雖然我們習(xí)慣吃快餐和借鑒,必定也沒團(tuán)隊(duì)有心力能從根源研究出來,但肯定有人會(huì)拿來套殼騙補(bǔ)貼。英文根本組成是26個(gè)字母,而漢字的根本是筆畫,一個(gè)字拆開多少筆畫,又有多少字,難度可想而知。想一想1837年出現(xiàn)的摩爾斯電碼,回頭看看腳步停在哪里了,也許就在停在電和信息結(jié)合時(shí)期吧,也就晚了幾個(gè)世紀(jì)而已。