【雜談日記】PC的未來形態(tài)是怎樣的?
本專欄是視頻:BV1734y1J7K9 的觀后感。
Athoney 大佬在視頻里提到了幾個問題:
1、x86平臺下的功耗越來越高,能效比越來越低,就好像我現(xiàn)在這顆12700最大睿頻高達241w,六年前的7700才65w,已經(jīng)翻了接近4倍,當然,實際上的最大性能也提升了接近四倍。
2、M1芯片在能耗比控制上做得明顯比x86平臺更好。
3、x86平臺具有很多歷史負擔,導致被一些不必要的指令集拖累了性能
然后得出了一個結論,因為M1做得很好,x86的紅綠藍三家做得不好,所以PC的未來是和M1一樣高度集成的ARM SOC。
如果你是跟著他的視頻一路看下去的,很容易就會得出和他一樣的結論,但是如果你仔細列出來再想想,這之間根本沒有嚴格的因果關系。
準確來說,對比的對象是x86平臺和M1,而不是x86和ARM。
評論區(qū)中已經(jīng)有很多人指出這個問題了,清醒的人還是比較多。
蘋果的M1做得好,核心原因是將絕大多數(shù)計算芯片都集成在了SOC上,M1不是CPU也不是GPU,它是片上系統(tǒng),計算芯片相互之間進行數(shù)據(jù)傳遞的代價非常低,減少了傳遞消耗,提升了效率。
不要以為光速是個很大的數(shù)字,1GHz代表每秒10億次,我們將光1秒行進的距離除以10億(簡單用3×10^8米來算),你會發(fā)現(xiàn)這個數(shù)字是30cm,如果按3GHz來算,就是10cm,10cm的物理距離,光走一個來回,就要消耗兩個計算周期,如果縮短到5cm,就可以減少一次等待,實際上因為信號傳輸?shù)霓D換和損耗,等待要更多。
縮減不同計算芯片之間的物理距離,很顯然可以提高芯片的計算效率。
然后其實蘋果的統(tǒng)一內存和x86筆記本上焊死的內存并不是一個概念,或者說至少可以不是一個概念,后者只是用焊盤取代了插槽,前者可以直接重新定義內存芯片的使用方式,就是說可以不管什么協(xié)議,直接按最合適自己SOC的方式來設計。
這個做法有優(yōu)點,也有缺點,后面我們再講。
然后是M1本身的芯片設計思路,蘋果是將很多x86平臺上的通用計算任務拆分給了專用的芯片,比如M1芯片上一大坨的媒體芯片,就是專門干特定的活的。
這樣的做法最大的好處是,因為芯片只用干專門的活,指令集就只需要特定的那幾種,在物理結構的設計上可以更簡單,減少執(zhí)行長指令的性能消耗,降低調用這一塊芯片完成同樣工作相比通用計算芯片的消耗,同時,在沒有任務的時候,更是零消耗。
這樣做的代價是什么呢?
減少了通用計算芯片的尺寸,當遇到專用芯片無法完成的工作時,通用計算芯片的能力會明顯低于將這部分空間用于設計通用計算芯片。
浪費寶貴的晶元空間,降低良品率。
我們稍微夸大一下數(shù)字方便理解,假如一個功能有8個小芯片,每個的良品率是90%,那么他們相互獨立時,生產(chǎn)100份的良品率期望值是90%,而如果是在同一個芯片上不可分割,那么良品率就只有43%,差了一半多。實際上良品率更高,但小芯片的數(shù)量也更多,結論是類似的。
這就是M1大芯片的代價。
芯片的實際成本是總原料成本除以合格品數(shù)量,而不是總原料成本除以總產(chǎn)量,良品率越低,芯片的生產(chǎn)代價就會越高,所以集成度不是越高越好的。
看完M1的優(yōu)勢來源之后,你就會發(fā)現(xiàn),M1之所以強,或許ARM架構有一定的原因,但核心原因還是這種設計的邏輯,降低了芯片之間的開銷和負載,實現(xiàn)了能效比的提升。
這樣的設計如果給到x86平臺,很顯然也會有很大的提升,但是目前x86平臺的包袱不允許他們做出這種改變?,F(xiàn)在的問題就好像ARM是光腳的,x86是穿鞋的一樣。
依照我個人的想法,未來最理想的形態(tài)應該是介乎于現(xiàn)在的x86生態(tài)和蘋果的M1生態(tài)之間
部分本身就基本捆死的功能集約化形成更高級的準系統(tǒng),而相互之間比較獨立,且存在更多搭配需求的功能則還是繼續(xù)進行分離,提供更多的選擇,同時減少系統(tǒng)間交流帶來的損耗。
我個人認為,CPU、內存和主板這三者其實是可以綁定形成成介乎于SOC和準系統(tǒng)之間的形態(tài)的。
目前的準系統(tǒng)大多只是精簡了部分接口的硬件軟連接,沒有從根本上實現(xiàn)更高效的互聯(lián)互通。
而將CPU限制在殼子里無論是對散熱還是設計的復雜度上都會造成更大的挑戰(zhàn)。
如果能去掉內存顆粒的封裝,將主板上的主要集成芯片、CPU和內存集中在一個更利于散熱的封裝內,很顯然也能提高整體的性能。
這樣的做法之所以可行,是因為,主板芯片、CPU和內存本質上還是物理分離的芯片,只不過通過在封裝環(huán)節(jié)的設計提高其使用效率,不會帶來額外的良品率負擔。
甚至目前紅綠藍三家在搞的小芯片共享合作,也可以將一些小芯片從CPU的芯片中解放出來,在這個更大的SOC內進行互聯(lián),整體的效率已經(jīng)會很可以了。
而之所以我覺得這三個封裝在一起可行,是因為絕大多數(shù)人,這三項硬件的選擇都是相當固定的搭配,甚至有部分區(qū)分就是Intel強行搞出來的,如果統(tǒng)一封裝之后實際存在的型號會比單純的排列組合要少很多。
實際上用戶在更換設備的時候,除非刻意組裝的短板機,否則精打細算的水桶機在這三項配置上單純更換其中一項硬件,其他地方都在事實上地拖后腿,就算沒有Intel的強制鎖插槽也一樣。
這樣的設計不是沒有代價,有,就是暫時買不起內存,打算慢慢攢機的人。
這樣的大號SOC可折騰的空間肯定是變小了,而且在配置上很顯然要求一步到位,如果能做好合理的引導區(qū)分的話,目前Intel 12代桌面端處理器,不考慮K和F后綴的影響的話,一個i3,四種i5(沒錯,確實是四種,12400,12490,12600和12600k,唯一k和非k芯片不同的系列),一個i7,一個i9,一共就7種芯片,每種芯片根據(jù)生產(chǎn)力/游戲等需求可以劃分出兩個內存型號,然后部分有兩種主板芯片型號,如果強行排列組合大概是28種,其實將部分不合理的組合刪掉之后,也就十幾種不同的選擇。
從這個角度看,實際上這十幾種搭配也可以滿足99%的用戶需求了。
當然,這是假定硬件性能沒有任何差距的前提下得出的結論。
實際上,阻礙這一設計成熟的最大阻力之一就在于內存顆粒的良莠不齊,以及未來將會更頻繁發(fā)生的多重抽獎問題。
如果這三個元件是分開的,用戶是進行三次抽獎,但是每次的抽獎可以重設,或者可以指定一個下限,如果做在一個SOC上,就相當于強制直接抽三次獎,只能同步重抽,就又回到了前面談SOC良品率的問題了。
這樣其實相當于降低了整體系統(tǒng)的最高可能下限,因為分別抽三次獎,和同時抽三次獎,需要的總次數(shù)是不同的。
想要解決這個問題,就得將每次抽獎的保底拉得足夠高,這需要x86生態(tài)這邊具有蘋果那樣強力的對供應鏈的掌控能力,我覺得以目前x86陣營各自為戰(zhàn)的情況來說,很難。
而顯卡目前來看,最好還是獨立的原因在于,它本身就是一個相對獨立的系統(tǒng),有專用的內存芯片,有專用的供電,甚至還可以有專用的存儲。
它在實際使用上基本和CPU是平行關系,實際應用上嚴格互相制約的情況很少,以游戲舉例,低分辨率下拉高幀數(shù)的瓶頸是CPU,高分辨率下拉高幀數(shù)的瓶頸是GPU,高畫質和高幀率是相對獨立的需求,在不同人的眼中有不同的優(yōu)先級。
類似的情況其實還有很多,在這我就沒必要贅述了。
而普通存儲,則是系統(tǒng)關聯(lián)度很低,更沒必要進行強制綁定。
簡單點來說,將本就客制化需求不高的內容進行綁定,并同時為其進行專門的優(yōu)化,可以顯著提升他們之間協(xié)作的性能,這可能是未來民用PC的趨勢。
——其實游戲主機就是這么干的,甚至由于對于顯卡的需求固定,甚至顯卡也被納入了統(tǒng)一的行列之中。只有沒有絕對關聯(lián)的存儲功能,留出了給用戶自行升級的空間。
而絕不是像蘋果一樣干出為了避免用戶自己更換固態(tài)存儲而將主控芯片焊死在主板上的行為。
系統(tǒng)設計者可以幫助用戶排除掉大量錯誤的選擇,但不應該為了讓用戶多花錢而刻意制造電子垃圾。
未來的PC,應該更類似于可以定義PCI-E設備的游戲主機,只不過可能有十幾種型號罷了。
至于如何將整個系統(tǒng)整合起來,那還有很長的路要走。
M1或許為PC的未來指了方向,但蘋果的設計不是未來的唯一選擇,也不應該成為用戶的唯一選擇。