【圖吧雜談】龍芯的主頻上不去真的只是因?yàn)楣に噯幔?/h1>
額……老鐵們,我圖吧老撿垃圾的了。今天咱不撿垃圾,簡單談?wù)勱P(guān)于龍芯的最高主頻與工藝問題和IPC的個(gè)人看法,龍芯的主頻上不去真的只是因?yàn)楣に噯??龍芯能通過更換工藝提高頻率快速提升性能嗎?
部分素材取自龍芯中科3A6000臺式機(jī)CPU性能測試 評論區(qū)
首先視頻標(biāo)題是錯誤的,完整版標(biāo)題是國產(chǎn)最強(qiáng),然而龍芯顯然做不到:


這個(gè)浮點(diǎn)被麒麟9000S手機(jī)端大核吊錘的水平可談不上什么國產(chǎn)最強(qiáng)(PS:上圖為龍芯吧小吧主彭東鋒的跑分,所有的AUTO的頻率都是鎖了最高3.6G的,和龍芯的PPT一樣)

LINUX下原生跑分整體性能只有10100F的70%水平也談不上能打得過海光的ZEN1


龍芯的3A6000換算CPUz跑分(因?yàn)閷?shí)際上跑不了CPUz,就算套轉(zhuǎn)譯+WINE不卡BUG也是分?jǐn)?shù)感人)也就是1714的水平,沒比KX-U6780A的1441強(qiáng)多少。

PS:如果按照上面華碩總代的龍芯最新視頻中LINUX跑Unixbench的情況下3A6000對比10100甚至只有62%的跑分來計(jì)算,那么換算成CPUz和象棋甚至打不過國產(chǎn)X86 19年的水平。

如果兆芯的CPU性能隨頻率提升沒有衰減的話(主要是咱雖然見過高頻版本但是沒跑過分)19年的KX6000的6880A 3.0G跑分理論上能達(dá)到象棋24.5倍CPUz1600。當(dāng)然實(shí)際上高頻跑分衰減是很正常的,不是衰減同頻性能就是衰減能效比。

比如6780A如果壓2.4G跑分其實(shí)會得到象棋19.9倍接近20倍CPUz單核170多核1285的結(jié)果,頻率下降11%跑分下降約10-11%功耗從70W降到了50W。



如果算象棋的話龍芯3A6000和10100F的跑分比例換算過來象棋只有23.7倍,甚至還不如KX6880A了。(10100F和10100的參數(shù)一致跑分沒有區(qū)別)
完整版的省流總結(jié):國產(chǎn)最強(qiáng)!龍芯中科3A6000臺式機(jī)CPU性能測試
然后回到正題,
原視頻即使是華碩的中國總代用華碩的龍芯主板超頻也只能做到2.5g 50w
2.9g 80w
3.0g 112w
這樣的水平,而且超頻之后還得用液氮壓,不壓跑不完分所以也就沒跑分。
這里評論區(qū)給出的說法是:

《制程工藝跟不上》《龍芯沒錢》《靠工藝提升性能不是優(yōu)先選項(xiàng)》

這里評論區(qū)說什么的都有,有甩鍋工藝的,也有說龍芯沒錢的,還有說龍芯走TIKTOK一代架構(gòu)一代提頻率的,還有半場開香檳的,直接3A6000 4Ghz=INTEL 10代 5.5Ghz了。


總之,說什么的都有,就是沒看見正經(jīng)分析測評結(jié)果的,沸騰就完事了。
但是作為圖吧垃圾佬來說事情可沒這么簡單。
首先CPU的性能不會隨著頻率無限提升,這應(yīng)該是進(jìn)入多核時(shí)代所有人的常識。不然也不用開什么雙核四核六核八核了,直接單核超10G全人類感謝你就完事了。

還有就是龍芯不支持Windows,那遇到需要的軟件不支持的時(shí)候就只能干看著


比如以上游戲基本上是別想了,實(shí)在想玩下個(gè)網(wǎng)易云吧

還有就是本機(jī)的顯卡支持也不支持NVIDIA或者INTEL的獨(dú)顯,只能有限支持AMD獨(dú)顯和國產(chǎn)顯卡(目前不含MTT S70 S80)。
首先說下咱的看法,簡單談下龍芯CPU頻率上不去的原因
首先評論區(qū)這種都是曾經(jīng)攻擊過其他國產(chǎn)芯片的龍芯吧自封龍芯圈的這群龍芯粉的經(jīng)典話術(shù)。頻率上不去第一時(shí)間甩鍋工藝上不去,實(shí)際上龍芯用的是低頻設(shè)計(jì)類似麒麟9000S的核心,強(qiáng)拉頻率上不去和用多少nm工藝無關(guān)純流水線設(shè)計(jì)取舍問題。
被咱指出來之后評論區(qū)也有反對聲音,比如這種:

回復(fù)是:覺得龍芯頻率拉不上去可以甩鍋工藝掏證據(jù)咱歡迎,至于人參攻擊水軍大可不必了。有證據(jù)就拿出來口嗨是沒用的,咱就是看龍芯吧小吧主到處攻擊其他國產(chǎn)芯片不爽而已,龍芯的設(shè)計(jì)水平還有很長的路要走菜就多練輸不起就別玩。

這點(diǎn)沒錯,工藝和架構(gòu)設(shè)計(jì)決定最高頻率,還有一點(diǎn)就是物理設(shè)計(jì)的優(yōu)化,英特爾的14nm初代skylake頻率普遍也不高3G多點(diǎn),后期到Comet Lake14nm+++隨便就能4G+了。
平心而論龍芯的12nm工藝水平算不上差了,但是只能壓2.5G-3G多少有點(diǎn)過分了(視頻中上3G甚至用液氮了),初代Zen采用GF/三星的14nm,結(jié)果主頻就能3.6-3.7G,挖掘機(jī)的APU用的還是GF甚至更差的28nm工藝,也沒耽誤上4G。麒麟9000S的工藝比龍芯更好,大核心也就不過上了2.6G,說到底還是低頻的設(shè)計(jì)導(dǎo)致的結(jié)果就是這樣,對于工藝落后來說采用低頻設(shè)計(jì)高IPC的路子是對的但不是唯一解,也可以直接使用小核心的低功耗+堆核方案,龍芯圈過去一直用IPC攻擊其他國產(chǎn)芯片其實(shí)就是卡了這種BUG

所以最后面對數(shù)據(jù)和事實(shí)對面也只能選擇相信事實(shí),光輸出情緒沒用歷史不是書寫情緒而是現(xiàn)實(shí)。國內(nèi)就沒有坐高高頻芯片設(shè)計(jì)的團(tuán)隊(duì),所以總拿工藝甩鍋頻率上不去是不對的。華為的海思半導(dǎo)體是國產(chǎn)芯片中研發(fā)實(shí)力最強(qiáng)的,結(jié)果要是還是上不了4G以上的高頻,剩下的這些殺馬特公司也別想真正走向高頻。所謂什么3A6000 4G=INTEL什么玩意根本就是不存在的。都不用引用知乎那句經(jīng)典的評論“XP都用不了對標(biāo)英特爾只能圖一樂”,就光是這個(gè)芯片本身的設(shè)計(jì)就導(dǎo)致了無論怎么拉高頻它要么就是上不去要么就上去了跑分也起不來,就這么簡單。
現(xiàn)實(shí)就是無論是搞高同頻性能還是高能效比都是面對實(shí)際問題的出路,而龍芯走了高同頻性能的路線,其他國產(chǎn)芯片走的是高能效比堆核路線,所以龍芯3A5000出現(xiàn)之后龍芯吧小吧主直接出視頻認(rèn)定所謂的IPC(指代同頻性能)=芯片設(shè)計(jì)能力,大肆攻擊其他國產(chǎn)芯片包括華為的鯤鵬指責(zé)其性能提升全靠先進(jìn)工藝,同頻性能沒提升就是設(shè)計(jì)水平?jīng)]提升,不如龍芯云云。


而龍芯的整體性能并沒有因?yàn)楦咄l性能或者IPC或者單核每Ghz的頻率而更高,直到現(xiàn)在龍芯都在對標(biāo)只有3.6G的老酷睿四核,這顯然是整體性能不夠高的一種體現(xiàn)。而面對現(xiàn)實(shí)的性能不足,龍芯圈的這些粉絲的話術(shù)總是“工藝落后了”“以后會提升”“進(jìn)度慢點(diǎn)”之類的,而實(shí)際上無論是3A5000還是3A6000它的架構(gòu)設(shè)計(jì)就讓它基本固定在這個(gè)頻率范圍了,即使優(yōu)化物理設(shè)計(jì)或者更改工藝提升也有限。


實(shí)際上在工藝不變的情況下通過優(yōu)化物理設(shè)計(jì)提升頻率的操作在國產(chǎn)芯片中也不是沒有。比如KX6000G在工藝16nm不變的前提下將CPU主頻從3.0G拉到了3.3G,類似英特爾過去的14nm+,也是在工藝不變的前提下優(yōu)化設(shè)計(jì)實(shí)現(xiàn)的頻率和能效提升所以在14nm后面直接寫了+相當(dāng)于優(yōu)化了設(shè)計(jì)約等于改進(jìn)了工藝。
目前還沒看到龍芯有這種優(yōu)化物理設(shè)計(jì)的迭代產(chǎn)品。
至于龍芯這一代在TIK-TOK所以沒有提升頻率的說法咱可以看下龍芯過去的產(chǎn)品。
如果管從意法半導(dǎo)體28nm的3A4000到南京臺積電12nm的3A5000(架構(gòu)分別是GS464V和LA464)上次產(chǎn)品迭代叫提頻率的話咱雀食無話可說,如果龍芯吧小吧主沒攻擊過其他國產(chǎn)芯片沒有架構(gòu)設(shè)計(jì)能力只能靠提升工藝?yán)黝l提高性能的話(事實(shí)上其他國產(chǎn)像兆芯飛騰其實(shí)都是這種路子,但是龍芯吧小吧主抓住他們沒改架構(gòu)的產(chǎn)品直接一頓測評然后得出結(jié)論其他國產(chǎn)芯片沒有研發(fā)能力就很樂了)。
問題的本質(zhì)是龍芯到底能不能在有錢之后快速的提高制程更換先進(jìn)工藝提高主頻,先不說被制裁的龍芯有沒有先進(jìn)工藝產(chǎn)能可用(華為的麒麟9000S同款工藝目前還沒對外開放產(chǎn)能,龍芯號稱2025將進(jìn)入7nm),就算有先進(jìn)產(chǎn)能可用了會不會也只能做出像麒麟9000S這樣最高頻率2.6G多的U也非常難說。
因?yàn)樾酒脑O(shè)計(jì)是要做取舍的,同頻性能高通常主頻就不太容易同時(shí)能拉上去,如果主頻拉上去了功耗就未必能控制得住。功耗控制不住就難以堆更多核心,加上總線技術(shù)的限制所以英特爾最后的答案竟然和ARM手機(jī)端一樣也是大小核——小核心提高CPU的能效,大核心提供更高的性能。

通常芯片的設(shè)計(jì)都是有一個(gè)既定的最佳頻率目標(biāo)的,如果超過這個(gè)工作頻率了效率就會下降,通常代表能效下降功耗提升高于性能提升,甚至一些情況下同頻性能也會下降性能提升低于頻率提升。

從龍芯的發(fā)布會上來看龍芯的3A6000就遇到了這種情況。龍芯發(fā)布會上居然給3A6000直接超頻之后跑分放出來了,結(jié)果頻率提升在5.5%的前提下跑分分別提升了2.2%和3.3%,這玩意可不能相加最多只能取平均數(shù)。也就是說5.5%的頻率提升只換來了2.75%的總體性能提升。

這跑分提升<頻率提升的操作是怎么做到的,圖吧群友看完直播之后都無語了。這里圖吧群有龍芯用戶指出很可能是龍芯的IO或者訪存帶寬卡了,所以超頻對性能的提升基本是沒多大用的。得超外頻或者超內(nèi)存才有用。姑且認(rèn)為可能是這種情況,但是龍芯的主板現(xiàn)在好像還不支持超外頻或者內(nèi)存,甚至連XMP都不支持。





剛才看了一眼,龍芯3A6000的發(fā)布會PPT上SPEC17的浮點(diǎn)跑分原地從龍芯吧小吧主的5.87跑分結(jié)果變7.79了,原地解決了跑分打不過麒麟9000S的問題,不過定點(diǎn)好像并沒有提升那么多只有11%,需要再接再厲。
UNIXBENCH的跑分也和前面有部分出入,反正只高不低,各位細(xì)品。
問估計(jì)就是優(yōu)化了,跑出了比所有測評UP主都高的成績,甚至部分成績提高了30%以上,可喜可賀。

PS:最后修正前作的一個(gè)看法,龍芯的12nm產(chǎn)品不是SMIC是因?yàn)镾MIC沒有12nm節(jié)點(diǎn)并不絕對。
雖然評論和咱說什么smic有12nm節(jié)點(diǎn)這個(gè)在英文互聯(lián)網(wǎng)沒查到任何有效的信息,中文互聯(lián)網(wǎng)也都是“據(jù)媒體報(bào)道”,難以確定真的有這個(gè)節(jié)點(diǎn),但是也難以確定沒有。
即使有也未必能保證有產(chǎn)能,可能同樣的設(shè)備都去做N+1 N+2了也說不定,總之龍芯這邊還沒看見任何產(chǎn)品官宣非南京臺積電的12nm工藝。只知道3A5000是南京臺積電12nm 3A6000是12nm,3C5000是SMIC 14nm。
至于16nm和12nm 14nm差距是不大,就像7nm和6nm也不大但是已經(jīng)不是一樣的東西了。咱也知道只要龍芯想他們自然可以隨時(shí)改SMIC 14nm工藝投產(chǎn),但是咱就想知道現(xiàn)在高調(diào)宣傳自主可控的3A6000到底用的是不是TSMC南京廠生產(chǎn)。如果有知道的朋友可以在評論區(qū)留言或者私信,咱等待一個(gè)答復(fù)。
就這些,謝謝朋友們!