【知乎】我國自主研發(fā)的新一代通用處理器龍芯 3A6000 在京發(fā)布,具有怎樣的意義?
我國自主研發(fā)的新一代通用處理器龍芯 3A6000 在京發(fā)布,具有怎樣的意義?還有哪些信息值得關(guān)注?

硫離子
在職學生
謝邀@夕仔
失傳技術(shù)字幕組 等 549 人贊同了該回答
簡單測了下3A6000:
直接說結(jié)論:同頻ZEN2的0.93倍(以coremark計)。
實測能打minecraft
開光影常見mod,能玩輻射新維加斯,正在試輻射4。
同時開微信qqB站輻射新維加斯一點問題沒有。
https://openbenchmarking.org/result/2311203-NE-2311191NE29
openbenchmarking.org/result/2311203-NE-2311191NE29
OrangePi4 Benchmarks [2311203-NE-2311191NE29] - OpenBenchmarking.org
https://openbenchmarking.org/result/2311203-NE-2311191NE29
openbenchmarking.org/result/2311203-NE-2311191NE29
胡亂分析一下:
庫函數(shù)還是最大苦手,急待優(yōu)化。
IO部分沒再過多折騰,用的是114514年前的HT總線。沒有PCIe直出。
好消息是核心部分真的不在受制于人了,壞消息是周邊外設(shè)也就是個ARM水平。
無論如何,是個很了不起的進步。
公開回復下評論區(qū)某些帶有偏見的先生:
某些先生選擇的負載場景(運行游戲)其實是帶有相當大的偏見的:
游戲所使用的更多為SIMD指令,更吃翻譯性能損失,單純選擇性以游戲性能說事其實是相當局限的。
相比之下,筆者所測試的某業(yè)務(wù)運行軟件(閉源、停止維護、推測以傳統(tǒng)整數(shù)性能為主)在3A6000上運行的翻譯效率則大致相當于E5V2到E5V3之間——正好是該軟件原部署服務(wù)器的CPU。
因此,關(guān)于翻譯效率究竟能達到何種地步,依然是要具體問題具體分析的,至少就我們業(yè)務(wù)應(yīng)用來說,效率是相當?shù)膲蛴谩?/p>
(當然下一代系統(tǒng)不需要二進制翻譯就能原生部署,那就是另一個問題了)
編輯于 2023-11-30 18:29
評論回復

天馬行空
龍芯能運行 x86 上的應(yīng)用?
11-29 · IP 屬地四川
22 條回復

硫離子
作者
有wine,打一打老游戲還是沒問題的,更新的游戲還在測試中。

11-29 · IP 屬地山東

Matterhorn

直接運行肯定不行。通過wine+x86翻譯部分程序勉強能跑,但是效率不太高,目前x86翻譯效率大概是原生性能的30%左右,大概也就LGA 775 P4的水平,看你的接收程度,十幾年前的部分單機游戲跑起來還可以,對性能要求高的就沒法搞了
11-29 · IP 屬地浙江

硫離子
作者
Matterhorn
老一代輻射沒問題,正在試輻射4,不如P4是某些人刻意構(gòu)造的偏見性留言,當電子寵物看看就行。
11-29 · IP 屬地山東

硫離子
作者
Matterhorn
目前來說我傾向于這玩意翻譯后等效性能大致相當于E5V1-E5V2。
11-29 · IP 屬地山東

Matterhorn

硫離子
那是原生性能,原生性能差不多等價3代酷睿i7,或者略低于10100或4790K,翻譯性能現(xiàn)在基本就30%的水平,基本也就后期P4的水準了
11-29 · IP 屬地浙江

Matterhorn

硫離子
至于你為什么會覺得有E5V1-E5V2,主要是因為大部分人裝了windows上的各種安全軟件,尤其是國產(chǎn)的安全軟件,其次老設(shè)備大部分都是小內(nèi)存或機械硬盤,導致大家認為老的Intel U性能比較差。實際上老U+固態(tài)硬盤+大內(nèi)存裝linux性能一點都不差。
典型舉個例子,之前有人和我犟,q9650沒法開大幾十個網(wǎng)頁+B站播放視頻,他覺得會卡,結(jié)果我用q9650開了大幾十個網(wǎng)頁+B站視頻,CPU占有率才十幾

11-29 · IP 屬地浙江

gooong
Matterhorn
后期P4比三代i7那也是頻率低不少,核心少3個,IPC稀爛的存在啊

p4怎么可能有三代i7 30%水平
11-29 · IP 屬地江蘇

Matterhorn

gooong
多核性能肯定沒有,我說辭不嚴謹,應(yīng)該說單核性能
11-29 · IP 屬地浙江

硫離子
作者
Matterhorn
至于我所說的相當于E5V1-V2,很遺憾那就是轉(zhuǎn)譯性能,是基于我業(yè)務(wù)運行相關(guān)軟件性能測試所得出的結(jié)論,原生性能目前我的測試結(jié)果是于不亞于ZEN2
11-29 · IP 屬地山東

硫離子
作者
Matterhorn
備注:以上性能均為單核性能
11-29 · IP 屬地山東

硫離子
作者
Matterhorn
我認為您所預設(shè)的使用場景存在較為嚴重的偏倚,不符合我們業(yè)務(wù)中所使用的實際場景。
11-29 · IP 屬地山東
Matterhorn
硫離子
老游戲都是走單核,尤其是2010年前的老游戲,都是單核優(yōu)化為主,所以以你跑游老游戲的場景來說這樣對比并不偏倚。要驗證這個問題很簡單,你把6000轉(zhuǎn)譯后能跑的最吃性能游戲列出來,我來用pd 950來跑,看看能不能跑的起來。
另外之前小胖實際上也測試過,6000轉(zhuǎn)譯跑鬼泣4 卡的不行,鬼泣4的最低要求可就Core2 Duo 2.4Ghz。pd 950 IPC是酷睿e系列的一半左右左右,3.4Ghz的pd差不多等價e系列1.8-1.9Ghz的樣子
11-30 · IP 屬地浙江
Matterhorn
硫離子
應(yīng)該是鬼泣4特別版,打錯字了,鬼泣4對性能要求很低的
11-30 · IP 屬地浙江
Matterhorn
硫離子
另外你玩的輻射新維加斯,是2010年的老游戲,推薦的CPU也才Core Dual2.0Ghz而已,這個性能pd 950跑跑一點問題都沒有的
11-30 · IP 屬地浙江
硫離子
作者
Matterhorn
大致思考了一下您的問題所在:考慮到您的能力有限,您只對游戲這個場景進行了選擇性的測試,而忽視了其他應(yīng)用場景的性能表現(xiàn)。事實上游戲的負載特性跟我們業(yè)務(wù)應(yīng)用的負載特性差異是很大的。
11-30 · IP 屬地山東
硫離子
作者
Matterhorn
事實上,“只測游戲”這個選擇本身就存在著嚴重的偏倚,甚至可以說是完全偏離了我們所應(yīng)用的業(yè)務(wù)場景,我想這也是我們最大的分歧所在。
11-30 · IP 屬地山東
硫離子
作者
Matterhorn
我又思考了一下您提的這個問題。目前來看loongarch翻譯的短板應(yīng)該集中在SIMD上,而游戲中需要使用大量SIMD指令,因此這個現(xiàn)象相比之下較為突出,而我們的工作負載并沒有使用多少SIMD指令,所以說相比之下翻譯結(jié)果好看的多。
11-30 · IP 屬地山東

Matterhorn

硫離子
你知道為什么龍芯x86轉(zhuǎn)譯性能上不去不?這個要從這幾個方面來說:
1、龍芯宣傳原生性能的時候,是開了微架構(gòu)專屬優(yōu)化的,而x86二進制代碼顯然不可能用6000的微架構(gòu)做專屬優(yōu)化;
微架構(gòu)優(yōu)化這個東西對當前微架構(gòu)是有性能提升的,但是對于非本架構(gòu)大多數(shù)時候是負面作用。但是對于龍芯目前不好評論好壞,龍芯桌面和服務(wù)器目前就6000(la664)和5000(la464)兩種微架構(gòu),從規(guī)劃看3b6000架構(gòu)不會大改,而7000目前的規(guī)劃微架構(gòu)也不會大改,主要是工藝提升,所以2-3年內(nèi),這個優(yōu)化對la664或小改版本會一直有效。至于5000實際上并不重要,5000出貨量很?。煌瑯訉Ψgx86性能無效;
如何驗證龍芯的微架構(gòu)優(yōu)化,你可以用如下的參數(shù)去編譯spec等跑分程序,可以發(fā)現(xiàn)開啟微架構(gòu)優(yōu)化的test2可以提升12.3%左右性能:
loongson 3A6000 Test1 ->
GCC 8.3 -Ofast -static -flto -march=loongarch64 -mtune=loongarch64 -mlsx -mlasx -funroll-all-loops
loongson 3A6000 Test2 ->
GCC 8.3 -Ofast -static -flto -mcond-move-int -mforce-drap -mvecarg -march=la664 -mtune=la664
-msimd=lasx -ftree-vectorize -funroll-all-loops
intel和AMD實際上也有微架構(gòu)專屬優(yōu)化,但是一般不怎么使用,因為x86這邊歷史包袱重,有各種各樣的歷史微架構(gòu),而微架構(gòu)優(yōu)化對其他微架構(gòu)是有負面作用的。
2、龍芯內(nèi)部有個未公開源碼的gcc,用這個gcc編譯的spec跑分會比用龍芯官網(wǎng)下的gcc編譯的spec跑分高7%;而x86顯然不可能用龍芯優(yōu)化后的gcc來編譯
3、loongarch指令集本身的優(yōu)化,你要知道x86、MIPS這些指令集實際上是個古董,而loongarch是新設(shè)計的,所以在指令密度上loongarch天然有優(yōu)勢,按照龍芯相關(guān)論文,loongarch平均指令密度比MIPS要高7%,但是如果你翻譯x86,就得接受x86又臭又長的歷史包袱,你的優(yōu)勢就沒了
所以即使龍芯真能實現(xiàn)宣傳的80%翻譯性能,實際上對外表現(xiàn)最多也就原生性能的60%(減掉微架構(gòu)專屬優(yōu)化12.3%,減掉loongarch指令密度帶來的7%)
所以這個也就是為什么龍芯原生性能很強,但是一到了x86翻譯,卻怎么也達不到預期的80%翻譯性能,甚至80%的一半很多時候都達不到
11-30 · IP 屬地浙江

Matterhorn

硫離子
你的回復被知乎吃了
12-01 · IP 屬地浙江

硫離子
作者
Matterhorn
我這里能看到欸

12-01 · IP 屬地山東

Matterhorn
我關(guān)注的人

硫離子
硫離子回復了回答下你的評論· 12:59
該內(nèi)容被刪除
該內(nèi)容被刪除
硫離子回復了回答下你的評論· 12:58
我國自主研發(fā)的新一代通用處理器龍芯 3A6000 在京發(fā)布,具有怎樣的意義?還有哪些信息值得關(guān)注?
<p>我這里能看到欸

</p>
又被吃了....
12-01 · IP 屬地浙江

Randname
有翻譯專用指令集,有翻譯支持包,裝完直接就能運行x86軟件。
12-03 · IP 屬地遼寧
117 條評論
默認
最新

紅茶劍客
核心部分不再受制于人就行,其他的慢慢來,加油
11-28 · IP 屬地黑龍江

HJ教育家
加油!
11-28 · IP 屬地陜西

像風自在飛
政府機關(guān)和事業(yè)單位必須要帶頭用起來,才能慢慢把生態(tài)完善。期待單位電腦全換國產(chǎn)

11-29 · IP 屬地未知

為了嗚喵王
像風自在飛
因為政府部門從好幾年開始就開始換國產(chǎn)芯片的電腦了
11-29 · IP 屬地重慶

等你到荼蘼
實際上政府部門(信創(chuàng))龍芯的份額反而降低了。
11-29 · IP 屬地天津

藍精靈
單核性能不是比一代的R7 1700強? 1700我都用著蠻爽,那龍芯拿來辦公、游戲、視頻也毫無問題! 當然要是推出8C16T、16C32T面向消費市場的就更完美了!
11-28 · IP 屬地重慶

馬鹿
性能家用夠了,主要是生態(tài)。
11-28 · IP 屬地山東

不打碼
主要是頻率,ipc性能挺好了。目前最大的問題是主頻,但是能超,華碩給開發(fā)了主板,能干到3.5G可用性很強了,如果到時候來個小改款,能弄到4G,那就是純純現(xiàn)代CPU了
11-28 · IP 屬地廣東

不禪
發(fā)動機都造出來了,還擔心剎車油門造不出???
11-29 · IP 屬地北京
gooong
AMD:不僅造不出,還能搞二仙橋倒退呢
。這些玩意吧,遲早能造出來只不過也不是天上掉下來的
11-29 · IP 屬地江蘇
HuHuHugo
看了最新的華碩3a6000的主板,超頻到3g,功耗才不到一百w,可惜最高只給3g,如果能超頻到3.5,估計不到兩百w能成,這次的提升真的很巨大
11-29 · IP 屬地廣東
HuHuHugo
到月亮的距離
對的,我覺得如果后續(xù)升級BIOS的話,最多上到3.5。4g的話很難,這是指數(shù)級的上升。
12-01 · IP 屬地廣東
到月亮的距離
HuHuHugo
已經(jīng)拿到解3G頻率的BIOS了,常規(guī)散熱上4G應(yīng)該不可能了
12-01 · IP 屬地山東
軍民團結(jié)如一人
龍芯跑coremark一般,相當于3g的skylake
11-28 · IP 屬地北京
硫離子
作者
我懷疑他編譯器優(yōu)化水平拖后腿了,coremark很吃編譯器優(yōu)化
11-28 · IP 屬地山東
硫離子
作者
事實上你強制性開-O0他甚至能頂一下ZEN3,但是開-O3馬上拉跨,所以說我認為它編譯器還有很大的優(yōu)化空間可走。
11-28 · IP 屬地山東
我去找那個誰
不說民用,就那么多國企政府的使用量就夠搭半套生態(tài)的吧。包括摩爾得顯卡,目前國產(chǎn)電腦的核心顯卡處理器都已經(jīng)到了18年初的中高端水準了。對比1800x+1080。速度還是不錯的,記得疫情間的那個處理器才到二代酷睿。。。
11-29 · IP 屬地江蘇
Lear-gooze
我不太懂啊,請問CISC和RISC比同頻性能是合理的嗎?或者說,這種比較能說明哪些問題?
11-28 · IP 屬地上海
Eidosper
我關(guān)注的人
現(xiàn)在所有cpu內(nèi)部都是risc,區(qū)別只是前端譯碼電路。
主頻和流水線層數(shù)、工藝有關(guān)系,和x86這種6發(fā)射深流水線的設(shè)計比同頻應(yīng)該不是特別合理,但龍芯也沒有蘋果那樣弄9發(fā)射,所以比起來也不是特別合理。
11-28 · IP 屬地四川
硫離子
作者
Eidosper
畢竟老胡還是偏學術(shù)風
11-29 · IP 屬地山東
Jason
這玩意怎么玩 輻射:新維加斯?
11-28 · IP 屬地美國
硫離子
作者
wine轉(zhuǎn)譯
11-29 · IP 屬地山東
蒙脫石
Zhangs
這不就回了
11-29 · IP 屬地河南