RISC-V公測(cè)平臺(tái)發(fā)布 · Stream帶寬完整測(cè)試
RISC-V公測(cè)平臺(tái)Stream程序路徑:/public/benchmark/stream/5.10
前言
"Stream" 是一種基準(zhǔn)測(cè)試工具,用于評(píng)估計(jì)算機(jī)系統(tǒng)的內(nèi)存帶寬性能。它通過(guò)模擬內(nèi)存訪問(wèn)模式,測(cè)試系統(tǒng)在讀取和寫(xiě)入連續(xù)內(nèi)存塊時(shí)的速度,衡量系統(tǒng)的內(nèi)存性能和數(shù)據(jù)傳輸效率。
平臺(tái)環(huán)境



參數(shù)含義
我們先來(lái)了解下測(cè)試參數(shù)的具體用法。
1. ARRAY_SIZE:
用于指定測(cè)試期間使用的數(shù)組大小。該參數(shù)定義了測(cè)試中要操作的內(nèi)存塊的大小,通常以字節(jié)為單位。通過(guò)更改 array_size 的值,可以評(píng)估系統(tǒng)在不同內(nèi)存工作負(fù)載下的性能表現(xiàn),關(guān)于設(shè)置的大小,我們可以從官網(wǎng)上查看到說(shuō)明:
The general rule for STREAM is that each array must be at least 4x the size of the sum of all the last-level caches used in the run.
Useful links:
https://www.cs.virginia.edu/stream/ref.html#runrules
也就是我們需要設(shè)置為最后一級(jí)緩存總和的 4 倍。
2. OpenMP :
-gcc編譯器添加“-fopenmp” 選項(xiàng)多線程支持。
單線程Stream測(cè)試
我們的L3 Cache大小是64M,參考官方文檔的建議,為了測(cè)試的準(zhǔn)確性,選取了4倍大小的數(shù)據(jù),也就是數(shù)組大小33554432作為基準(zhǔn),以2621440為梯度,依次增加數(shù)組大小,考察數(shù)組大小對(duì)測(cè)試結(jié)果的影響。選用的是gcc編譯器。
單線程測(cè)試命令:
測(cè)試結(jié)果如下表:


多線程Stream測(cè)試
和單線程Stream測(cè)試一樣,同樣可以做不同數(shù)組大小的多線程Stream 測(cè)試,選取的數(shù)組大小和單線程一樣。
測(cè)試結(jié)果如下表:


結(jié)論

從結(jié)果可以看出,多核測(cè)試的結(jié)果明顯高于單核測(cè)試的結(jié)果。多核測(cè)試?yán)昧硕鄠€(gè)處理核心并行執(zhí)行任務(wù),從而表現(xiàn)出更大的數(shù)據(jù)帶寬。在多核測(cè)試中,Copy操作的性能是單核測(cè)試的大約5倍,Scale操作的性能約為單核測(cè)試的6倍。
綜上所述,多核測(cè)試在Copy和Scale操作中顯示出了明顯的性能優(yōu)勢(shì),而在Add和Triad操作中的性能提升較小。這與多核處理器的并行處理能力和數(shù)據(jù)依賴性有關(guān)。多核測(cè)試結(jié)果顯示出了多核處理器在并行計(jì)算和數(shù)據(jù)處理方面的優(yōu)勢(shì)。
正文完

看完Stream的測(cè)試報(bào)告,有沒(méi)有一種沖動(dòng)自己來(lái)試一試呢?64核RISC-V高性能處理器公共測(cè)試云平臺(tái)持續(xù)開(kāi)放中,歡迎廣大開(kāi)發(fā)者朋友參與進(jìn)來(lái)(加群后可找管理員申請(qǐng)SUDO權(quán)限)。
加入微信討論群:加iYuta-R2為好友后可拉入群。
加入QQ討論群:906962594(RVBoards·Only RISC-V)
對(duì)平臺(tái)有任何的疑問(wèn)都可以查閱《快速使用指南》(實(shí)時(shí)更新),也可以加群一起討論。
64核RISC-V高性能處理器公共測(cè)試云平臺(tái) · 快速使用指南https://www.kdocs.cn/l/cmnYcyFIlVRx