生產(chǎn)力&游戲性我全都要——2023年4月的一次主機(jī)DIY配置記錄(一)
摘要?
作為一名計(jì)算機(jī)專業(yè)的學(xué)子,想要追上AI浪潮,生產(chǎn)力工具得跟上。本文將重點(diǎn)介紹up主用于深度學(xué)習(xí)兼游戲的電腦配置以及各配件選擇原因,配置確定時間為2023.4.26,性價(jià)比不高,僅供參考。
關(guān)鍵詞:? DIY;裝機(jī);配置單;深度學(xué)習(xí);2.4萬預(yù)算?

Abstract
As a student majoring in computer science and technology, I have to upgrade my productivity tools?to?ride?the tide of?Artificial Intelligence.?This paper aims at introducing my?new computer specs for deep learning as well as entertainment and the reason why I choose these components. The specs list has a?deadline of?April 26, 2023, which?is not very economical?and?only for your information.
Keywords:??DIY · computer building ·?computer specifications/specs list?· deep learning (DL)?·?a?budget of ¥24,000


一、前言 Introduction
近年來,以深度學(xué)習(xí)為代表的神經(jīng)網(wǎng)絡(luò)進(jìn)入了井噴式發(fā)展階段,ChatGPT等AI大模型遍地開花,AI翻唱、AI繪畫也走進(jìn)了大眾的視野。作為一名計(jì)算機(jī)專業(yè)的研0學(xué)子,想要研究深度學(xué)習(xí),必然需要一臺強(qiáng)大的計(jì)算機(jī)(尤其需要強(qiáng)力顯卡)作為支撐,我已經(jīng)受夠了1batch1batch地跑訓(xùn)練數(shù)據(jù)、一跑跑一下午的感覺了,這次下血本爭取換未來3年的高質(zhì)量生活
在準(zhǔn)備好了擬錄取所需的材料并忙完了手頭的任務(wù)之后,我花了大約兩周的時間收集資料、研究配置和各種參數(shù),終于在五一節(jié)前下完了單。你問我為啥不等618?一是早買早享受,省下的錢相當(dāng)于換一個月的體驗(yàn)(說實(shí)話能省多少我也沒個底,因?yàn)槲疫@幾年很少網(wǎng)購,到時候瞅一眼),二是錯峰或許能減少意外發(fā)生率(五一錯峰了個寂寞)
配置單(作業(yè))主要參考(抄)了某乎befreedoma[1]和Leo Leung[2]的經(jīng)驗(yàn)貼,再結(jié)合自身需求與產(chǎn)品現(xiàn)狀改進(jìn)而來,非常感謝大佬們的分享!
接下來,我將依次對自己進(jìn)行需求分析,介紹各配件的參數(shù)以及我選擇時的心路歷程,文末將附上配置單和參考資料
注意:本文無意做任何產(chǎn)品推薦!不做推薦!不做推薦!只是記錄下這段經(jīng)歷和查找的資料。還有請不要問up為什么選A不選B,問就是爺樂意,再問就是愛的供養(yǎng)
如果這些選擇中日后有令我后悔的選項(xiàng),那么會在系列文章的最后一篇末作打臉回顧
全文預(yù)計(jì)分四篇增量交付,這里先開個坑

二、需求分析?Requirement?Analysis
¥0
預(yù)算:¥24,000
總指導(dǎo)原則:木桶原理(追求各硬件滿足需求且性能相對均衡)
2.1 生產(chǎn)力需求 ☆☆☆☆☆
各硬件對于深度學(xué)習(xí)(DL)性能的影響程度大致如下[2]:
GPU>>主板&CPU>>內(nèi)存>硬盤>電源(帶的動別炸就行)>機(jī)箱(裝得下就行)
2.1.1?GPU要求
對于NLP的深度學(xué)習(xí)來說,顯卡的顯存大小至關(guān)重要,尤其是跑大語言模型。24G顯存就能跑復(fù)旦開源的MOSS大模型[3]或者在港科大開源的LMFlow[4]上訓(xùn)練LLaMA-7b模型了,而12G效果可能就不太好(或者就直接爆顯存了)。

此外,根據(jù)千夜明的觀點(diǎn),顯卡的帶寬、CUDA核心數(shù)、核心頻率也會影響深度學(xué)習(xí)的模型訓(xùn)練速度[5]。CV方向好像更吃CUDA核(我這塊沒仔細(xì)研究,歡迎大佬指正)
至于是否需要搭建工作站(兩張3090之類),個人計(jì)劃組建這臺機(jī)子用于日常學(xué)習(xí),各種模型跑著玩玩,不是跑實(shí)驗(yàn)用,而且對于游戲來說,多顯卡的性價(jià)比不高[6],故采用單顯卡方案
2.1.2 CPU要求
根據(jù)煉丹術(shù)師程序Faith的實(shí)驗(yàn)結(jié)論,深度學(xué)習(xí)單顯卡16線程的CPU就基本夠用[7]
CPU頻率增加,深度學(xué)習(xí)效率也會對應(yīng)提升
2.1.3 內(nèi)存(RAM)要求
一般而言,內(nèi)存大小應(yīng)匹配顯存大小[8],但如果是處理大型數(shù)據(jù)集的場景,可能會因?yàn)榇娣糯罅恐虚g結(jié)果需要更多的內(nèi)存。
故參考深度學(xué)習(xí)用內(nèi)存的一般經(jīng)驗(yàn)法則[9]:
內(nèi)存大小 ≈?125%顯存大小
按24G顯存來算,32G就足以應(yīng)對一般場景了~
內(nèi)存頻率是噱頭,性能提升寥寥無幾[8],不作考慮。
2.1.4 硬盤要求
大的機(jī)械硬盤(HDD)來裝大數(shù)據(jù)集(建議≥3T),固態(tài)硬盤(SSD)來裝軟件、程序、小數(shù)據(jù)集[8]

2.2 游戲需求?☆☆☆
2.2.1 GPU要求
如果對游戲性能有高要求,則選擇消費(fèi)級顯卡。因?yàn)橄M(fèi)級顯卡針對DirectX進(jìn)行了優(yōu)化,渲染顯現(xiàn)速度快[1]。
2.2.2 CPU要求
游戲性搭配4090,13600KF以上沒有性能瓶頸[10]
2.2.3?內(nèi)存要求
游戲性DDR5頻率越高越好,選性價(jià)比高的即可[1]
32G內(nèi)存足以應(yīng)對主流游戲
2.2.4 硬盤要求
SSD裝操作系統(tǒng)、軟件和游戲,HDD裝系統(tǒng)備份和其他文件

2.3 其他需求?☆
2.3.1 外觀需求
我喜歡“保守”的風(fēng)格,不需要RGB燈,對最近流行的“海景房”機(jī)箱也不感興趣。
2.3.2 靜音需求
盡可能在不影響散熱情況下,減輕運(yùn)行時的噪音,因?yàn)榭赡芤獛У剿奚幔赡埽?/span>
2.3.3?剪輯需求
能流暢使用Adobe全家桶就行(之前剪UnderMine視頻時經(jīng)常性卡頓)
2.3.4?直播需求
在流暢玩游戲的基礎(chǔ)上,同時處理影像串流,需要系統(tǒng)額外分配一部分的CPU和GPU資源
網(wǎng)絡(luò)方面需要穩(wěn)定的網(wǎng)絡(luò)環(huán)境,以及更高的上傳速率(之前直播游戲卡得播不了QAQ)
外設(shè)方面需要額外購置耳機(jī)、攝像頭,可能還要麥克風(fēng)、獨(dú)立聲卡(這部分暫時擱置,等我裝完機(jī)先)

三、顯卡選擇
3.1 廠商選擇
深度學(xué)習(xí)領(lǐng)域,基本是N卡一家獨(dú)大(因?yàn)橛袃?yōu)秀的硬件架構(gòu),完善的軟件生態(tài),更重要的是有CUDA硬件加速[11]),而其他兩家還在努力追趕,所以目前顯卡廠商的選擇是一道單選題

3.2 型號選擇
從算力角度來看,4090真香![12]
從顯存角度來看,除去4090外,在24G顯存的消費(fèi)級顯卡中,3090可能是不錯的選擇,此外22G顯存的魔改版2080ti也能作為入門的選擇[1]
知名測評博主Tim Dettmers做了一張GPU選購流程圖[13],在消費(fèi)級顯卡中也是首選RTX4090

所以,在預(yù)算充足的情況下,我毅然決然地選擇了RTX 4090,比起3090避免了礦卡的風(fēng)險(xiǎn),比起4070Ti多了顯存容量和顯存位寬。

3.3 參數(shù)解讀
上面提到了顯卡的部分參數(shù),這里簡單解釋一下

3.3.1?CUDA核心/流處理器
CUDA(Compute Unified Device Architecture 統(tǒng)一計(jì)算設(shè)備架構(gòu)),是由NVIDIA推出的通用并行計(jì)算架構(gòu),是一種讓N卡GPU能完成通用計(jì)算任務(wù)的集成技術(shù)。CUDA支持多種編程語言,基于CUDA的編程可以為數(shù)據(jù)吞吐量大的計(jì)算工作提供很好的加速功能。
流處理器(SP,streaming processor),在編程角度稱為CUDA核心,是N卡GPU中最基本的處理單元。它有兩個重要參數(shù),核心數(shù)量和核心頻率
如果把顯卡比作小白兔奶糖的包裝車間(處理前的數(shù)據(jù)可以是糖塊,處理后的數(shù)據(jù)可以是包裝好的奶糖),那么CUDA核心數(shù)/流處理器數(shù)就是車間的員工數(shù)量,CUDA核心頻率就是車間員工的干活效率
3.3.2?顯存容量/顯卡內(nèi)存容量
顯存用來存儲顯卡芯片處理前后的渲染數(shù)據(jù),顯存容量決定著顯存能臨時存儲多少數(shù)據(jù)。
繼續(xù)沿用奶糖車間的比喻,這就是車間倉庫的大小
單位:字節(jié)?Byte
3.3.3?顯存帶寬與顯存位寬
顯存位寬:顯存在一個時鐘周期內(nèi)所能傳送數(shù)據(jù)的位數(shù),位數(shù)越大則瞬間所能傳輸?shù)臄?shù)據(jù)量越大。我們假設(shè)車間只有一輛斗車,這就是車車容量,即單次能送往倉庫的奶糖數(shù)或拉回車間的糖塊數(shù)。
單位:比特 bit
顯存頻率:這就是車車每秒能運(yùn)輸?shù)拇螖?shù),反映了車車的車速。
單位:赫茲 Hz
顯存帶寬:顯示芯片與顯存之間的數(shù)據(jù)傳輸速率,這就是車車每秒的運(yùn)輸量,反映了倉庫和車間的運(yùn)輸效率。
單位:字節(jié)每秒 Byte/s
換算公式:顯存帶寬 = 顯存頻率 × 顯存位寬 / 8
CPU、GPU都能參與計(jì)算,那它倆是什么關(guān)系呢?
合作關(guān)系。CPU負(fù)責(zé)處理邏輯復(fù)雜的串行程序,GPU重點(diǎn)處理數(shù)據(jù)密集型的并行計(jì)算程序,從而發(fā)揮CPU+GPU異構(gòu)計(jì)算平臺的最大功效。GPU只能替CPU分擔(dān)工作,而非取代CPU[14]
不難看出,在其他參數(shù)不變時,以上單項(xiàng)參數(shù)都是越高越好

3.4 品牌選擇
考慮品牌無非從五大方面入手:散熱、性能、售后、外觀、價(jià)格[15]
散熱上:綜合各大平臺對4090的評價(jià),你會發(fā)現(xiàn)“散熱過?!币辉~頻繁出現(xiàn),只要機(jī)箱散熱通道正常,GPU溫度很難到達(dá)溫度墻
性能上:差距很小,據(jù)說大約3%~5%
售后上:保修方式大多是個人送保,也有經(jīng)銷商代保,保修年限2~4年
外觀上:蘿卜白菜各有所愛,有燈無燈,黑的白的
價(jià)格上:滿足以上需求的同時,價(jià)格越低越好
對我個人而言,外觀上基本沒有需求。所以,我考慮的因素只剩性能、售后和價(jià)格。
性能和價(jià)格綜合起來就是性價(jià)比。一般而言,各品牌同級別的顯卡性能處于同一梯隊(duì)(參考視頻[16]的綜合排名)。雖然不少文章都推薦無腦丐版,但我偏不想選丐版(哎就是玩)。在權(quán)衡各級別4090價(jià)位后,計(jì)劃購買主流級/次旗艦顯卡(再往上旗艦級普遍比次旗艦貴1~2k,個人認(rèn)為不值得)
售后方面,參考了各品牌顯卡級別定位圖[17],又在貼吧、論壇逛了一圈,大致消息如下。華碩售后的風(fēng)評最好,但是價(jià)格也很高(所謂售后也是價(jià)格的一部分);七彩虹、索泰售后聽說也不錯;某嘉售后是唯一一個注冊后四年質(zhì)保,但是經(jīng)銷商代保且運(yùn)費(fèi)自付。
綜合考慮后,我選擇了某嘉魔鷹Gaming OC。

附錄一、參考資料 Reference
1. (2023-02-11)【知乎】深度學(xué)習(xí)/AI繪畫煉丹生產(chǎn)力兼游戲性主機(jī)DIY配置詳解
https://zhuanlan.zhihu.com/p/618026401
2. (2023-02-19)【知乎】2023深度學(xué)習(xí)電腦主機(jī)選購指南及配置清單! 實(shí)驗(yàn)室裝機(jī)案例(2月更新)
https://zhuanlan.zhihu.com/p/375807395
3. (2023-04-23)【小黑盒】復(fù)旦ChatGPT:開源MOSS大模型,3090顯卡即可運(yùn)行
https://www.xiaoheihe.cn/community/7214/list/102982764
4. (2023-04-02)【知乎】3090單卡5小時,每個人都能訓(xùn)練專屬ChatGPT,港科大開源LMFlow
https://zhuanlan.zhihu.com/p/618919940
5. (2023-02-23) 4070Ti、4090顯卡的深度學(xué)習(xí)性能測試和結(jié)論

6. (2020-12-13) 【知乎】作為一般的游戲玩家,有必要安裝兩張顯卡嗎?
https://zhuanlan.zhihu.com/p/336668286
7. (2023-01-09)?深度學(xué)習(xí)主機(jī)需要頂級cpu嗎

8.?(2018-12-16) 【國外大神】完全硬件指南:教你 DIY 一套自己的深度學(xué)習(xí)機(jī)器
http://timdettmers.com/2018/12/16/deep-learning-hardware-guide/
9. (2023-02-27)?【百家號】了解深度學(xué)習(xí)和機(jī)器學(xué)習(xí)的內(nèi)存要求
https://baijiahao.baidu.com/s?id=1758953982235676828&wfr=spider&for=pc
10. (2023-02-13) 史上最強(qiáng)!游戲黨必看的CPU顯卡搭配指南!內(nèi)含17款CPU+9款顯卡+6種游戲測試數(shù)據(jù)!

11. (2022-11-18)【知乎】為什么說CUDA是NVIDIA的護(hù)城河?
https://www.zhihu.com/question/564812763/answer/2765282105
12. (2021-12-26)【知乎】深度學(xué)習(xí)用什么顯卡?
https://zhuanlan.zhihu.com/p/450004076?utm_id=0
13.?(2023-01-16)【國外大神】深度學(xué)習(xí)領(lǐng)域的GPU深度測評
https://timdettmers.com/2023/01/16/which-gpu-for-deep-learning/#more-6
(2023-02-01)【翻譯】為深度學(xué)習(xí)購買哪種GPU: 我在深度學(xué)習(xí)中使用GPU的經(jīng)驗(yàn)和建議
https://blog.csdn.net/community_717/article/details/128832907
14. (2020-03-10)?【CSDN】CUDA是什么-CUDA簡介
https://blog.csdn.net/xiaoxiaolibai/article/details/104770046
15. (2023-03-21) 4090半年體驗(yàn)分享!電老虎?呂布騎狗?核心閹割還能買嗎?

16. (2023-02-27) 4090購買指南,35張顯卡超級大橫評(轉(zhuǎn)載)

17. (2022-12-07) 【貼吧】誰可以說一下4090各品牌從高到低的排名呢
https://tieba.baidu.com/photo/p?kw=%E6%98%BE%E5%8D%A1&ie=utf-8&flux=1&tid=8175615328&pic_id=3085b7003af33a8762009dd9835c10385143b5c5
——————沒有用到但是感覺挺好的文章——————
18. (2018-12-03) 【簡書】深度學(xué)習(xí)工作站配置推薦
https://www.jianshu.com/p/1f67a9f55ae7