最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

4070Ti顯卡的深度學(xué)習(xí)性能測試和結(jié)論

2023-02-23 14:18 作者:千夜明  | 我要投稿

環(huán)境:

  • pytorch環(huán)境:conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6 -c pytorch -c conda-forge

  • 測試代碼:霹靂吧啦Wz的GitHub中的swin-L和FastRCNN。


4070Ti顯卡深度學(xué)習(xí)模型個(gè)人測試結(jié)果

swin-L模型單位是 圖像/秒,F(xiàn)astRCNN模型單位是 秒/圖像


備注1:主流顯卡的測評分

? time spy跑分參考:https://www.gpu-monkey.com/en/gpu_benchmark-3dmark_time_spy_and_fire_strike-5


備注2:其他顯卡的測試性能(SSD模型,F(xiàn)P32訓(xùn)練)

https://lambdalabs.com/gpu-benchmarks

備注3:另一個(gè)網(wǎng)站上的綜合評分

https://mtli.github.io/gpubench/

備注4:各類GPU的FP16和FP8訓(xùn)練和推理性能

https://timdettmers.com/2023/01/30/which-gpu-for-deep-learning/#Raw_Performance_Ranking_of_GPUs(國內(nèi)有很多此篇文章的完整翻譯)

感覺備注4和我真實(shí)測試的有較大差異,F(xiàn)P16的訓(xùn)練,4070ti竟然和2080Ti幾乎一樣,不知道為什么作者會得出此結(jié)論。


個(gè)人總結(jié)

  1. timespy 4K跑分非常適合深度學(xué)習(xí)性能評估:作為經(jīng)過本人驗(yàn)證,4070ti的深度學(xué)習(xí)性能(FP32訓(xùn)練和推理)相對1080T和2080T顯卡的差異,幾乎跟time spy 4K跑分差異幾乎一致。至于FP16和FP8,還未測試。

  2. 操作系統(tǒng)基本不影響顯卡深度學(xué)習(xí)性能:Ubuntu 22.04和win11系統(tǒng)下,4070ti的訓(xùn)練和推理速度幾乎一模一樣。

  3. 12G顯存是硬傷:4070T相對3090速度上并不差,只是顯存12G真的是硬傷,分類網(wǎng)絡(luò)swin-L的batchsize都只能設(shè)為8(圖像224*224)。


4070Ti顯卡的深度學(xué)習(xí)性能測試和結(jié)論的評論 (共 條)

分享到微博請遵守國家法律
伊春市| 方山县| 景宁| 星座| 樟树市| 凌海市| 武清区| 京山县| 永平县| 周口市| 富川| 万源市| 高安市| 治多县| 额尔古纳市| 莱州市| 宁津县| 府谷县| 眉山市| 汉寿县| 泰顺县| 武清区| 奉贤区| 上栗县| 利川市| 辽中县| 商丘市| 晋江市| 深水埗区| 桐梓县| 德兴市| 张家口市| 微博| 磐安县| 甘洛县| 新密市| 临桂县| 凯里市| 孝感市| 平和县| 丹巴县|