全搞定!基于TensorRT的CNN/Transformer/檢測/BEV模型四大部署代碼+CUDA加速!
部署上車!這個詞一定是2023年各大自動駕駛公司的重中之重。通過模型部署優(yōu)化能夠讓我們訓(xùn)練的浮點模型更快地運行在車端硬件上,并且保持高性能!剛開始入坑的小伙伴一定會想并行處理和CUDA是什么?CNN如何部署?Transformer耗時太高怎么辦?NMS太慢怎么辦?后處理優(yōu)化怎么做?BEV模型怎么部署上車?全都是問題,全都是細(xì)節(jié)!
由于自動駕駛涉及的感知模塊非常多,分類、分割、2D/3D檢測、車道線、關(guān)鍵點、跟蹤等等等等,但最終都要經(jīng)過模型部署和優(yōu)化才能實際落地。因此模型的部署和優(yōu)化是自動駕駛,或者說是計算機(jī)視覺領(lǐng)域最有挑戰(zhàn)的方向之一,也是最能體現(xiàn)工程能力的方向!而且隨著國家大力支持新能源汽車行業(yè)的發(fā)展,相關(guān)CV/自動駕駛/智能駕駛創(chuàng)業(yè)公司最近兩年更是扎堆出現(xiàn)。
2023年經(jīng)濟(jì)恢復(fù),各大企業(yè)也加大相關(guān)崗位人才招聘,剛看了某招聘網(wǎng)站,相關(guān)崗位平均月薪已達(dá)到4w,年薪60w。高級崗位年薪百萬的也比比皆是!

學(xué)習(xí)難度大?
這段時間,有很多小伙伴咨詢模型部署的相關(guān)問題,其實我們對模型部署也很感興趣,市面上已有的模型部署相關(guān)學(xué)習(xí)資料質(zhì)量參差不齊,許多同學(xué)在資料搜集和入門學(xué)習(xí)的時候踩了較多坑:
GPU并行處理理解不夠透徹,CUDA編程不知如何下手...
努力看懂了原理,卻不知道應(yīng)該在什么場景使用;
預(yù)期的加速優(yōu)化效果在實測中得出的結(jié)果與預(yù)期差距很大,哪里出了問題,始終查不出來。
自學(xué)過程中會遇到各種各樣的難題,Transformer ONNX轉(zhuǎn)TRT失敗,CUDA和TRT版本不適配,各種segment fault,跑開源代碼遇到問題,找不到解決方案,一個人抓耳撓腮,相信小伙伴們都深有體會;
... ...
在分析大家在學(xué)習(xí)過程中的痛點之后,自動駕駛之心聯(lián)合早稻田大學(xué)韓君博士共同出品了《CUDA加速與TensorRT部署》課程。如果您正想要學(xué)習(xí)模型部署,或者正苦于自己部署的模型掉點嚴(yán)重,不知如何優(yōu)化耗時,同時又缺少項目實戰(zhàn)經(jīng)驗,那么一定要學(xué)習(xí)下這門課,課程內(nèi)容詳細(xì)介紹了并行處理、GPU、CUDA與TensorRT部署實戰(zhàn)。
課程從最基礎(chǔ)的并行處理與GPU體系架構(gòu)開始,進(jìn)而到CUDA與cuDNN入門,編寫自己第一個CUDA程序,再到TensorRT基礎(chǔ)入門和API 使用,實戰(zhàn)涉及分類器部署
(CNN+Transformer)、YOLO系列檢測器部署,更有重磅的BEVFusion模型部署的詳細(xì)講解!課程后續(xù)還計劃增加構(gòu)建TensorRT plugin的流程、詳解TensorRT的Parser、TVM等其他編譯器以及Edge device上的部署!滿滿的干貨,真正做到幫助0基礎(chǔ)的同學(xué)高效學(xué)習(xí),快速掌握每一個知識點,課程大綱如下:

課程特色
CV方向全覆蓋
直擊圖像分類、Transformer、目標(biāo)檢測、BEV感知等模型部署問題,兼顧計算機(jī)視覺領(lǐng)域和自動駕駛領(lǐng)域!
理論結(jié)合實戰(zhàn)
項目實戰(zhàn)和理論結(jié)合,實戰(zhàn)課程的課后配套實戰(zhàn)代碼,隨學(xué)隨練、快速掌握。
共5大實戰(zhàn)項目
課程包括完善的【老師教學(xué)】+【助教答疑】服務(wù),確保每一位小伙伴都能愉快的學(xué)習(xí)知識。
實戰(zhàn)一:CUDA編程、矩陣計算的優(yōu)化、前處理后處理的優(yōu)化、踩坑分享;
實戰(zhàn)二:TensorRT C++ API使用方法介紹與Nsight模型性能分析;
實戰(zhàn)三:分類器的部署與優(yōu)化:CNN部署、Transformer的部署及優(yōu)化;
實戰(zhàn)四:YOLO v8的部署與優(yōu)化:檢測/分割的部署、前/后處理優(yōu)化、模型瓶頸分析與優(yōu)化策略;
實戰(zhàn)五:開源項目BEVFusion的部署與優(yōu)化:BEVFusion框架詳解、NVIDIA-AI-IOT部署B(yǎng)EVFusion及分析!
課件代碼一應(yīng)俱全
細(xì)致的講解,不光要有理論,代碼及實踐也一定要講透徹!通過全套的視頻講解,幫你在腦海中搭建模型的基本框架,徹底搞懂每一個知識點,從而提高寫代碼的效率和速度。


講師介紹
韓君,博士畢業(yè)于早稻田大學(xué),現(xiàn)任早稻田大學(xué)研究員、講師、并隸屬日本某自動駕駛頭部企業(yè)深度學(xué)習(xí)研發(fā)部門。博士期間主攻編譯器優(yōu)化、并行處理、邏輯編程與數(shù)學(xué)驗證。目前從事深度學(xué)習(xí)高性能部署、Transformer硬件開發(fā)、Multi-task training、Active learning、Apollo、Autoware等領(lǐng)域
課程學(xué)后收獲
對TensorRT模型部署有著深入理解,在模型部署和優(yōu)化上有較大提升;
掌握分類、檢測及BEV感知的模型部署與優(yōu)化,深入理解部署優(yōu)化的痛點和難點;
學(xué)完本課程能夠達(dá)到1年左右的模型部署工程師水平;
能夠結(jié)識許多行業(yè)從業(yè)人員與學(xué)習(xí)合作伙伴!
適合人群
計算機(jī)視覺與自動駕駛感知相關(guān)研究方向的本科/碩士/博士;
CV與自動駕駛2D/3D感知相關(guān)算法工程人員;
需要CUDA加速的算法工程人員;
對模型部署與優(yōu)化有需求的小伙伴;
本課程需要具備的基礎(chǔ)
具有一定的python、pyTorch、Makefile、docker基礎(chǔ),熟悉C/C++,熟悉深度學(xué)習(xí)常用的一些基礎(chǔ)算法;
對GPU、CUDA、目標(biāo)檢測、分割、Transformer、BEV感知的應(yīng)用和基礎(chǔ)方案有一定了解;
一定的線性代數(shù)和矩陣論基礎(chǔ);
電腦需要自帶GPU,能夠通過CUDA部署(老師的教學(xué)配置RTX3080 10G,Jeston AGX Xavier);
開課時間與學(xué)習(xí)方式
2023年7月15日正式開始學(xué)習(xí)之路,歷經(jīng)兩個月,離線視頻授課。主講老師在微信學(xué)習(xí)群內(nèi)答疑,對課程中的算法、代碼、環(huán)境配置等問題一一解惑!
課程咨詢
掃碼加入!一起學(xué)習(xí)!

掃碼添加助理咨詢課程!
(微信:AIDriver004)
