從NVIDIA顯卡芯片仿真說起,探索芯片設(shè)計奧秘!附芯片仿真資料
導(dǎo)讀:3月14日消息,據(jù)中國臺灣《工商時報》報道,為應(yīng)對地緣政治風(fēng)險,戴爾計劃在2026年排除中國大陸芯片設(shè)計廠商及中國大陸制造的芯片。

一、顯卡的芯片仿真問題
我國芯片行業(yè)卡脖子,主要是在于高端制程領(lǐng)域。國內(nèi)最高制程能力是14nm,但受限制裁只也能制造不能量產(chǎn)。正因如此,國外的一些高端芯片我們根本沒法自行生產(chǎn),并且在美國的封鎖下,有一些可能成功苗頭的公司很快就會被美國上了禁令而遭受重創(chuàng)。
顯卡芯片就是一種利用高制程才能獲得高性能典型。在人工智能、大數(shù)據(jù)等計算需求旺盛的時代,顯卡暢銷,推動NVIDIA這樣的頂級顯卡公司股票飛漲。A100是NVIDIA的暢銷卡代表,7nm的制程。在這張卡里除了制造問題外,設(shè)計也是有很多學(xué)問和困難。
這張卡中心是芯片,利用2.5D封裝將6個HBM(High bandwidth memory)和一顆GPU合封在interposer上面,并且將芯片molding一起,然后背面磨掉露出硅來散熱。這里面有散熱,力學(xué)以及信號完整性等各種問題。

該卡是全長全高(Full length full height) form factor, 300W功耗,雙卡槽風(fēng)冷或者單卡槽水冷。尺寸和功耗是確定散熱方法最重要的參數(shù)。通常散熱仿真需要把從熱源開始到散熱器全部建模,原因是需要構(gòu)建最重要的熱通路,熱通路的特點(diǎn)就是熱阻相對最小熱流密度最大的導(dǎo)熱路徑。在構(gòu)建過程中,所有會影響熱通路熱阻的特征都要仔細(xì)建模。比如硅背面和散熱器之間的導(dǎo)熱硅脂,是可能有很大熱阻的。熱量主要導(dǎo)熱路徑就是從GPU通過導(dǎo)熱硅脂到散熱器過程。當(dāng)然還有個對熱極其敏感的HBM在旁邊。

HBM是個多層的器件,利用TSV(Through silicon via)和Microbump將每一層DRAM器件連接在一起。每一層的Microbump需要有underfill或者molding保護(hù)。這多層異質(zhì)結(jié)構(gòu)會引起內(nèi)部應(yīng)力以及散熱問題,因為每層之間由于保護(hù)材料導(dǎo)熱極差(小于1W/m.K),不管選擇從上面還是下面導(dǎo)熱,另外一邊的層都需要經(jīng)過多層microbump層而導(dǎo)致熱阻極大,多層之間溫差大而應(yīng)力大導(dǎo)致HBM性能不穩(wěn)定甚至失效。
說到應(yīng)力,是屬于力學(xué)范疇,就不能不說翹曲。翹曲分析是封裝設(shè)計必須做的評估。翹曲指的是由于異質(zhì)結(jié)構(gòu)的CTE(Coefficient of temperature expansion)不同,整個封裝會在升溫或者降溫過程下導(dǎo)致bump焊接面的不平,bump會有斷開、虛焊、橋接接等各種問題,最終導(dǎo)致焊接失敗或者失效。焊接問題是封裝失效的主要問題,也是大量工程師和科研人員研究的問題。

最后這樣一個高性能計算顯卡(high-performance computing (HPC) graphics card),芯片計算過程中需要隨時與HBM進(jìn)行數(shù)據(jù)交換,同時整個卡與背板的交換機(jī)(Switch)也需要高速通信,使用PCIe Gen4的協(xié)議。這些所謂的高速都是指data rate,即每秒的傳輸量,單位是GB/s。速率提高會帶來信號完整性問題(Signal Integrity),導(dǎo)致接收器件不知道信號發(fā)生器件在說什么。GPU和HBM的通信協(xié)議和GPU與switch的通信協(xié)議是不同的,因為使用場景不同。GPU與Switch之間由于路程較長,損耗較大,PCIe的協(xié)議有彌補(bǔ)大損耗的特點(diǎn),而且通道數(shù)量并不多,因為大量的通道數(shù)會占用大量板上面積以及IO數(shù)量。GPU和HBM之間協(xié)議則可以使用大量通道數(shù)量,單個通道不需要太高,因為通過interposer走線線寬可以很窄,從而節(jié)約面積。但它們共同特點(diǎn)是都不會有太多margin,需要非常仔細(xì)的仿真與校核,保證項目成功落地。

A100的技術(shù)難點(diǎn)并不只是在芯片的制造上面,更多的多領(lǐng)域工程師配合完成的作品?,F(xiàn)在摩爾定律將要達(dá)到極限,高制程的神話或許即將終結(jié),我國的芯片發(fā)展也是遇到百年難遇的契機(jī)。

二、芯片設(shè)計仿真技術(shù)
現(xiàn)在Chiplet的封裝方案被認(rèn)定為延續(xù)摩爾定律的最佳解決方案,也是利用interposer將各個不同功能芯片封裝在一起,做出多層功能芯片利用TSV連接在,被稱為3D封裝。HBM就是一種3D封裝,不過是屬于小規(guī)模的3D封裝,大規(guī)模的3D封裝中熱、應(yīng)力以及信號完整性問題會更加嚴(yán)峻,等待有經(jīng)驗的工程師去解決。
3月23日至4月20日,仿真秀將邀請芯片行業(yè)資深的芯片封裝工程師帶來6場講座,一起探索芯片設(shè)計、結(jié)構(gòu)散熱、SIPI和EMC仿真解決方案。請點(diǎn)擊文尾閱讀原文報名任意報告觀看或回放。

報告一:ECAD導(dǎo)入芯片結(jié)構(gòu)及熱仿真技術(shù)專題
報告時間:3月23日19時30分
主講嘉賓:曾家麟? ?中央大學(xué)機(jī)械工程博士,仿真秀專欄作者,某知名廠商仿真團(tuán)隊技術(shù)總監(jiān),加拿大國研院計算中心訪問學(xué)者/西門子流體仿真顧問 ,從事ANSYS CFD及CAE等仿真技術(shù)近20年。歷任國內(nèi)外電子廠及系統(tǒng)廠仿真設(shè)計主持人,并從事科研單位合作,培養(yǎng)國內(nèi)仿真水平,針對結(jié)構(gòu)、流體、熱傳及多物理場耦合相關(guān)應(yīng)用具備豐富客戶與設(shè)計經(jīng)驗,熟知產(chǎn)業(yè)結(jié)構(gòu)痛點(diǎn)、流體設(shè)計及散熱議題,并具備上百個客戶項目經(jīng)驗。目前職司國內(nèi)知名廠商工程技術(shù)團(tuán)隊負(fù)責(zé)人,協(xié)助解決客戶各方面仿真應(yīng)用問題。

用戶得到:通過本講座,用戶可以清晰芯片級仿真系統(tǒng)中ECAD如何導(dǎo)入Icepak做熱仿真,及熱仿真相應(yīng)耦合入Mechanical做結(jié)構(gòu)計算,如翹曲等問題。相關(guān)的設(shè)置及技巧也會在分享中逐一解釋與呈現(xiàn)。
ANSYS ECAD技術(shù)介紹
Icepak ECAD熱仿真方法
Mechanical ECAD結(jié)構(gòu)仿真方法
電路/熱/結(jié)構(gòu)聯(lián)合仿真技術(shù)
如何報名:(掃碼報名支持朋友圈分享觀看)
報告二:芯片封裝基板設(shè)計專題
報告時間:3月30日19時30分
主講嘉賓:Jacky_楊,桂林電子科技大學(xué)碩士,仿真秀專欄作者,主要從事封裝基板設(shè)計,包括封裝基板設(shè)計(2-10層以上,包括BT基板和ABF板,框架(傳統(tǒng)QFN框架和MiS框架設(shè)計),仿真包括封裝熱仿真(輸出熱阻和結(jié)溫等),封裝應(yīng)力仿真(包括封裝翹曲和應(yīng)力等),電仿真(包括信號完整性和電源完整性等);熟悉國內(nèi)外多家基板廠工藝能力和封裝工藝能力,參與的封裝基板項目包括WB-LGA設(shè)計、WB-BGA設(shè)計、FC-BGA設(shè)計、WB-FCBGA設(shè)計、POP設(shè)計、堆疊設(shè)計、埋入設(shè)計等,其中覆蓋的產(chǎn)品類型包括軍工、醫(yī)療、電源等。

用戶得到:講座主要圍繞項目前期如何進(jìn)行基板評估以及評估需要注意事項等,另外,還介紹了國內(nèi)基板廠通用的基板設(shè)計規(guī)范和封裝設(shè)計規(guī)范,最后展示實際案例成果。
報告三:散熱仿真在封裝中的應(yīng)用
報告時間:4月8日19時30分
主講嘉賓:驚堂木? ?電子封裝系碩士,仿真秀專欄作者,某知名芯片廠封裝仿真工程師,熟悉封裝領(lǐng)域散熱設(shè)計與應(yīng)力仿真。

用戶得到:講座將分享芯片封裝領(lǐng)域的一些熱仿真研究的內(nèi)容。JEDEC熱阻測試標(biāo)準(zhǔn)與熱仿真模型; 單芯片熱阻網(wǎng)絡(luò)模型的應(yīng)用與熱阻網(wǎng)絡(luò)的提取; 瞬態(tài)熱仿真與瞬態(tài)熱阻的應(yīng)用; 最后分析一些常見封裝散熱優(yōu)化方案。
JEDEC 熱測試標(biāo)準(zhǔn)解讀與對應(yīng)熱仿真模型;
封裝中復(fù)雜熱阻網(wǎng)絡(luò)模型提取與應(yīng)用;
封裝瞬態(tài)熱阻(R-C熱阻抗)介紹;
封裝散熱優(yōu)化方案分享。
報告四:芯片SIPI/EMC仿真關(guān)鍵技術(shù)和解決方案
報告時間:4月15日19時30分
主講嘉賓:張宗兵,高級電磁應(yīng)用工程師,仿真秀專欄作者,研究生學(xué)歷,多年電磁CAE工程經(jīng)驗,畢業(yè)于西安電子科技大學(xué),無線電物理專業(yè),計算電磁學(xué)方向,師從郭立新教授,高級職稱,工作前幾年專門設(shè)計電磁產(chǎn)品,包括天線,濾波器,連接器,耦合器,阻容感,芯片等等微波部件,后工作于ANSYS業(yè)務(wù)專門做電磁產(chǎn)品技術(shù)支持,任高級電磁應(yīng)用工程師,解決大量電磁仿真及EMC設(shè)計仿真問題。

用戶得到:講座將以當(dāng)前芯片研發(fā)為背景,介紹信號電源完整性內(nèi)容,芯片關(guān)鍵仿真技術(shù)及目前背景下芯片的仿真解決方案,最后通過ANSYS軟件對芯片封裝進(jìn)行操作組裝展示。
(1)學(xué)習(xí)芯片關(guān)鍵仿真技術(shù)(2)學(xué)習(xí)ANSYS芯片仿真方案(3)學(xué)習(xí)信號電源完整性相關(guān)知識
報告五:5G高速互連仿真技術(shù)與射頻毫米波PCB設(shè)計
報告時間:4月20日19時30分
主講嘉賓:林超文,實戰(zhàn)型高速PCB設(shè)計專家,仿真秀專欄作者,深圳市英達(dá)維諾電路科技有限公司總經(jīng)理,著有《Altium designer實戰(zhàn)攻略與高速PCB設(shè)計》、《高速高密度PCB設(shè)計攻略》等多本PCB工程技術(shù)著作。
擅長高速高密度PCB設(shè)計,并高效指導(dǎo)研發(fā)人員開展高速PCB設(shè)計,提高產(chǎn)品開發(fā)效率、提升產(chǎn)品設(shè)計質(zhì)量。通過長期不懈的學(xué)習(xí)、探索與總結(jié),已初步形成了一套系統(tǒng)化高速PCB設(shè)計的實踐經(jīng)驗及理論。目前專注于為企業(yè)提供信號完整性設(shè)計、PCB Layout設(shè)計、高速PCB設(shè)計及仿真培訓(xùn)等服務(wù),已為百余家企業(yè)提供信號完整性設(shè)計及培訓(xùn)服務(wù)。

用戶得到:在PCB設(shè)計中,學(xué)習(xí)PCB工程師需要考慮的因素,學(xué)習(xí)PCB工程師與傳統(tǒng)硬件工程師有何不同,學(xué)習(xí)PCB設(shè)計主要原則,讓用戶具備高速高密度PCB設(shè)計的整體思路 ,并且學(xué)習(xí)電源完整性仿真技術(shù)的應(yīng)用,和理解并掌握5G及射頻PCB設(shè)計要點(diǎn),學(xué)習(xí)公司設(shè)計規(guī)范的完善等。
報告六:DFM仿真分析加速IC應(yīng)用測試驗證
報告時間:4月26日19時30分
主講嘉賓:劉久軒 上海望友信息科技有限公司NPI技術(shù)總監(jiān),仿真秀專欄作者,擁有十五年以上的電子制造行業(yè)工作經(jīng)驗,熟悉電路板設(shè)計和裝配制造工藝流程,曾主導(dǎo)或參與客戶電裝智能制造方案服務(wù)實施200多家,對NPI工具理解深刻,具有豐富的DFx應(yīng)用和體系實施經(jīng)驗。

通過本講座,用戶可以學(xué)習(xí)ECAD數(shù)據(jù)如何導(dǎo)入DFM軟件進(jìn)行高效開短路分析,及IC在單板上的虛擬測試驗證分析方法。相關(guān)線路分析規(guī)則、可制造性工藝知識分享。
DFM支持的ECAD數(shù)據(jù)類型
集成電路開短路分析方法
DFM仿真分析方法
DFM與EDA交互
報告七:Sherlock電子產(chǎn)品可靠性分析技術(shù)專題
報告時間:4月25日19時30分
主講嘉賓:李桂花,安世亞太高級結(jié)構(gòu)工程師,寧波大學(xué)工程力學(xué)碩士,主要負(fù)責(zé)ANSYS結(jié)構(gòu)仿真軟件在機(jī)械、電子等行業(yè)推廣和應(yīng)用,服務(wù)于行業(yè)內(nèi)多家知名企業(yè)如伊頓電氣、哈曼電子、泰科電子、安波福等,曾參與過重型機(jī)械預(yù)緊分析、醫(yī)療儀器成型分析、電子插拔件分析、ECU電子產(chǎn)品抗振分析等多個項目,從事CAE行業(yè)近十年,協(xié)助多家行業(yè)客戶解決各類仿真技術(shù)問題,對ANSYS結(jié)構(gòu)軟件有豐富的使用和行業(yè)應(yīng)用經(jīng)驗。
用戶得到:Sherlock是基于失效物理的電子產(chǎn)品可靠性分析軟件,主要用于解決板級和系統(tǒng)級封裝可靠性問題。通過本講座,用戶可以詳細(xì)了解Sherlock軟件可靠性分析功能如焊點(diǎn)疲勞、振動、沖擊等;以及Sherlock如何進(jìn)行焊點(diǎn)疲勞仿真和系統(tǒng)級振動仿真計算流程。(1)Sherlock軟件可靠性分析技術(shù)介紹(2)Sherlock焊點(diǎn)疲勞仿真方法
(3)Sherlock/Mechanical聯(lián)合仿真技術(shù)
掃碼報名觀看回放
三、芯片設(shè)計仿真學(xué)習(xí)路線
在芯片設(shè)計過程中,物理仿真是非常重要的一環(huán),它可以幫助設(shè)計人員在芯片設(shè)計前預(yù)測芯片的性能、穩(wěn)定性和可靠性,從而優(yōu)化設(shè)計、減少試錯成本。
1、物理仿真的應(yīng)用主要有以下幾個方面:
(1)設(shè)計驗證:通過對芯片的物理仿真:可以驗證設(shè)計的正確性,檢查是否存在設(shè)計缺陷或潛在的問題。在這個階段,設(shè)計人員通常會使用電路仿真軟件,比如SPICE(Simulation Program with Integrated Circuit Emphasis)等。
(2)電磁兼容性(EMC):在芯片設(shè)計中,需要考慮到芯片與其他電子設(shè)備的互相干擾問題。通過物理仿真,可以對芯片進(jìn)行EMC分析,預(yù)測芯片的輻射和敏感性,從而進(jìn)行優(yōu)化和調(diào)整。
(3)熱分析:芯片在工作過程中會產(chǎn)生熱量,熱量的積累會影響芯片的性能和壽命。通過熱仿真,可以模擬芯片在工作狀態(tài)下的溫度分布,從而優(yōu)化散熱設(shè)計和材料選擇。
(4)可靠性分析:芯片在使用過程中需要具備一定的可靠性。通過物理仿真,可以模擬芯片在不同工作狀態(tài)下的壽命和可靠性,從而評估設(shè)計的合理性。
2、在進(jìn)行物理仿真時,需要掌握以下幾種技術(shù):
(1)電路仿真技術(shù):電路仿真是最基本的仿真技術(shù),通過對電路的電學(xué)特性進(jìn)行仿真,可以驗證電路的性能、可靠性和穩(wěn)定性。
(2)有限元分析技術(shù):有限元分析(Finite Element Analysis,F(xiàn)EA)可以對芯片的機(jī)械、熱力學(xué)和電磁學(xué)特性進(jìn)行仿真分析,包括芯片的應(yīng)力、應(yīng)變、熱量分布、電磁場分布等。
(3)計算流體力學(xué)技術(shù):計算流體力學(xué)(Computational Fluid?Dynamics,CFD)可以對芯片周圍的空氣流動進(jìn)行仿真,從而預(yù)測芯片的散熱情況。
(4)可靠性分析技術(shù):可靠性分析技術(shù)可以對芯片的壽命、可靠性和故障率進(jìn)行仿真分析,包括加速壽命測試(Accelerated Life Testing, ALT)和失效模式和效應(yīng)分析(Failure Mode and Effects Analysis,F(xiàn)MEA)等。
3、芯片設(shè)計好內(nèi)容
自2019年以來,仿真秀平臺持續(xù)致力于仿真優(yōu)質(zhì)內(nèi)容的創(chuàng)作,尤其是芯片設(shè)計相關(guān)內(nèi)容,一直在探索芯片設(shè)計仿真學(xué)習(xí)路線,希望能夠幫助芯片設(shè)計仿真學(xué)習(xí)者更高效的學(xué)習(xí)和掌握相關(guān)技能。
聲明:以上直播均在仿真秀官網(wǎng)觀看