后摩智能發(fā)布鴻途H30:存算一體大算力芯片賦能智能駕駛
"后摩智能是國內(nèi)率先落地存算一體大算力AI芯片的公司。"

本文為IPO早知道原創(chuàng)
作者|Stone Jin
據(jù)IPO早知道消息,后摩智能于2023年5月10日正式發(fā)布首款存算一體智駕芯片——鴻途?H30,最高物理算力 256TOPS,典型功耗 35W。
這意味著,后摩智能成為國內(nèi)率先落地存算一體大算力AI芯片的公司。

后摩智能創(chuàng)始人兼 CEO 吳強表示:“2年前,后摩智能成立,我們堅定地選擇以存算一體的底層架構(gòu)創(chuàng)新,來實現(xiàn) AI 計算效率的極致突破。存算一體架構(gòu)將存儲和計算功能融合,比傳統(tǒng)架構(gòu)更接近人腦的計算方式,具備遠高于傳統(tǒng)方式的計算效率。隨著 GPT 等大模型的出現(xiàn),存算一體芯片越來越受到行業(yè)關(guān)注,我們很高興看到更多創(chuàng)業(yè)公司加入進來,與我們一起推動硬科技的創(chuàng)新與應用?!?/p>
中國電動汽車百人會副理事長兼秘書長張永偉在發(fā)布會上指出,智能駕駛市場規(guī)模龐大,仍處于加速滲透的階段,為新技術(shù)和新企業(yè)提供了創(chuàng)新發(fā)展的巨大機遇。存算一體作為一種創(chuàng)新技術(shù),對工藝制程依賴度低,具有極高的競爭力,為智能駕駛芯片提供了更具前瞻性的技術(shù)路徑選擇。采用多種技術(shù)路徑實現(xiàn)芯片國產(chǎn)化布局,將有利于解決汽車芯片供應鏈中存在的同質(zhì)化競爭問題,助力提升產(chǎn)業(yè)鏈的韌性和供應鏈的安全性。
據(jù)后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮介紹,鴻途?H30 以存算一體創(chuàng)新架構(gòu)實現(xiàn)了六大技術(shù)突破,即大算力、全精度、低功耗、車規(guī)級、可量產(chǎn)、通用性。鴻途?H30 基于 SRAM 存儲介質(zhì),采用數(shù)字存算一體架構(gòu),擁有極低的訪存功耗和超高的計算密度,在 Int8 數(shù)據(jù)精度條件下,其 AI 核心IPU 能效比高達 15Tops/W,是傳統(tǒng)架構(gòu)芯片的7 倍以上。為了更好地實現(xiàn)車規(guī)級,后摩智能基于鴻途?H30 自主研發(fā)了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
同時,為了充分發(fā)揮存算一體帶來的高計算效率,后摩智能面向智能駕駛場景打造了專用 IPU(處理器架構(gòu))——天樞架構(gòu),采用多核、多硬件線程的方式擴展算力,實現(xiàn)了計算效率與算力靈活擴展的完美均衡,AI 計算可以在核內(nèi)完成端到端處理,保證通用性。天樞架構(gòu)的設(shè)計理念源自于庭院式的中國傳統(tǒng)住宅,以大布局設(shè)計保障計算資源利用效率的同時,再進一步結(jié)合現(xiàn)代住宅多層/高層的設(shè)計優(yōu)勢,以多核/多硬件線程的方式靈活擴展算力。
得益于靈活、高效的硬件架構(gòu)設(shè)計,鴻途?H30 實現(xiàn)了性能2倍提升的同時,還降低了50%功耗。

陳亮亦透露,天樞架構(gòu)是后摩智能自主研發(fā)的第一代 IPU(處理器架構(gòu)),第二代天璇架構(gòu)已經(jīng)在研發(fā)中,將采用Mesh 互聯(lián)結(jié)構(gòu),可根據(jù)應用場景的不同配置計算單元的數(shù)量,整體性能、效率和靈活性將進一步躍升,支持多場景應用,例如成本和功耗敏感的智能終端、大模型等場景。第三代天璣架構(gòu)已經(jīng)開始規(guī)劃,將為萬物智能打造。

此外,得益于存算一體的架構(gòu)優(yōu)勢,鴻途?H30基于12nm工藝制程,在 Int8 數(shù)據(jù)精度下實現(xiàn)高達256TOPS的物理算力,所需功耗不超過35W,整個 SoC 能效比達到7.3Tops/W,具有高計算效率、低計算延時、低工藝依賴等特點。在實際性能測試中,鴻途?H30 基于Resnet 50 模型的 Benchmark,在 Batch Size 等于1 和 8 的條件下分別達到了 8700 幀/秒和 10300 幀/秒的性能。
目前,基于鴻途?H30 已成功運行常用的經(jīng)典 CV 網(wǎng)絡(luò)和多種自動駕駛先進網(wǎng)絡(luò),包括當前業(yè)內(nèi)最受關(guān)注的 BEV 網(wǎng)絡(luò)模型以及廣泛應用于高階輔助駕駛領(lǐng)域的 Pointpillar 網(wǎng)絡(luò)模型。以鴻途?H30 打造的智能駕駛解決方案已經(jīng)在合作伙伴的無人小車上完成部署,這是業(yè)界第一次基于存算一體架構(gòu)的芯片成功運行端到端的智能駕駛技術(shù)棧。
本次發(fā)布會上,后摩智能同步推出了基于鴻途?H30 芯片打造的智能駕駛硬件平臺——力馭?。有賴于鴻途?H30極高的計算效率和計算密度,力馭?平臺 CPU 算力高達200 Kdmips,AI 算力高 256Tops,支持多傳感器輸入,能夠為智能駕駛提供更充沛的算力支持,進一步提升了系統(tǒng)的可靠性。力馭?平臺功耗僅為 85W,可采用更加靈活的散熱方式,實現(xiàn)更低成本的便捷部署,有利于推動大算力智能駕駛場景的普及應用。
為了讓客戶擁有更好的產(chǎn)品使用體驗,后摩智能還基于鴻途?H30 芯片自主研發(fā)了一款軟件開發(fā)工具鏈——后摩大道?,支持 PyTorch、TensorFlow 、ONNX 等主流開源框架,編程兼容 CUDA 前端語法,同時支持 SIMD 和 SIMT 兩種編程模型,兼顧運行效率和開發(fā)效率,以無侵入式的底層架構(gòu)創(chuàng)新保障了通用性的同時,進一步實現(xiàn)了鴻途?H30 的高效、易用。
后摩智能聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁信曉旭透露,鴻途?H30 將于6月份開始給 Alpha 客戶送測。同時,后摩智能的第二代產(chǎn)品鴻途?H50 已經(jīng)在全力研發(fā)中,將于2024年推出,支持客戶 2025年的量產(chǎn)車型。