貪心高性能神經(jīng)網(wǎng)絡(luò)與AI芯片應(yīng)用研修
FPGA芯片
FPGA可編程的陣列(Field-Programmable Gate Array),作為ASIC領(lǐng)域中的一種半定制電路而出現(xiàn),本質(zhì)上是基于無(wú)指令,無(wú)需共享內(nèi)存的體系架構(gòu)創(chuàng)新,滿(mǎn)足了特定場(chǎng)景的需求。
FPGA主要通過(guò)以下手段提升性能、降低時(shí)延;減少能耗、降低成本:
1、 通過(guò)燒入可配置、可反復(fù)刷寫(xiě)的FPGA配置文件來(lái)定義大量門(mén)電路和存儲(chǔ)器間的連線(xiàn)。
2、 通過(guò)配置文件,將FPGA變成不同的處理器,支持各種不同的深度學(xué)習(xí)計(jì)算任務(wù)。
3、 FPGA中的寄存器和片上內(nèi)存,屬于各自的控制邏輯,無(wú)需不必要的沖裁和緩存。
根據(jù)研究發(fā)現(xiàn),對(duì)于大量的矩陣運(yùn)算GPU計(jì)算能力遠(yuǎn)高于FPGA,但是由于FPGA體系結(jié)構(gòu)特點(diǎn),非常適用于低時(shí)延、流式計(jì)算密集型任務(wù)處理。在類(lèi)似海量并發(fā)的云端推斷,比如語(yǔ)音云識(shí)別場(chǎng)景,F(xiàn)PGA相比GPU具備更低計(jì)算時(shí)延的優(yōu)勢(shì),能夠提供更佳的消費(fèi)者體驗(yàn)。
但是,F(xiàn)PGA芯片本質(zhì)上是通過(guò)預(yù)編程的方法來(lái)提升性能的,AI需要處理的內(nèi)容往往是大量非結(jié)構(gòu)化數(shù)據(jù),例如視頻、圖像等,這類(lèi)數(shù)據(jù)很難通過(guò)預(yù)編程的方法得到滿(mǎn)意的結(jié)果。相反,需要通過(guò)人工智能芯片,進(jìn)行大量樣本訓(xùn)練和推理交互,形成算法模型后,集成了AI芯片和算法的智能設(shè)備,才能具備智能推理能力。