GPT大模型的技術(shù)棧
大模型的技術(shù)棧 1、基礎(chǔ)設(shè)施,計(jì)算,存儲(chǔ),網(wǎng)絡(luò),核心點(diǎn)在GPU芯片,簡(jiǎn)單概括就是芯片和基于芯片制造服務(wù)器的企業(yè)。芯片美國(guó):(英偉達(dá),AMD,INTEL),中國(guó):(海思,海光,)。算力英偉達(dá)壟斷,占80%以上,AMD占10%左右。海思主要是在中國(guó)市場(chǎng),國(guó)產(chǎn)算力投資80%是海思昇騰算力。 2、大模型訓(xùn)練的軟件平臺(tái), 1)算子加速(cuda,rocM),CANN 2)并行計(jì)算框架(tensorflow,pytorch),飛漿,昇思 大模型訓(xùn)練軟件平臺(tái)英偉達(dá)壟斷,AMD有自己的生態(tài)訓(xùn)練軟件平臺(tái),華為有自己的大模型訓(xùn)練軟件平臺(tái)。 3、大模型訓(xùn)練工程工具M(jìn)Lops,工具五花八門,以開源為主,主要是玩的轉(zhuǎn)也不容易。 4、數(shù)據(jù)樣本,數(shù)據(jù)獲得也不容易,有開源數(shù)據(jù)集,可訓(xùn)練的能力有限,必須有數(shù)據(jù)的獲取能力, 數(shù)據(jù)質(zhì)量要求非常高,中國(guó)只是數(shù)據(jù)量大,質(zhì)量不高。這個(gè)數(shù)據(jù)都在政府手上和大型互聯(lián)網(wǎng)公司手上。 5、大模型訓(xùn)練 算力,數(shù)據(jù),人才都有解決的企業(yè)可以進(jìn)行大模型訓(xùn)練。門檻極高,中國(guó)現(xiàn)在有200個(gè)大模型企業(yè),最后剩下百分之個(gè)位數(shù),基本上就是互聯(lián)網(wǎng)大廠,加1-2開源大模型公司。 6、基于大模型的行業(yè)應(yīng)用 基于通用大模型做行業(yè)調(diào)優(yōu)訓(xùn)練,基于訓(xùn)練的行業(yè)大模型,開發(fā)行業(yè)應(yīng)用,這類項(xiàng)目將百花齊放。