擁有大模型無需從零開始!詳解WAIC2023鎮(zhèn)館之寶Amazon Bedrock
作者:郝俊慧 來源:IT時報
Bedrock(基巖),地理學(xué)中,它是地表層的堅硬巖層,很難被開采;《我的世界》里,它是最基礎(chǔ)的方塊,不可被破壞;而在2023年世界人工智能大會(WAIC2023)上,它是亞馬遜云科技帶來的鎮(zhèn)館之寶——基礎(chǔ)大模型云服務(wù)。
今年4月發(fā)布的Amazon Bedrock,是亞馬遜云科技在生成式AI領(lǐng)域的重要布局。之所以稱為“云服務(wù)”而不僅僅是“大模型”,在于其不僅提供亞馬遜云科技自己的模型Amazon Titan,還提供初創(chuàng)公司AI21 Labs、Anthropic,以及Stability AI的基礎(chǔ)模型服務(wù)的訪問,核心功能在于幫助開發(fā)者能夠輕松定制模型,并構(gòu)建屬于自己的生成式AI應(yīng)用程序。
不久前召開的WAIC2023上,亞馬遜云科技生成式AI產(chǎn)品研究院院長Sherry Marcus向中國用戶詳解Amazon Bedrock。

“大模型家族”組團服務(wù)
“絕大多數(shù)的客戶并不需要自己從零開始來訓(xùn)練模型。”對于大模型的應(yīng)用場景,Sherry Marcus開宗明義,認(rèn)為不能依賴一個萬能的、單一的大型語言模型來應(yīng)對各種任務(wù),“正確的做法應(yīng)該是,客戶可以訪問多個模型,然后根據(jù)自己的需求和數(shù)據(jù)來定制自己的模型。”
當(dāng)用戶進入Amazon Bedrock官網(wǎng)時,可能只需點擊幾次,便可以找到適合自己的模型服務(wù)。
首先是選擇基礎(chǔ)模型。Amazon Bedrock提供了一個“大模型家族”,為客戶提供已經(jīng)訓(xùn)練過的預(yù)訓(xùn)練模型。
其中Amazon Titan系列基礎(chǔ)模型包括Titan Text和Titan Embeddings,Titan Text可以從簡單的自然語言命令生成文本,適用于撰寫博客、電子郵件、文檔摘要、開放式問答和信息提取等各種應(yīng)用;Titan Embeddings可以為搜索、異常檢測和個性化等應(yīng)用程序生成文本嵌入。
當(dāng)然也可以選擇其他公司預(yù)訓(xùn)練的大模型,AI21 Labs是多語言大語言模型,用于對話問答、工作流自動化,Stable Diffusion更是“文生圖”的頂流,虛擬生成的人像畫質(zhì)堪比高清相機。
選擇基礎(chǔ)模型之后,便進入微調(diào)階段,只要將提示詞發(fā)送到模型,由Amazon Bedrock自動部署基礎(chǔ)模型進行推理。
“客戶可以根據(jù)自身需求,在大語言模型的基礎(chǔ)之上,進行專業(yè)化或者專門化模型的構(gòu)建,并且使用自己的數(shù)據(jù),這樣在享受大模型豐富度的同時,也可以體驗小模型帶來的快速迭代?!盨herry Marcus解釋,通過微調(diào),客戶可以最大限度提高特定任務(wù)的準(zhǔn)確性,只需使用20個示例標(biāo)記便可以實現(xiàn)任務(wù)準(zhǔn)確性,與基礎(chǔ)模型相比,這些定制化模型風(fēng)格各異,更適合銀行、旅行和醫(yī)療等消費場景。

“芯片全家桶”解決算力難題
對于全球云服務(wù)商而言,ChatGPT是一個新的“Game?Changer”(規(guī)則制定者),提供以基礎(chǔ)模型云服務(wù)為主的Maas(大模型即服務(wù))將是云商下半場主要戰(zhàn)術(shù)已毋庸置疑。
目前,除了亞馬遜云科技,國內(nèi)的華為云、騰訊云等云商均已提出要為客戶提供“大模型超市”,而商湯、科大訊飛等擁有強大自主算力的AI公司,也很可能要來分一杯羹。
在這場由AIGC引發(fā)的創(chuàng)新浪潮中,算力將是關(guān)鍵的勝負手,不僅僅是緊缺的算力資源,還要有高度彈性化的算力供給能力。
WAIC 2023前一周,亞馬遜云科技中國峰會落幕,彼時亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建拿出了一張亞馬遜自研芯片“全家?!保鹤鳛閬嗰R遜云科技第一款自研芯片,Amazon Nitro實現(xiàn)了高度輕量化的虛擬化,而基于ARM 架構(gòu)的CPU芯片 Amazon Graviton,可以讓F1一級方程式賽車的開發(fā)速度提速70%。
當(dāng)然,用于機器學(xué)習(xí)訓(xùn)練和推理的芯片Amazon Trainium和Amazon Inferentia更受關(guān)注。據(jù)陳曉建介紹,基于Trainium的Trn1實例(云計算基礎(chǔ)計算單元)和通用的GPU實例對比,在訓(xùn)練吞吐率上面,單節(jié)點可以提升1.2倍,而多節(jié)點集群的吞吐率可以提升1.5倍,從成本考慮,單節(jié)點成本可以降低1.8倍,集群成本更是可降低2.3倍。
針對需要集群訓(xùn)練的大模型,亞馬遜可以用3萬張Trainium芯片構(gòu)建一個EC2 UltraCluster超大集群,使用戶可以獲得云上6 EFlops(每秒100億億次浮點計算)的訓(xùn)練超算能力。
ChatGPT帶來的英偉達浪潮,使世人目光均聚焦于A100、H100等明星芯片,然而,在實際應(yīng)用中,推理芯片才是“吞金獸”。原因很簡單,訓(xùn)練往往只是階段性服務(wù),而推理是7×24在線不中斷的服務(wù),對客戶來說,推理芯片的吞吐率、延遲率、成本都很重要。
陳曉建舉例稱,在為Stable Diffusion 2.1服務(wù)時,Inferentia 2可節(jié)約50%成本,另一個提供AIGC視頻剪輯的“當(dāng)紅炸子雞”Runway,通過Inferentia 2獲得了兩倍吞吐率的提升。Sherry Marcus透露,通過Trainium和Inferentia,推理性價比提高了40%,數(shù)據(jù)吞吐量增加了四倍。
通過Amazon Bedrock提供基礎(chǔ)大模型服務(wù)和以自研芯片確保算力能力,亞馬遜云科技試圖以低成本和加速的方式,解答更多人對于這場由AI創(chuàng)新帶來的困惑。
“重塑”千行百業(yè)
“基礎(chǔ)模型擁有巨大的潛力,但我們?nèi)蕴幵诔跫夒A段?!眮嗰R遜云科技數(shù)據(jù)庫、數(shù)據(jù)分析和機器學(xué)習(xí)全球副總裁Swami Sivasubramanian此前曾表示,基礎(chǔ)模型多樣化會推動新一波創(chuàng)新浪潮。
盡管這波浪潮只“潮起”了8個月,一頭扎進來的云服務(wù)商、AI服務(wù)商和企業(yè)客戶卻已初見紅利。亞馬遜云科技在金融、醫(yī)療、外貿(mào)、制藥等行業(yè)均有合作落地案例。
在醫(yī)療和生命科學(xué)領(lǐng)域,生成式AI將對制藥、臨床試驗和醫(yī)療實踐等整個價值鏈產(chǎn)生巨大影響,包括設(shè)計和合成新蛋白質(zhì)序列、預(yù)測藥物效果和副作用、識別患者風(fēng)險因素、提供個性化護理方法,甚至合成患者和醫(yī)療數(shù)據(jù)進行模擬研究。
亞馬遜云科技大中華區(qū)機器學(xué)習(xí)產(chǎn)品總監(jiān)張洋介紹,飛利浦醫(yī)療與亞馬遜云科技合作,將飛利浦醫(yī)學(xué)影像系統(tǒng) Philips HealthSuite Imaging 影像平臺的服務(wù)部署在云端,并通過使用基于 Amazon Bedrock 的基礎(chǔ)模型(Foundation Models)加速開發(fā)基于云計算的生成式人工智能應(yīng)用,提供臨床決策支持,實現(xiàn)更準(zhǔn)確的診斷。在國內(nèi),也有醫(yī)療客戶已經(jīng)在利用Stable Diffusion助力生成大分子。
跨境廣告和互聯(lián)網(wǎng)廣告中的DSP也已經(jīng)有類似案例落地。張洋以眼鏡銷售舉例,之前智能制作一個眼鏡廣告,只能上一個眼鏡,或者請模特拍攝,需要花費大量的時間和精力,還可能涉及到版權(quán),如今利用AIGC進行合成戴眼鏡的模特,這個模型的推理速度是提升了270%,從原來每分鐘1.5張圖像加速到4張圖像,在有限流量和成本下獲得更多的轉(zhuǎn)化。
“AIGC將重塑大量客戶體驗和應(yīng)用程序,”Sherry Marcus認(rèn)為,人類當(dāng)前面臨的最大挑戰(zhàn),正是如何理解AIGC能夠給各行業(yè)轉(zhuǎn)型帶來的影響,“我們可以將眼光放得更遠一點,看它未來會帶來怎樣的顛覆式創(chuàng)新?!?/p>