亞馬遜云科技降低生成式AI開發(fā)門檻,賦能經(jīng)濟(jì)社會(huì)發(fā)展
生成式AI技術(shù)無疑是當(dāng)前最大的時(shí)代想象力之一。
?資本、創(chuàng)業(yè)者、普通人都在涌入生成式AI里去一探究竟:“百模大戰(zhàn)”連夜打響,融資規(guī)模連創(chuàng)新高,各種消費(fèi)類產(chǎn)品概念不斷涌現(xiàn)……根據(jù)Bloomberg Intelligence 的報(bào)告,2022年生成式AI 市場(chǎng)規(guī)模僅為400 億美元,預(yù)計(jì)到2032年這一數(shù)字將突破1.3 萬億美元,未來10 年的年均復(fù)合增速高達(dá)42%。
?然而,表面上看著熱鬧非凡,但生成式AI技術(shù)的普及和轉(zhuǎn)化真的有我們想象的那么高嗎?
?在經(jīng)歷了爆發(fā)式增長(zhǎng)之后,6月以來,生成式AI聊天產(chǎn)品訪問量幾乎都出現(xiàn)了不同程度的下降。最新用戶調(diào)查顯示,有80%-90%以上的受訪者表示未來六個(gè)月都完全不會(huì)使用ChatGPT、Bard等聊天工具。從消費(fèi)端看,大家目前似乎更多地把生成式AI產(chǎn)品當(dāng)成了一種追趕時(shí)尚潮流的玩具,而非持續(xù)使用的工具。
?而在企業(yè)端,這樣的現(xiàn)象就更為明顯。一旦人們切換到工作模式時(shí),生成式AI工具便很少出現(xiàn)在大家的工作流程中,甚至還被很多大型公司等明令禁止或限制性使用。
?

?對(duì)于一個(gè)比較成熟技術(shù)的商業(yè)轉(zhuǎn)化來說,6個(gè)多月的時(shí)間并不算短。但目前,關(guān)于生成式AI的狂想焦點(diǎn)似乎仍然還停留在大模型和產(chǎn)品概念上,人們預(yù)期所想看到的繁榮生態(tài)和對(duì)經(jīng)濟(jì)社會(huì)所產(chǎn)生的變革性影響還尚未到來。
?那么,究竟是什么桎梏著它的發(fā)展?
?
?生成式AI的落地之困:如何打破基礎(chǔ)模型和開發(fā)者之間的“墻”?
?所有人都不想錯(cuò)過生成式AI浪潮。但當(dāng)前生成式AI的超高進(jìn)入門檻,把大部分玩家擋在了門外。
?過去這些年來,通過“深度學(xué)習(xí)+大算力”進(jìn)行模型訓(xùn)練是實(shí)現(xiàn)人工智能最主流的技術(shù)途徑。但大模型的商業(yè)化落地,必須得先回到成本核算上。
?首先,大模型對(duì)算力的需求極大,是一個(gè)巨型“吞金獸”。GPT-3.5模型的訓(xùn)練一次的成本約在300萬到460萬美元之間,一些更大的語言模型訓(xùn)練成本甚至高達(dá)1200 萬美元。自研大模型是一個(gè)“無底洞”,不具備雄厚資金實(shí)力的創(chuàng)業(yè)公司根本無法承擔(dān)。
?此外,通用模型并不能解決所有問題,能幫企業(yè)完成的事情非常有限。大模型的訓(xùn)練都是基于互聯(lián)網(wǎng)上的公開數(shù)據(jù)完成,很多產(chǎn)品也相對(duì)孤立沒有形成一個(gè)連貫的、整體的工作流,不具備定制化能力。意味著開發(fā)人員需要結(jié)合私有數(shù)據(jù)做大量個(gè)性化調(diào)試,開發(fā)訓(xùn)練門檻極高。
?而由于前期的巨額投入,就算大模型開始商業(yè)化之后,要實(shí)現(xiàn)盈利也往往需要長(zhǎng)時(shí)間的積累。因此,要想生成式AI技術(shù)真正落地到各行各業(yè)中發(fā)揮效力,當(dāng)前急需一種可負(fù)擔(dān)、高效率、低門檻的解決方案,讓更多人參與到入生成式AI的開發(fā)中來。
?那么,如何才能彌合從基礎(chǔ)模型到終端應(yīng)用之間的鴻溝?目前來看,提供一站式AI專業(yè)托管服務(wù)的云平臺(tái)或許是當(dāng)前的最佳解決路徑。
?云平臺(tái)擁有充足、靈活的算力資源,中小型企業(yè)不必自行購(gòu)買和維護(hù)昂貴的硬件設(shè)備,即可滿足個(gè)性化的開發(fā)需求。用戶可以通過 API和SDK,便捷地調(diào)用云平臺(tái)上的第三方資源和大包服務(wù),將他們的應(yīng)用和服務(wù)與云平臺(tái)無縫銜接,最大化簡(jiǎn)化開發(fā)流程。
?此外,云平臺(tái)還能夠幫助解決數(shù)據(jù)的隱私安全問題。過去幾個(gè)月來,包括蘋果、三星、臺(tái)積電、美國(guó)銀行等很多大型企業(yè)都相繼出臺(tái)相關(guān)政策明令禁止員工使用ChatGP,紛紛開始自研大模型。而對(duì)于那些不具備自研實(shí)力的中小型企業(yè)來說,選擇能夠提供包括數(shù)據(jù)加密、身份驗(yàn)證、合規(guī)性工具等安全措施的云平臺(tái)則是一個(gè)很好的低成本選項(xiàng)。

?針對(duì)當(dāng)前的生成式AI浪潮,云平臺(tái)是否已經(jīng)具備大模型開發(fā)的相當(dāng)能力,能夠提供生成式AI的全流程服務(wù)呢?
?在剛剛落幕的亞馬遜云科技紐約峰會(huì)上,我們看到了一份基于云的生成式AI完整解決方案。
?
?亞馬遜云科技,創(chuàng)建生成式AI普惠新范式
?此次,亞馬遜云科技延續(xù)了過去一貫的“務(wù)實(shí)”風(fēng)格,瞄準(zhǔn)當(dāng)前生成式AI應(yīng)用轉(zhuǎn)化所面臨的痛點(diǎn)問題,上新了一系列全新的功能和服務(wù)。從硬件到軟件,從開發(fā)端到應(yīng)用端,試圖打造一個(gè)功能最全、能力最強(qiáng)的生成式AI服務(wù)平臺(tái)。
Amazon Bedrock服務(wù):搭建生成式AI開發(fā)的“快速通道”
?針對(duì)開發(fā)層面基礎(chǔ)模型訓(xùn)練成本昂貴、環(huán)境部署復(fù)雜的問題,今年4月,亞馬遜云科技首次宣布推出Amazon Bedrock服務(wù),允許用戶通過可擴(kuò)展、可靠且安全的亞馬遜云科技托管服務(wù),用API來便捷地訪問來自不同供應(yīng)商的基礎(chǔ)模型,并利用它們來構(gòu)建生成式AI應(yīng)用程序。
?當(dāng)時(shí),除了自家的Titan大模型之外,首發(fā)第三方合作商及基礎(chǔ)模型還包括AI21 Labs的Jurassic-2,Anthropic的Claude,以及Stability AI的Stable Diffusion。在這次的紐約峰會(huì)上,亞馬遜宣布再次增加前生成式AI領(lǐng)域的最大獨(dú)角獸之一的Cohere作為供應(yīng)商,也新增了包括Anthropic最新的語言模型 Claude 2,和Stability AI最新版文生圖模型套件 Stable Diffusion XL 1.0等基礎(chǔ)模型。
?亞馬遜云科技認(rèn)為,未來一定不會(huì)是一個(gè)模型統(tǒng)管一切,Amazon Bedrock通過不斷集成業(yè)界最領(lǐng)先的基礎(chǔ)模型,用戶將可以根據(jù)自身需求來便捷地調(diào)用最合適的模型。

?但基礎(chǔ)模型有了之后,還有一個(gè)棘手的問題沒有解決——如何使用這些模型進(jìn)行個(gè)性化的應(yīng)用開發(fā)?云平臺(tái)還要進(jìn)一步解決私有數(shù)據(jù)學(xué)習(xí)、系統(tǒng)集成和調(diào)試以及任務(wù)自動(dòng)執(zhí)行的問題。
?舉一個(gè)我們?cè)谌粘I钪薪?jīng)常會(huì)遇到的電商退換貨的例子。你在電商平臺(tái)買了雙鞋子不太滿意想要找客服換一個(gè)顏色,如果此時(shí)客服是ChatGPT等通用聊天機(jī)器人,他會(huì)怎么回答你?——“抱歉,我的訓(xùn)練數(shù)據(jù)截止日期是2021年9月,沒有這雙鞋的相關(guān)信息。”
?要想讓大模型真正發(fā)揮作用,首先要做的就是提前把公司內(nèi)部跟這雙鞋所有有關(guān)的信息都“喂”給模型,包括鞋的型號(hào)顏色、平臺(tái)的退換貨政策、庫(kù)存信息等等,模型才能準(zhǔn)確地給出反饋。在給出信息的同時(shí),還需要AI一邊聊天一邊能在后臺(tái)有序、安全地執(zhí)行有關(guān)換貨的所有操作。
?在過去這對(duì)于開發(fā)者來說是一個(gè)龐大的工程,但現(xiàn)在,亞馬遜新推出了一項(xiàng)名為Amazon Bedrock Agents服務(wù),讓這一切變得觸手可及。
?最新的Amazon Bedrock Agents服務(wù)能夠在基礎(chǔ)模型的基礎(chǔ)上,把對(duì)話的定義、模型外部信息獲取和解析、API調(diào)用、任務(wù)執(zhí)行等打包成為一個(gè)全托管式的服務(wù),從而能夠及時(shí)、有針對(duì)性的輸出結(jié)果。
?如此一來,開發(fā)者不必重巨資從頭開發(fā)自己的基礎(chǔ)模型,也不要花費(fèi)大量的時(shí)間和人力去進(jìn)行模型的個(gè)性化部署和調(diào)試,從而能讓開發(fā)者把更多的精力放在AI應(yīng)用的構(gòu)建和運(yùn)營(yíng)上,讓不具備雄厚資金和技術(shù)實(shí)力的中小型開發(fā)者都可以加入到生成式AI浪潮中來。
“向量數(shù)據(jù)+硬件算力”雙護(hù)航,鑄造應(yīng)用開發(fā)的最強(qiáng)大腦+最強(qiáng)底座
?進(jìn)行模型的定制開發(fā),除了需要如Amazon Bedrock這樣的專業(yè)托管服務(wù),也需要計(jì)算、存儲(chǔ)、安全等其他相關(guān)能力,來保證模型的持續(xù)可用、和迭代升級(jí)。
?毋庸置疑,數(shù)據(jù)是人工智能出現(xiàn)和發(fā)展的基底。生成式AI為了學(xué)習(xí)和理解人類語言的復(fù)雜性,需要大量的訓(xùn)練數(shù)據(jù),而這些訓(xùn)練數(shù)據(jù)通常是以“向量”的形式存在,也就是把自然語言轉(zhuǎn)化為計(jì)算機(jī)可以理解和處理的數(shù)字。
?那么,什么是向量數(shù)據(jù),為什么它對(duì)生成式AI的發(fā)展至關(guān)重要呢?
?假設(shè)你正在使用一個(gè)音樂推薦軟件,我們可以把每首歌分別按照節(jié)奏、歌詞、旋律等三個(gè)特征進(jìn)行量化標(biāo)記,比如第一首歌是(120,60,80),第二首歌是(100,80,70),當(dāng)你告訴系統(tǒng)你喜歡第一首歌的節(jié)奏時(shí),系統(tǒng)便會(huì)找到這首歌的節(jié)奏向量數(shù)據(jù)“120”,在數(shù)據(jù)庫(kù)中查找與這個(gè)向量相似的其他向量,接著再把有相似特征的歌曲推薦給你。
?當(dāng)然,不止是三維,一個(gè)數(shù)據(jù)還可以被標(biāo)注成更多緯度。在自然語言處理中,使用詞嵌入技術(shù)表示的“詞向量”通常是幾百維的,而在圖像處理中,使用像素值表示的圖像向量可能有數(shù)千到數(shù)百萬的維度。被“向量化”之后的數(shù)據(jù)將被存儲(chǔ)在向量數(shù)據(jù)庫(kù)之中,在高維空間中去高效地檢索和生成最相關(guān)或最相似的數(shù)據(jù)。
?然而,要將數(shù)據(jù)進(jìn)行向量化處理和儲(chǔ)存并不是一件容易的事,往往要耗費(fèi)大量的人力和時(shí)間。針對(duì)這一問題,亞馬遜云科技此次推出了適用于 Amazon OpenSearch Serverless 的向量引擎,該向量引擎能夠支持簡(jiǎn)單的 API 調(diào)用,可用于存儲(chǔ)和查詢數(shù)十億個(gè) Embeddings(將高維度的數(shù)據(jù)映射到低維度空間的過程)。亞馬遜云科技還表示,未來所有亞馬遜云科技的數(shù)據(jù)庫(kù)都將具有向量功能,在AI數(shù)據(jù)層面成為開發(fā)者的“最強(qiáng)大腦”。
?

?除了向量引擎的支持,在算力層面,亞馬遜云科技也一直致力于構(gòu)建低成本、低延遲的云上基礎(chǔ)設(shè)施。
?亞馬遜云科技和英偉達(dá)合作已超過12年,為人工智能、機(jī)器學(xué)習(xí)、圖形、游戲和高性能計(jì)算等各種應(yīng)用提供了大規(guī)模、低成本的 GPU 解決方案,在交付基于 GPU 的實(shí)例方面擁有無比豐富的經(jīng)驗(yàn)。此次,亞馬遜云科技展示了最新基于英偉達(dá) H100 Tensor Core GPU 提供支持的P5實(shí)例,能夠?qū)崿F(xiàn)更低的延遲和高效的橫向擴(kuò)展性能。
?P5 實(shí)例將是第一個(gè)利用亞馬遜云科技第二代 Amazon Elastic Fabric Adapter(EFA)網(wǎng)絡(luò)技術(shù)的 GPU 實(shí)例。與上一代相比,P5實(shí)例的訓(xùn)練時(shí)間最多可縮短6倍,從幾天縮短到幾小時(shí),這一性能提升將幫助客戶降低高達(dá)40%的訓(xùn)練成本。借助第二代 Amazon EFA,用戶能夠?qū)⑵?P5 實(shí)例擴(kuò)展到超過 2 萬個(gè)英偉達(dá) H100 GPU,為包括初創(chuàng)公司、大企業(yè)在內(nèi)的所有規(guī)??蛻籼峁┧璧某?jí)計(jì)算能力。
降低生成式AI門檻,用產(chǎn)品最大化賦能用戶
?除了面向生成式AI開發(fā)的工具和平臺(tái)之外,在企業(yè)的日常運(yùn)營(yíng)之中需要一些能夠拿來即用的生成式AI產(chǎn)品,來幫助提升工作和管理效率。關(guān)于這一點(diǎn),亞馬遜云科技也陸續(xù)推出了一些在工作場(chǎng)景中直接可以使用的產(chǎn)品,這些產(chǎn)品既覆蓋底層開發(fā)人員也關(guān)注到了企業(yè)中大量的非技術(shù)人員。
?比如在代碼開發(fā)領(lǐng)域,自從亞馬遜云科技在去年6月首次推出AI編程助手Amazon CodeWhisperer之后,現(xiàn)在該功能已經(jīng)成為了很多開發(fā)者日常必備工具之一。
?Amazon CodeWhisperer基于幾十億行開源代碼訓(xùn)練,可以根據(jù)代碼注釋和現(xiàn)有代碼實(shí)時(shí)生成代碼建議,另外還能進(jìn)行安全漏洞掃描。目前支持包括 Python、Java 和 JavaScript 15 種編程語言和包括 VS Code、IntelliJ IDEA、JupyterLab 和 Amazon SageMaker Studio等集成開發(fā)環(huán)境。
?為了進(jìn)一步提高開發(fā)效率,在紐約峰會(huì)上,亞馬遜云科技正式宣布 Amazon Glue Studio Notebooks 也能支持 Amazon CodeWhisperer。通過 Amazon Glue Studio Notebooks,開發(fā)人員可以用自然語言編寫特定任務(wù),接著Amazon CodeWhisperer 可以直接在 Notebooks 中推薦一個(gè)或多個(gè)可完成此任務(wù)的代碼片段,供開發(fā)人員直接使用和編輯。

Amazon CodeWhisperer支持語言和環(huán)境,圖片來自亞馬遜云科技官網(wǎng)
?而對(duì)于非開發(fā)類工作場(chǎng)景,通過將 Amazon Bedrock的大語言模型能力與支持自然語言問答的 Amazon QuickSight Q 相結(jié)合,為用戶提供了基于生成式AI的商業(yè)智能新服務(wù)。
?比如你是一個(gè)財(cái)務(wù)分析師,你可以像跟ChatGPT聊天一樣用自然語言下達(dá)命令,在幾秒鐘內(nèi)Amazon QuickSight Q就能完成搜索關(guān)鍵財(cái)務(wù)信息或創(chuàng)建公司財(cái)務(wù)可視化圖表的操作,同時(shí)還能幫你總結(jié)出趨勢(shì)特點(diǎn)并提出建議。
?類似拿來即用的產(chǎn)品還有幫助企業(yè)打破內(nèi)部信息孤島、加快數(shù)據(jù)驅(qū)動(dòng)決策的Amazon Entity Resolution,以及能夠幫助醫(yī)療軟件供應(yīng)商便捷地構(gòu)建基于生成式AI的臨床應(yīng)用程序的Amazon HealthScribe等等,在各行各業(yè)擴(kuò)大著生成式AI產(chǎn)品的使用場(chǎng)景。
?釋放AI時(shí)代的“云力量”
?生成式AI的發(fā)展需要云,更需要大量基于云的工具和服務(wù)。
?大模型之后,下一階段生成式AI技術(shù)一定會(huì)朝著多樣性和個(gè)性化方向發(fā)展,我們既可以看到比較通用的生產(chǎn)力工具,也會(huì)看到各種瞄準(zhǔn)特定場(chǎng)景的AI產(chǎn)品。而在這個(gè)過程中,云平臺(tái)會(huì)起到越來越關(guān)鍵的作用。
?一方面,云平臺(tái)會(huì)大大降低AI應(yīng)用開發(fā)的門檻。在平臺(tái)的算力和基礎(chǔ)模型支持下,開發(fā)者們基本無需關(guān)心硬件和基礎(chǔ)設(shè)施的問題,從而把更多的時(shí)間和精力放在業(yè)務(wù)和運(yùn)營(yíng)上。另一方面,云平臺(tái)能夠持續(xù)加快AI應(yīng)用的開發(fā)和運(yùn)營(yíng)效率。用戶可以通過直接調(diào)用API的方式進(jìn)行應(yīng)用的開發(fā)和管理,并安全、便捷地在團(tuán)隊(duì)或組織之間共享。
?在云平臺(tái)的助力之下,未來的生成式AI將不再只是一場(chǎng)巨頭才能玩的“燒錢游戲”,更多普通人也將可以坐上牌桌。
?作為云服務(wù)領(lǐng)域的行業(yè)領(lǐng)導(dǎo)者之一,亞馬遜云科技提供了200多種服務(wù),涵蓋了計(jì)算、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、開發(fā)者工具、安全、分析、物聯(lián)網(wǎng)、企業(yè)應(yīng)用等廣泛領(lǐng)域,云基礎(chǔ)設(shè)施覆蓋全球。同時(shí),亞馬遜云科技還是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的領(lǐng)先者,多年來持續(xù)提供和更新著一系列端到端的AI相關(guān)服務(wù),讓開發(fā)者可以靈活、便捷、低成本的開發(fā)和部署生成式AI應(yīng)用。
?此次,亞馬遜云科技發(fā)布生成式AI工具“全家桶”,其核心目的就是要進(jìn)一步降低生成式AI開發(fā)的門檻,讓更多不懂大模型、不懂人工智能的普通人也能快速加入生成式AI的開發(fā)和應(yīng)用之中。
?生成式AI的重要性不在于模型有多大能力有多強(qiáng),更重要的還是如何能夠從基礎(chǔ)模型演變成各個(gè)領(lǐng)域中的具體應(yīng)用,從而賦能整個(gè)經(jīng)濟(jì)社會(huì)的發(fā)展。
?現(xiàn)在,亞馬遜云科技正在成為那個(gè)橋梁。