生成式AI的價值與機(jī)遇,這家云服務(wù)商給出了詳細(xì)解答
從2022年末一直到2023年上半年,許多人親眼見證了ChatGPT的風(fēng)靡全球,以及生成式AI與大語言模型的大爆發(fā)。
那么對于廣大用戶來說,生成式AI究竟意味著怎樣的機(jī)遇?數(shù)據(jù)在生成式AI應(yīng)用中扮演著怎樣的角色?如何解鎖生成式AI的價值?又應(yīng)該怎樣開啟生成式AI的旅程?
在近日召開的2023亞馬遜云科技中國峰會上,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood針對以上問題給出了詳細(xì)解答。
解鎖生成式AI的價值
“亞馬遜云科技深信,生成式AI正在重塑千行百業(yè)。它可以突破以前無法突破的極限,其典型場景包括寫作、設(shè)計、編碼、建模等創(chuàng)意輸出;包括搜索、總結(jié)、排序等功能增強(qiáng);包括可產(chǎn)生新知識和新想法,以及通過聊天機(jī)器人提供開放知識的全新交互式體驗;包括在人工監(jiān)督下自動執(zhí)行復(fù)雜任務(wù)的決策支持?!闭劦絹嗰R遜云科技對生成式AI的觀點與看法時,Matt Wood如是表示。
談到如何解鎖生成式AI的價值時,Matt Wood表示主要有以下四個步驟:
1、提供對一流基礎(chǔ)模型的訪問:亞馬遜云科技的Amazon Bedrock服務(wù)能夠提供對一流基礎(chǔ)模型的訪問,允許用戶通過API訪問來自AI21 Labs、Anthropic、Stability AI和亞馬遜的基礎(chǔ)模型,因而是客戶使用基礎(chǔ)模型構(gòu)建和擴(kuò)展生成式AI應(yīng)用程序的最簡單方法,幫助所有開發(fā)者降低了使用門檻。在Amazon Bedrock上,用戶可以通過可擴(kuò)展、可靠且安全的亞馬遜云科技托管服務(wù),訪問從文本到圖像的一系列強(qiáng)大的基礎(chǔ)模型。
2、提供安全私密的環(huán)境去定制模型:亞馬遜云科技旗下的Amazon Titan是一系列不同的模型庫,可實現(xiàn)文本歸納總結(jié)、搜索結(jié)果嵌入、有害內(nèi)容刪減等,用戶可以非常安全、隱私地對這些模型做優(yōu)化和微調(diào)。
3、通過定制芯片提供低成本和低延遲訪問:從Nitro、Graviton一直到機(jī)器學(xué)習(xí)推理芯片Inferentia、機(jī)器學(xué)習(xí)訓(xùn)練芯片Trainium,亞馬遜云科技低成本、低延遲的自研定制芯片,正在生成式AI領(lǐng)域展現(xiàn)出越來越明顯的優(yōu)勢。
4、搜尋機(jī)會提升使用體驗:基于機(jī)器學(xué)習(xí)技術(shù),亞馬遜云科技為開發(fā)人員提供了Amazon CodeWhisperer代碼生成服務(wù),支持包括Java、JavaScript和Python等在內(nèi)的15種不同編程語言,可以讓個人用戶免費(fèi)使用。在測試中,與未使用CodeWhisperer的參與者相比,使用CodeWhisperer的參與者完成任務(wù)的速度平均快57%,成功率高27%。
“在為客戶提供廣泛的機(jī)器學(xué)習(xí)能力方面,亞馬遜云科技有著悠久的歷史。從機(jī)器學(xué)習(xí)的不斷創(chuàng)新、定制化的底層芯片、開箱即用的AI服務(wù)一直到利用Amazon Bedrock使用模型,如果把所有這些放在一起,你會發(fā)現(xiàn)從未有過如此簡單、低成本的,借助機(jī)器學(xué)習(xí)進(jìn)行代碼構(gòu)建的方式?!盡att Wood說道。

亞馬遜云科技的云原生數(shù)據(jù)戰(zhàn)略
Matt Wood指出,數(shù)據(jù)既是生成式AI的起點,又將推動生成式AI的廣泛應(yīng)用。為此亞馬遜云科技也推出了自己的云原生數(shù)據(jù)戰(zhàn)略:
1、全面的工具集,滿足現(xiàn)在和未來所需:亞馬遜云科技推出15種專門構(gòu)建的云上托管數(shù)據(jù)庫服務(wù),為各類用戶的應(yīng)用場景提供完美契合的數(shù)據(jù)服務(wù);亞馬遜云科技的分析服務(wù)已全面實現(xiàn)Serverless化,包括交互式查詢服務(wù)Amazon Athena、大數(shù)據(jù)處理服務(wù)Amazon Managed Streaming for Apache Kafka (Amazon MSK)、實時分析服務(wù)Amazon Kinesis、數(shù)據(jù)倉庫服務(wù)Amazon Redshift、數(shù)據(jù)集成服務(wù)Amazon Glue、商業(yè)智能服務(wù)Amazon QuickSight以及運(yùn)營分析服務(wù)Amazon OpenSearch Service。
2、輕松集成,連接所有數(shù)據(jù):亞馬遜云科技提出了Zero-ETL的愿景,致力于實現(xiàn)無縫的數(shù)據(jù)轉(zhuǎn)換和調(diào)用,而用戶不用編寫任何的代碼。譬如最近推出的Amazon Aurora服務(wù),就可以與Amazon Redshift進(jìn)行Zero-ETL集成,允許使用Amazon Redshift對來自Aurora的PB級事務(wù)數(shù)據(jù)進(jìn)行近實時分析和機(jī)器學(xué)習(xí)。事務(wù)數(shù)據(jù)在被寫入Aurora后的幾秒鐘內(nèi),即可用在Amazon Redshift中,因此用戶不必構(gòu)建和維護(hù)復(fù)雜的數(shù)據(jù)管道來執(zhí)行提取、轉(zhuǎn)換和加載 (ETL) 操作。
3、構(gòu)建端到端的數(shù)據(jù)治理:通過數(shù)據(jù)治理,加速并保障數(shù)據(jù)流通。亞馬遜云科技在2022年推出了一項全新的數(shù)據(jù)管理服務(wù)Amazon DataZone,可以讓客戶更快、更輕松地對存儲在亞馬遜云科技、客戶本地和第三方來源的數(shù)據(jù)進(jìn)行編目、發(fā)現(xiàn)、共享和治理。借助Amazon DataZone,管理員和數(shù)據(jù)資產(chǎn)管理者可以使用精細(xì)的控制工具管理和治理數(shù)據(jù)訪問權(quán)限,確保數(shù)據(jù)訪問發(fā)生在正確的權(quán)限和正確的情境之下。

開啟生成式AI旅程的建議
談到用戶應(yīng)該如何使用數(shù)據(jù)來開啟自己的生成式AI之旅時,Matt Wood給出了五條建議:
1、基于自己現(xiàn)有的數(shù)據(jù)戰(zhàn)略去做構(gòu)建;
2、在組織內(nèi)實現(xiàn)更廣泛、更安全的生成式AI實驗;
3、為需求場景定制化模型;
4、攜手亞馬遜云科技,探索無限可能;
5、選擇場景,即刻啟程,構(gòu)建未來。
“技術(shù)能力往往遵循S曲線。你永遠(yuǎn)不知道你現(xiàn)在S曲線上的哪個位置,除非你事后進(jìn)行回顧。希望明年再會的時候,我們能夠回顧一下自己在S曲線的頭部有哪些新的點,另外在未來有哪些展望,我們希望在這個曲線上有漸進(jìn)的推動。我們相信明年回顧的時候,能夠看到我們已經(jīng)到達(dá)了S曲線的頂點,達(dá)到了快速爆發(fā)式發(fā)展的點,涌現(xiàn)出許多的創(chuàng)新發(fā)明和應(yīng)用?!盡att Wood說道,“科幻作家威廉·吉布森曾經(jīng)說過‘未來近在咫尺,只不過時隱時現(xiàn)’,亞馬遜云科技始終希望將擁有廣闊前景且令人興奮的技術(shù)提供給每個人。在云計算時代,我們提供通過API訪問云上應(yīng)用的快捷訪問,這一愿景不會因為生成式AI的出現(xiàn)而改變,我們希望將這項技術(shù)交到每一個構(gòu)建者和每一個商業(yè)用戶的手中?!?/p>
“此次亞馬遜云科技中國峰會,彰顯了亞馬遜云科技在云與AI領(lǐng)域的持續(xù)深耕。尤其在近期引起熱議的AIGC領(lǐng)域,亞馬遜云科技更加強(qiáng)調(diào)將自身技術(shù)能力和最佳實踐賦能客戶和合作伙伴的AIGC業(yè)務(wù)發(fā)展,通過更加靈活敏捷、低門檻的產(chǎn)品(譬如Amazon Bedrock和Amazon CodeWhisperer),加速AIGC技術(shù)的普及以及在更多行業(yè)場景中探索價值,致力于成為AIGC世界中的‘幕后推手’和‘?dāng)?shù)字基座’?!卑鹱稍冄芯靠偙O(jiān)王成峰表示。
生成式AI領(lǐng)域的“百模大戰(zhàn)”
自從ChatGPT一夜爆紅,市場上相繼出現(xiàn)了各式各樣的生成式AI工具和大模型,號稱AIGC“百模大戰(zhàn)”,這也讓許多用戶不知道如何選擇。對此亞馬遜云科技又有著怎樣的看法和建議?
“隨著ChatGPT的橫空出世,很多人都深受鼓舞,但是也要認(rèn)真考慮我們究竟需要什么樣的生成式AI工具,需要構(gòu)建什么樣的系統(tǒng),需要什么樣的資源,尤其是什么樣的大模型,才能實現(xiàn)自己的構(gòu)想?!盡att Wood表示,“而亞馬遜云科技的目標(biāo),就是用盡可能簡單的方法,幫助客戶構(gòu)建自己的大模型。不管是創(chuàng)業(yè)公司、中小企業(yè)還是大型企業(yè),都可以運(yùn)用這些生成式AI工具。我們的開發(fā)人員能夠以難以置信的方式,來提供簡單易用的生成式AI工具。不管是文本還是圖像,用戶只需要了解簡單的API和選擇適合的模型,就可以輸出自己想要的內(nèi)容。而在這個過程當(dāng)中,亞馬遜云科技的與眾不同之處,就是我們提供的生成式AI工具必須是隨處可用的,并且能夠以極低的成本實現(xiàn),以盡可能低的延遲來向用戶交付服務(wù),同時確保運(yùn)維操作的最優(yōu)化。因此我們選擇了定制芯片的方法,這樣可以提供更加強(qiáng)大的性能,并且盡可能地降低成本和時延?!?/p>
Matt Wood指出,在亞馬遜云科技看來,不同行業(yè)用戶的需求千差萬別,因此并不存在一個可以適用多種應(yīng)用環(huán)境的“一招鮮”萬能大語言模型。為此亞馬遜云科技在努力訓(xùn)練Amazon Titan等自研大語言模型的基礎(chǔ)上,也在積極使用Anthropic、AI21Labs、Stability AI等第三方合作伙伴的大語言模型,讓用戶可以根據(jù)自身的需求,使用自己的數(shù)據(jù),以各種不同的方式定制相應(yīng)的大語言模型。
“正是有賴于我們過去一段時間在生成式AI領(lǐng)域的研發(fā)和創(chuàng)新,我們實現(xiàn)了低成本、低時延,讓客戶擁有了能夠通過定制芯片構(gòu)建自己模型、使用自己模型的能力。目前在整個行業(yè)中,亞馬遜云科技在所有供應(yīng)商當(dāng)中實現(xiàn)了以速度最快、成本最低、最簡單易行的方式,來提供生成式AI大模型?!盡att Wood表示,“與此同時,我們還在不斷地推出新的服務(wù),例如使用生成式AI產(chǎn)品CodeWhisperer,來幫助軟件開發(fā)人員極大地提升工作效率,使其能夠以更快的速度、更高的質(zhì)量、更安全的方式來編寫軟件和程序。這一點也讓很多客戶感到非常興奮和滿意?!?/p>