生成式AI正當時,亞馬遜云科技從四方面幫你規(guī)避風險
ChatGPT一聲驚雷,讓全球見識到了生成式AI的威力。當前,生成式AI進入一個爆發(fā)時刻,并在許多領域中展現(xiàn)出它的無限潛力。那么,在這輪生成式AI大爆發(fā)中,企業(yè)應當如何抓住機遇,順應這一波時代的潮水,得到自己的獨特紅利?這屆亞馬遜云科技中國峰會,給了我們答案。?
0代碼構建應用
AI大爆發(fā)中,許多企業(yè)都希望能順勢抓住紅利,但無論是成本還是技術壁壘,大模型的門檻之高,都會把許多企業(yè)拒之門外。亞馬遜云科技的Amazon?Bedrock,就把大模型的門檻打了下來。
在峰會現(xiàn)場,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood為大家展示了一個令人印象深刻的無代碼產(chǎn)品demo。

生成式AI的變革
DALL-E 2、Stable Diffusion、ChatGPT等AI工具的相繼誕生成功引爆了AIGC時代。由此,2022年也被稱為「生成式AI元年」。近二十年來,我們見證了從「機器學習」算法到「深度學習」,再到「基礎模型」的發(fā)展。隨著數(shù)據(jù)量大規(guī)模膨脹,可擴展的算力,再加上機器學習不斷創(chuàng)新,生成式AI走向了一個轉折點。

在亞馬遜云科技中國峰會上,亞馬遜云科技全球產(chǎn)品副總裁Matt Wood提到了,生成式AI將最先在四個方面發(fā)生深刻的變革。它們分別是:創(chuàng)意輸出、功能增強、交互式體驗、決策支持。
創(chuàng)意輸出是指通過生成式AI做一些有創(chuàng)造力的工作,比如寫作、編碼、視頻、設計等。辦公軟件能夠幫你去做總結、分析各種個性化內(nèi)容的實現(xiàn),還有進行相關內(nèi)容搜索,都是功能增強的體現(xiàn)。另外,交互式體驗是通過與包括ChatGPT在內(nèi)的聊天機器人,進行Q&A互動。最后的決策支持,比如智能數(shù)據(jù)報表AI助理。
現(xiàn)在,生成式AI的大爆發(fā)就在眼前,而且還是多點爆破,許多企業(yè),都希望能抓住機遇。
?
四大挑戰(zhàn),一站式解決
然而在現(xiàn)實中,企業(yè)想要利用生成式AI,還面臨著重重困難。

而亞馬遜云科技,正在通過種種服務產(chǎn)品,彌補著這一差距,爭取讓生成式AI的好處,能夠惠及所有企業(yè)。
1.?獲得一流的模型
在當今的背景之下,大多數(shù)公司都有使用大語言模型的需要。便捷的訪問,靠譜的模型,都漸漸成為剛需。但包括ChatGPT和Bing AI在內(nèi)的聊天機器人,都無法避免「幻覺」的問題,會輸出看起來令人信服、實則是胡說八道的答案。
如何獲得一流的模型呢?亞馬遜云科技的Amazon?Bedrock,就提供了非常好的選擇。首先,Amazon?Bedrock最重要的優(yōu)勢就在于,用戶可以將其與亞馬遜云科技的其他部分集成。這意味著,企業(yè)可以更輕松地訪問存儲在Amazon S3對象存儲服務中的數(shù)據(jù),并從亞馬遜云科技的訪問控制和治理策略中受益。其次,通過Amazon?Bedrock,用戶可以輕松訪問AI21的Jurassic-2、Anthropic的Claude、Stability AI的Stable Diffusion,以及亞馬遜云科技自己的Amazon?Titan模型。
Amazon?Titan包含了兩個大語言模型,一個是用于生成文本的Titan Text,一個是讓網(wǎng)絡搜索個性化的Titan Embedding。
用戶可以通過自己的數(shù)據(jù)定制Amazon?Titan模型。并且,亞馬遜云科技非常保護用戶數(shù)據(jù)隱私,不會將用戶數(shù)據(jù)拿來再訓練Amazon?Titan模型。
而且,不同于其他大模型時常會出現(xiàn)的「幻覺」,Amazon?Titan在訓練時非常關注精度,就是為了保證產(chǎn)生的響應一定是高質量的。
2.?安全和私有環(huán)境
雖然使用大模型是剛需,但所有客戶都不希望自己的數(shù)據(jù)被拿去訓練模型。
在一項調查中亞馬遜云科技也發(fā)現(xiàn),由于數(shù)據(jù)非常寶貴,因此客戶的一個關鍵需求就是,在模型訓練的過程中時刻保持數(shù)據(jù)的安全和隱私。
而Amazon?Bedrock的Amazon?SageMaker,正提供了這樣一個安全的模型訓練環(huán)境,可以讓客戶把預訓練模型通過在自己的數(shù)據(jù)上微調,變成一個定制化的模型。
亞馬遜云科技的副總裁表示,客戶可以使用自己的數(shù)據(jù)定制Amazon?Titan模型,但這些數(shù)據(jù)永遠不會用于訓練Amazon?Titan模型,可以保證其他客戶(包括競爭對手),都不會從這些數(shù)據(jù)中獲益。
3.?低成本和低延遲
而在這些基礎上,就需要有相應的工具實現(xiàn)更快的開發(fā)。
大模型時代,得算力者得天下。
對此,亞馬遜云科技推出的訓練和推理芯片Amazon?Inferentia、Amazon?Inferentia2和Amazon?Trainium,就加速了AI工具的開發(fā)過程。
Amazon?Trainium是亞馬遜云科技專門為超過1000億參數(shù)模型的深度學習訓練打造的第二代機器學習加速器。每個Amazon Elastic Compute Cloud(EC2)Trn1實例可部署多達16個Trainium加速器,為云中的深度學習(DL)訓練提供高性能、低成本的解決方案。
Amazon?Inferentia是亞馬遜云科技設計的一款機器學習推理加速器,可在云中提供高性能和低成本的機器學習推理。與第一代Amazon?Inferentia相比,Amazon?Inferentia2加速器在性能和功能方面實現(xiàn)了重大飛躍,吞吐量提高了4倍,延遲低至前者的1/10。
4.?專業(yè)的代碼生成
在有了便宜高效的算力之后,另一個讓企業(yè)開發(fā)者頭大的問題,就是代碼了。
前段時間,GiHub就展開了一項關于「AI對開發(fā)者體驗影響」的調查。從結果來看,幾乎所有(92%)的開發(fā)人員都會在工作中使用AI編碼工具,大多數(shù)(67%)開發(fā)者在工作環(huán)境和個人時間中都使用過,不過還有6%的開發(fā)人員表示他們只在工作之外使用編碼輔助工具。其中,更是有超過70%的開發(fā)者表示,AI編碼工具可以滿足現(xiàn)有的性能標準、提高代碼質量、更快地輸出代碼,而且生產(chǎn)級事故也會更少。
無獨有偶,亞馬遜云科技也曾進行過一個生產(chǎn)力挑戰(zhàn)。結果顯示,使用自家Amazon?CodeWhisperer的參與者在任務的完成率上,要比不使用的高了27%,而平均速度更是快了57%。然而,這對于項目負責人來說,卻是一個不小的挑戰(zhàn)。
由于大模型的「幻覺」問題,此時的代碼和安全審查就變得尤為重要了。
為了解決這些挑戰(zhàn),亞馬遜云科技全面推出了AI加持的代碼開發(fā)工具Amazon?CodeWhisperer,可以讓用戶實現(xiàn)更快、更穩(wěn)健的開發(fā)。
具體來說,經(jīng)過數(shù)十億行亞馬遜和公開可用代碼的訓練之后,Amazon?CodeWhisperer不僅可以理解用自然語言(英語)編寫的注釋,還能實時生成整個函數(shù)和代碼的邏輯塊(通常包含10-15行代碼)。
與此同時,Amazon?CodeWhisperer還會自動過濾掉任何可能有偏見或不公平的代碼建議,并且對疑似開源代碼進行過濾和標記。
要知道,開發(fā)者從網(wǎng)上復制代碼片段時,很可能就會復制了有安全隱患的代碼,或者對開源代碼的使用沒有進行有效的追溯。而Amazon?CodeWhisperer大大掃清了這些潛在的問題。
在安全方面,Amazon?CodeWhisperer也是查漏洞、debug樣樣精通。而且它查起bug來還非常細致,不僅會掃描開發(fā)者編寫的代碼,甚至連自己生成的都不放過。
當然,對于個人用戶來說,最重要的一點便是——Amazon?CodeWhisperer可以免費用!