AIGC|淺析AutoGPT究竟是什么?如何用?
一、介紹
AutoGPT 是一個(gè)基于 GPT-4 的開源項(xiàng)目,AutoGPT的設(shè)計(jì)目標(biāo)是簡化用戶與語言模型的交互過程,使文本生成和信息收集更輕松、更高效。AutoGPT管理短期和長期記憶,并可以連接互聯(lián)網(wǎng)收集信息,此外AutoGPT具有文件存儲(chǔ)和匯總功能。在我們使用AutoGPT時(shí)需要賦予一個(gè)目標(biāo),此時(shí)它會(huì)提出一個(gè)執(zhí)行計(jì)劃并采取行動(dòng),從而完成我們賦予的目標(biāo)。
AutoGPT是一個(gè)功能強(qiáng)大的工具,但它也有一些局限性。一方面,由于成本較高,將其應(yīng)用于生產(chǎn)環(huán)境可能會(huì)有困難。每一步操作都需要經(jīng)過一系列的思考和迭代,而為了提供更好的推理和提示,模型通常會(huì)使用盡可能多的Token。根據(jù)OpenAI的說法,在GPT-4 8K版本中,輸入端的價(jià)格為每1K個(gè)Token收費(fèi)0.03美元,輸出端的價(jià)格為每1K個(gè)Token收費(fèi)是0.06美元。另一方面AutoGPT提供的功能范圍是有限的。此外,GPT-4的分解和推理能力仍然受到限制,這進(jìn)一步限制了Auto-GPT解決問題的能力。
二、基本原理
(一)AutoGPT怎樣理解目標(biāo)?
這個(gè)其實(shí)是通過 GPT4的一個(gè)特殊功能叫做 zero shot learning,也就是零樣本學(xué)習(xí)來實(shí)現(xiàn)的, 0 樣本學(xué)習(xí)就是讓GPT4在沒有接觸過特定類別樣本的情況下,仍然能夠識(shí)別和處理這些類別的數(shù)據(jù),或者說可以根據(jù)一些描述或者定義學(xué)習(xí)到一個(gè)新的概念,然后用這個(gè)概念再來生成新的內(nèi)容。傳統(tǒng)的監(jiān)督學(xué)習(xí)方法通常需要大量標(biāo)注數(shù)據(jù)來訓(xùn)練模型,而零樣本學(xué)習(xí)則試圖解決這個(gè)問題,降低收集和標(biāo)注數(shù)據(jù)的需求。零樣本學(xué)習(xí)主要依賴于將不同類別的信息以語義形式表示,這些表示通常是高維向量,例如屬性向量或詞嵌入。這些向量可以捕捉到類別之間的相似性,從而幫助模型泛化到未見過的類別。當(dāng)模型在訓(xùn)練過程中學(xué)習(xí)到這些語義表示時(shí),它可以借助這些信息來識(shí)別和處理新類別的數(shù)據(jù)。
例如,如果一個(gè)零樣本學(xué)習(xí)模型被訓(xùn)練識(shí)別動(dòng)物,已經(jīng)識(shí)別了貓和狗的特征,而狐貍具備貓的特征,比如外貌與貓有一些相似之處,如身體的柔軟靈活、細(xì)長的尾巴、尖耳朵等。同時(shí),狐貍也具備狗科動(dòng)物的一些特征,比如狐貍屬于犬科,具有狗一樣的嗅覺敏銳,所以雖然沒有“見過”狐貍,但是能夠用過特征描述很快地識(shí)別出狐貍。

(二)AutoGPT拆解任務(wù)以及目標(biāo)的原理 ?
任務(wù)拆解是通過多任務(wù)學(xué)習(xí)(Multi-task Learning, MTL)來實(shí)現(xiàn)的,它一種機(jī)器學(xué)習(xí)方法,它訓(xùn)練模型在單個(gè)學(xué)習(xí)過程中同時(shí)學(xué)習(xí)多個(gè)相關(guān)任務(wù)。這種方法的核心思想是通過讓模型共享不同任務(wù)之間的底層表示(例如,特征、權(quán)重等),從而提高模型的泛化能力和學(xué)習(xí)效率。多任務(wù)學(xué)習(xí)的一個(gè)重要優(yōu)勢(shì)在于,它可以借助不同任務(wù)之間的潛在聯(lián)系,在一定程度上減少過擬合的風(fēng)險(xiǎn)。此外,多任務(wù)學(xué)習(xí)還能更有效地利用有限的訓(xùn)練數(shù)據(jù),提高訓(xùn)練效率??傊?,多任務(wù)學(xué)習(xí)方法試圖通過讓模型在一個(gè)統(tǒng)一的框架下學(xué)習(xí)多個(gè)相關(guān)任務(wù),實(shí)現(xiàn)知識(shí)的共享和遷移,從而提高模型的性能。

(三)AutoGPT如何生成提示以及如何評(píng)估子任務(wù)達(dá)標(biāo)?
AutoGPT生成提示的原理是通過元學(xué)習(xí)和預(yù)訓(xùn)練模型等技術(shù)手段實(shí)現(xiàn)的。它利用元學(xué)習(xí)來學(xué)習(xí)如何生成有效的提示,元學(xué)習(xí)可以幫助模型理解任務(wù)的特點(diǎn)和目標(biāo),并根據(jù)這些理解生成適當(dāng)?shù)奶崾?。此外,AutoGPT還可以使用預(yù)訓(xùn)練模型,通過學(xué)習(xí)大量的語言數(shù)據(jù)和任務(wù)樣本,掌握不同任務(wù)的模式和特征,從而更好地生成與任務(wù)相關(guān)的提示。
評(píng)估子任務(wù)達(dá)標(biāo)的過程主要依賴于人類的反饋和自我評(píng)估。在生成提示后,AutoGPT會(huì)根據(jù)生成的提示和執(zhí)行的結(jié)果,與人類的期望進(jìn)行比較和評(píng)估。如果生成的結(jié)果符合預(yù)期,并得到人類的正面反饋,說明子任務(wù)已經(jīng)達(dá)到了預(yù)期的標(biāo)準(zhǔn)。如果結(jié)果不符合預(yù)期或人類提供了負(fù)面反饋,AutoGPT會(huì)根據(jù)反饋進(jìn)行修改和改進(jìn),再次生成新的提示并執(zhí)行任務(wù),直到達(dá)到預(yù)期的標(biāo)準(zhǔn)為止。
這種評(píng)估過程可以是迭代的,AutoGPT不斷根據(jù)反饋進(jìn)行調(diào)整和改善,逐步提高生成的提示的質(zhì)量和準(zhǔn)確性。通過不斷學(xué)習(xí)和自我評(píng)估,AutoGPT能夠逐漸適應(yīng)任務(wù)的要求,提供更好的提示,并達(dá)到或超過人類的預(yù)期。
三、快速開始
(一)云端安裝AutoGPT
1、登錄Google云端硬盤,點(diǎn)擊 我的云端硬盤->更多-> Google Colaboratory

2、重命名文件,點(diǎn)擊修改->筆記本設(shè)置,選擇使用GPU,點(diǎn)擊保存。然后點(diǎn)擊右邊的連接按鈕,等待分配主機(jī)。
3、單獨(dú)執(zhí)行以下每行代碼:
4、運(yùn)行成功之后會(huì)顯示如下Info信息。之后可以讓AutoGPT自動(dòng)完成目標(biāo),或者輸?--manual指令,為AI指定詳細(xì)的角色,目標(biāo)和步驟。注意在最后的目標(biāo)中輸?: Oncedone, shutdown(一旦完成就終止運(yùn)行)。

5、例如,讓AutoGPT寫一篇關(guān)于時(shí)間管理500字文章大綱

執(zhí)行完成后會(huì)生成一個(gè)路徑,輸出文章大綱就在這個(gè)目錄里面


本次分享完畢了,對(duì)于AutoGPT有沒有新的了解呢?
作者:馬鵬程、李代偉 | 后端開發(fā)工程師
