最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

認知架構(gòu)之路:概念與方式

2023-11-29 16:09 作者:滄海九粟  | 我要投稿

認知架構(gòu)(Cognitive Architecture)是通用人工智能研究的一個子集,始于 1950 年代, 其最終目標是對人類思維進行建模 ,這將使我們更接近構(gòu)建人類水平的人工智能。簡單來說,認知架構(gòu)描述了一個智能體進行思考、獲取信息、做出決策等的整體機制與流程。它回答了“一個智能體是如何思考的”這個最核心的問題。

對我們?nèi)祟悂碚f,大腦的結(jié)構(gòu)及工作方式就是我們特有的認知架構(gòu)。它讓我們可以感知環(huán)境,存儲記憶,運用知識推理解決問題。對一個人工智能系統(tǒng)而言,研究者也需要為其設(shè)計一個類似的認知架構(gòu),讓其具有獲取輸入、處理信息、產(chǎn)生輸出的能力。

目前最引人矚目的人工智能系統(tǒng)無疑是大型語言模型(LLM)。它們可通過自然語言進行交互,并在特定領(lǐng)域展現(xiàn)出接近人類專家的智能。但我們不能簡單地將 LLM 視為一個完整的智能體。嚴格意義上,它們只是實現(xiàn)了智能體的“思考推理”這一部分。

要構(gòu)建一個真正的智能體,我們還需要解決獲取輸入信息和產(chǎn)生輸出這兩個問題。這就需要在 LLM 之外,設(shè)計一個完整的系統(tǒng)架構(gòu),即認知架構(gòu)。它負責決定如何向 LLM 提供交互性的輸入,以及如何處理 LLM? 產(chǎn)生的輸出。

簡而言之,認知架構(gòu)解決了“上下文輸入”和“推理輸出”這兩個關(guān)鍵問題:

  1. 上下文輸入:它決定了 LLM 能夠感知到的上下文信息,這直接影響到 LLM 的思考和決策質(zhì)量。上下文輸入可以是對話歷史、外部知識源、用戶特征等。

  2. 推理輸出:它負責解釋和處理 LLM 的輸出,將其轉(zhuǎn)化為對用戶或環(huán)境的實際影響。這可能是顯示輸出、調(diào)用 API、控制機器人等。

可以看出,一個完善的認知架構(gòu)不僅要包含強大的 LLM 核心,還必須解決輸入輸出的連接問題。只有做到這兩點,才能構(gòu)建出真正智能、實用的人工智能助手。

近年來,包括 OpenAI 在內(nèi)的許多公司都在積極構(gòu)建自己的認知架構(gòu)方案。我們簡要總結(jié)了幾種主流的方式:

  • 基于對話的認知架構(gòu):最簡單的方式是與 LLM 通過自然語言對話。我們通過輸入對話上下文讓 LLM 理解當前狀態(tài),LLM 則用對話響應(yīng)反饋。這種交互方式最為直觀,但只適用于僅需要輸出文本的場景。

  • 工具型認知架構(gòu):為了產(chǎn)生更多樣的輸出,我們還可以為 LLM 連接各種“工具”,如代碼編譯器、網(wǎng)頁瀏覽器等。LLM 指揮這些工具采取行動,同時將觀察的結(jié)果反饋回對話中。這種結(jié)構(gòu)增強了輸出的多樣性。

  • 鏈式或狀態(tài)機式:更復雜的認知架構(gòu)會設(shè)定明確的狀態(tài)狀態(tài)轉(zhuǎn)移流程,步驟間相互關(guān)聯(lián),形成鏈條或網(wǎng)絡(luò)。在這樣的架構(gòu)下,LLM 負責在給定狀態(tài)空間內(nèi)導航,轉(zhuǎn)移到最優(yōu)決策。這樣可以構(gòu)建多步?jīng)Q策過程。

可以看出,高質(zhì)量的認知架構(gòu)設(shè)計對構(gòu)建強大 AI 系統(tǒng)意義重大。它不僅決定了交互形式和獲取環(huán)境信息的方式,也決定了如何解析和處理 LLM 的輸出,將之轉(zhuǎn)化為對環(huán)境的實際影響。

為了得到進一步的自動化,Agent 認知架構(gòu)(也可稱為“代理人”、“智體”架構(gòu))也就應(yīng)運而生了。Agent 認知架構(gòu)是當前較為先進的一種設(shè)計方式,其核心思路是讓語言模型自主地像一個代理人一樣思考和做決定。具體來說,Agent 認知架構(gòu)包含這樣一個循環(huán):

  1. 從用戶或環(huán)境中獲取輸入;

  2. 將輸入和當前的狀態(tài)作為提示送入大語言模型;

  3. 語言模型會產(chǎn)生一個決策,比如需要調(diào)用工具、進行檢索等;

  4. 將語言模型的輸出轉(zhuǎn)化為具體操作,并觀察執(zhí)行的結(jié)果;

  5. 將上一步的操作和觀察結(jié)果反饋給語言模型作為新狀態(tài);

  6. 回到第 2 步,進入新一輪決策。

一個典型的 Agent 基礎(chǔ)架構(gòu)

這個循環(huán)充分利用了大語言模型根據(jù)當前狀態(tài)自主做決定的能力。語言模型自己決定下一步操作,職責更加獨立,也更加主動。這類似于人類代理人分析當前環(huán)境,自主決定下一步計劃的工作方式。

這種高度自治的架構(gòu)方式非常符合構(gòu)建通用 AI 的目標。它減少了外部系統(tǒng)的導向和約束,讓語言模型基于自己的理解來推理、計劃和解決問題。從理想狀態(tài)來說,這使得語言模型的行為更加智能和人類化。

但是,Agent 架構(gòu)也面臨一定的難題:

  1. 自治程度高了,可解釋性就較差,用戶和開發(fā)者難以預測和控制整個流程。

  2. 如果語言模型自己的決策存在錯誤,后果也會更嚴重。沒有外部系統(tǒng)校驗和糾正。

  3. 長時間運行穩(wěn)定性較差,容易積累狀態(tài)導致失敗。

所以這是一個典型的“高風險高收益”的設(shè)計選擇。它代表了實現(xiàn)通用 AI 的未來方向,但實際落地仍面臨調(diào)優(yōu)空間。

OpenAI 等公司正積極推動這種 Agent 架構(gòu)范式,例如推出了 GPTs 和 Assistants API。而開源社區(qū)如 LangChain,則更強調(diào)在此基礎(chǔ)上增加外部控制,構(gòu)建混合智能系統(tǒng)。這也引發(fā)了認知架構(gòu)設(shè)計的開源與閉源兩個不同發(fā)展思路,我們會在后文進一步討論,請繼續(xù)關(guān)注!


認知架構(gòu)之路:概念與方式的評論 (共 條)

分享到微博請遵守國家法律
南皮县| 焉耆| 凤山县| 沂水县| 巴林左旗| 桂林市| 邹平县| 墨竹工卡县| 莲花县| 时尚| 桓仁| 庐江县| 塔城市| 咸阳市| 保靖县| 开阳县| 南郑县| 北安市| 梧州市| 海城市| 盐池县| 杭锦旗| 罗城| 湘潭县| 翼城县| 吴堡县| 青神县| 黄梅县| 紫云| 铁力市| 左贡县| 平度市| 河东区| 大冶市| 凌海市| 芷江| 麻栗坡县| 宝山区| 简阳市| 长子县| 苏尼特左旗|