認知架構(gòu)之路:開源與閉源
承接上文,下面讓我們來分析一下開源與閉源在認知架構(gòu)領(lǐng)域的發(fā)展,我們分別以 LangChain 和 OpenAI 作為開源與閉源兩個陣營的代表。
OpenAI 作為 AGI 領(lǐng)域的明星公司近期推出的 GPTs 系列產(chǎn)品,是強力推動 Agent 認知架構(gòu)的代表。通過其獨立性和主動性,GPTs 可以自主訪問知識、調(diào)用工具,并基于對話歷史自主決策。這類似一個比過去對話系統(tǒng)更為主動、智能的代理人。
OpenAI 在推出 GPTs 系列消費產(chǎn)品的同時,還專門為開發(fā)者準備了 Assistants API 這個工具。這可以看作是面向開發(fā)者的認知架構(gòu)服務(wù)。Assistants API 為用戶提供了類似代理人的智能體系統(tǒng):
它內(nèi)置了對話式交互、代碼執(zhí)行和知識檢索等功能模塊;
開發(fā)者可以基于這個框架,擴展自己所需的決策工具和流程;
Assistants API 幫助記錄狀態(tài),負責決策與工具調(diào)用之間的調(diào)度協(xié)調(diào)。
這相當于一個半成品的 Agent 架構(gòu),開發(fā)者只需在此基礎(chǔ)上進行二次開發(fā),就可以獲得一個工作的智能代理人。這種高度自主的?Agent?設(shè)計理念,與?OpenAI?追求的?AGI?目標十分吻合。他們寄希望于通過不斷完善這種結(jié)構(gòu),LLM?可以獲得越來越強的思考與決策能力,最終實現(xiàn)通用智能。
與此形成對比的,是開源社區(qū)構(gòu)建的認知架構(gòu)工具體系。以 LangChain 為代表的開源工具,提供了豐富的樣本代碼、集成模板、調(diào)試工具等資源。開發(fā)者可以自主搭建認知架構(gòu),無需受限于任何廠商。LangChain?的方法也更傾向于給系統(tǒng)設(shè)計明確的狀態(tài)轉(zhuǎn)換邏輯 —— 它們構(gòu)建了類似多步工作流的鏈條式或者狀態(tài)機式的認知架構(gòu),在不同場景間轉(zhuǎn)移更加可控。這雖然犧牲了部分自治性,但可靠性和適應(yīng)性都更強。
比如 LangChain 推出的 OpenGPTs 項目,就是試圖復刻 GPTs 式產(chǎn)品的功能以及開發(fā)者版的 Assistants API 的功能。作為一個開源系統(tǒng),OpenGPTs 的最大優(yōu)勢就在于它提供了高度的可自定義性。比如用戶可以選擇集成不同的語言模型,通過 LangChain 已經(jīng)支持 60 多個知名大語言模型。此外,OpenGPTs 也讓用戶更容易添加自定義的工具,實現(xiàn)特定域的定制化應(yīng)用。
OpenGPTs:?https://github.com/langchain-ai/opengpts
OpenGPTs 帶來的自定義維度主要包括:
語言模型的選擇:已默認集成 GPT-3.5 Turbo、GPT-4 等多個模型,還可輕松添加其它大語言模型。
提示工程的調(diào)優(yōu):通過可視化平臺 LangSmith 進行提示策略的調(diào)試。
自定義工具的添加:如以 Python 方式實現(xiàn)的定制工具,可直接接入系統(tǒng)。
向量數(shù)據(jù)庫的切換:可在 60 多個預集成的向量庫中選擇。
檢索算法的配置:可以自定義使用的檢索算法。
可以看出,OpenGPTs 為用戶提供了從底層模型到提示策略再到工具鏈的全流程定制。這類似于一個開放的認知架構(gòu)搭建工具箱。用戶無需受限于任何廠商,可以自主控制各個層面的技術(shù)細節(jié)。所以作為開源社區(qū)的代表,LangChain 其實也相當于提出了另一套系統(tǒng)架構(gòu)的設(shè)計理念,其認知架構(gòu)設(shè)計更強調(diào):
增加外部系統(tǒng)對語言模型決策的約束指導;
為不同問題空間設(shè)定不同的狀態(tài)轉(zhuǎn)換機制;
主動將相關(guān)上下文知識推送給語言模型;
大語言模型負責在給定的狀態(tài)及場景中制定最優(yōu)決策。
這相比 OpenAI 更加強調(diào)外部系統(tǒng)與語言模型的協(xié)同。犧牲了一定的自主性,但可解釋性與穩(wěn)定性都更強。LangChain 通過這種設(shè)計,也可以催生更多用于構(gòu)建智能體系統(tǒng)架構(gòu)的開源工具。
綜上所述,開源與閉源社群目前在認知架構(gòu)領(lǐng)域都展開了一些行動:
OpenAI 正在發(fā)展高度自主的 Agent 架構(gòu),并在商業(yè)化環(huán)境下不斷完善;
LangChain 等開源社區(qū)更強調(diào)可解釋、可控,提供開放的認知架構(gòu)工具。
AGI 認知架構(gòu)之路上的開源和閉源,如何發(fā)展、演變?讓我們拭目以待!