最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

【花師小哲】鑒定網(wǎng)絡熱門(?)AI(18)——LLM-based agent

2023-10-28 10:17 作者:花師小哲-中二  | 我要投稿

繼續(xù)更,這次把LLM-based agent這個坑給填了。

1.什么是agent

agent這個詞也是很麻煩的一個詞,當初學哲學就被這詞坑過,機器學習里也有這個術語。

其實主要問題在于,你直接翻譯的話翻譯出來的是“代理”,我同學在翻譯英語圖片的時候因為對強化學習不熟悉,也曾經(jīng)翻譯出“政策代理”這樣的詞匯。

一般來說,在機器學習領域一般翻譯為智能體,特別是在強化學習領域。這樣翻譯其實主要關注agent的決策能力,畢竟強化學習某種程度上就是讓模型學習“選方案”嘛(這也是為什么一般強化學習都是離散決策)。

在大模型語境下,也可以翻譯成智能體,但一般就是不翻譯,直接叫agent。

2.LLM-based agent

大模型(LLM)做agent實際上并不是很難的事情,在ChatGPT火了沒多久,Meta就發(fā)論文說大模型是可以“使用工具”的,也就是調用API。API主要是在虛擬世界中,我們也可以用于現(xiàn)實中,例如用ChatGPT控制機器人。

也就是說,以語言作為契機,ChatGPT為代表的LLM實際上已經(jīng)能在一定程度上完成人類所能做的一些簡單任務了,所以稱之為“智能體”(有只能,且能完成一定任務的個體)也挺合適的。

3.LLM-based agent的構成

LLM-based agent多種多樣,單個LLM的,多個LLM合作的;模擬游戲公司、模擬軟件開發(fā)公司的...但要成為agent,還是需要滿足一定的結構的(當然也不一定全滿足,也就是存在灰色地帶)

目前主流看法是分為應用框架概念框架


應用框架:LLM-based agent由以下部分構成:LLM+記憶+規(guī)劃+工具使用。

LLM不需要說,不然就沒有“LLM-based”前綴了。

記憶是說模型需要知道之前做了什么。雖然像ChatGPT這樣的實際上是有多輪記憶的能力的,但更長的話就不太好保證了,更不要說對于多LLM的系統(tǒng),大家還要相互交流。所以一般還需要額外配置一個記憶流

規(guī)劃就是說我們希望模型能夠獨自一個人面對一個任務做很多輪,那么我們就不希望它們做著做著就跑偏了。對于多LLM,問題就更嚴重了,我們需要對這些LLM進行分工,而規(guī)劃就是用來解決這個問題的。規(guī)劃可以是事先設計好流程,也可以讓LLM自己制訂,或者混合著來

工具使用就是說我們是要實際解決一個問題的,而不是單純當玩具來玩

概念框架

概念框架:LLM-based agent由以下部分構成:大腦+感知+行動

這部分就不介紹那么細了,基本上是按照人的實踐流程來定的。

4.chat在左,agent在右

“chat在左,agent在右”這句話是在最近比較火的,其中一層意思是說,Chatbot不一定適合作為agent。

雖然我們常說ChatGPT是GPT-4之下最強的模型,但其實ChatGPT可以認為是Chat特化后的。其實最普通的大模型的主要作用不是和用戶交互,而是“接續(xù)生成”,例如我們給出代碼的前半部分讓它補全后半部分。LLM要做成chatbot是需要額外添加token的,往往也需要額外的微調。

所以現(xiàn)在有人在嘗試更適合agent任務的微調方法。

5.結語

總之,ChatGPT的爆火帶來了LLM-based agent的發(fā)展,現(xiàn)在依然是LLM相關研究中比較熱門的話題,畢竟agent能適應的范圍是極廣的,而且容易宣傳(“你只需要支付5英鎊就可以做出自己的游戲哦”)。

期待后續(xù)發(fā)展嘍。


【花師小哲】鑒定網(wǎng)絡熱門(?)AI(18)——LLM-based agent的評論 (共 條)

使用qq登录你需要登录后才可以评论。
自贡市| 屏东市| 太保市| 阳朔县| 松江区| 麻栗坡县| 句容市| 嵩明县| 达拉特旗| 威远县| 贡嘎县| 永新县| 永城市| 穆棱市| 长春市| 泽库县| 额济纳旗| 临夏市| 达拉特旗| 汕尾市| 天台县| 宣威市| 曲靖市| 岱山县| 宝丰县| 满洲里市| 呼图壁县| 峨眉山市| 扎鲁特旗| 涟水县| 永兴县| 宝丰县| 若尔盖县| 拜城县| 温宿县| 新晃| 修水县| 佛冈县| 武宁县| 河西区| 肥东县|