GPT后下一個AI焦點:不僅告訴你“如何做”,更會幫你做的Agent智能體落地
如今,中國的大模型創(chuàng)業(yè)者已經集結在十字路口。他們之中既有研究自然語言理解、計算機視覺、機器人等領域將近40年的科學家,也有已經功成名就的前創(chuàng)業(yè)者,還有剛剛博士畢業(yè)的年輕人。創(chuàng)業(yè)者們在各個層面展開競爭。

大模型之戰(zhàn)的下半場或許已拉開序幕,而AI?Agent成為了舞臺上科技巨頭們爭搶的焦點。8月16日,國內AI準獨角獸實在智能正式推出了基于大模型的TARS-RPA-Agent產品,“你說,PC做”的數字助理時代來臨。
什么是Agent智能體?智能體可以描述物理實體,比如人類、螞蟻和蜜蜂,也可以描述虛擬實體,比如程序模塊和AI系統(tǒng)。在大模型語境下,可以理解成能自主理解、規(guī)劃、執(zhí)行復雜任務的系統(tǒng)。而AI?Agent并非是ChatGPT的升級版,把它視作人類的“數字助理”更為合適。它不僅能?“聽得懂,想明白”,更可以“看得見,動起來”。
實在智能自從進入超自動化賽道以來,秉持AI深度融合RPA的理念,持續(xù)迭代更新自身產品矩陣。不僅將RPA從“拖拉拽”的“專家模式”更新至“點選用的IPA小白模式,更是在此基礎上,融入自研行業(yè)TARS垂直大模型,將RPA使用門檻進一步降低,直接進入到“所說即所得,你說PC做”的“傻瓜模式”,即震撼推出國內第一個基于大模型的TARS-RPA-Agent產品。
低使用門檻到底低在哪里?
例如,如果你問TARS-RPA-Agent“我要買一臺筆記本電腦,幫我推薦下”,TARS-RPA-Agent基于計算機視覺大模型的“智能屏幕語義理解”技術(ISSUT)“秒懂”屏幕畫面,第一時間完成自動解析,并且將其拆解成“登錄購物網站,查詢筆記本電腦品牌、配置、價格等信息,完成產品推薦”等多個步驟并加以自動實現(xiàn)。
在這個過程中,TARS-RPA-Agent也存在避免理解偏差或者操作失誤的反饋機制,以及結合上下文擴展和向量檢索等技術下的長時記憶能力,以便后續(xù)分析和優(yōu)化。
總結來說,TARS-RPA-Agent的核心工作流程包括:自主拆解任務、感知當前環(huán)境、執(zhí)行并且反饋、記憶歷史經驗,通過文本指令或對話聊天的方式直接生成數字員工,操作各種電腦軟件自主完成工作任務。
因此,大家最近都不卷大模型了,開始卷Agent了。小編曾在《科幻世界》等雜志看到過很多類似“數字助理、機器人小秘書”的情節(jié)描述,包括《星際穿越》電影中的“塔斯”機器人,都可以精準理解人類復雜意圖并準確無誤執(zhí)行。隨著AGI這座大廈越筑越高,隨著第一個大模型Agent的正式誕生,可以預料到:未來的AGI是一座非常雄偉的大廈,而這座大廈底座的磚頭絕對不是一個人鋪出來的。