講概念談愿景AI Agent名不副實(shí)?看實(shí)在智能RPA Agent智能體如何落地
OpenAI在首屆開發(fā)者大會(huì)上推出了GPTs和Assitant?API,不僅改寫了AI?Agent的構(gòu)建范式,也把AI智能體的應(yīng)用推向一個(gè)新高潮。GPTs和GPT商店,使得用戶無需編碼通過自然語言就能創(chuàng)建并擁有多個(gè)專屬私人助理,且可以如在蘋果應(yīng)用商店一樣在GPT商店出售和購買這些專屬助理。 就連比爾蓋茨也發(fā)表了其對(duì)AI?Agent的看法。他所定義的智能體不僅會(huì)改變?nèi)伺c計(jì)算機(jī)交互的方式,還將顛覆軟件行業(yè),帶來自人類從鍵入命令到點(diǎn)擊圖標(biāo)以來最大的計(jì)算革命,智能體會(huì)成為繼Android、iOS和Windows等之后的下一個(gè)平臺(tái)。 這些無疑不在向我們透露出,一個(gè)人人都能構(gòu)建Agent的時(shí)代已然到來,Agent無處不在的序幕也已拉開。AI?Agent大勢所趨,已經(jīng)成為LLM落地應(yīng)用的主要途徑。借著GPTs的火和比爾蓋茨的風(fēng),很多LLM研發(fā)與應(yīng)用廠商都打出了Agent的牌。
概念化陳述的AI?Agent與實(shí)體化應(yīng)用的AI?Agent,自然存在很大差距。隨著類似這樣的信息越來越多,大眾也對(duì)智能體到底是什么且對(duì)智能體能否在大企業(yè)客戶內(nèi)部真正落地充滿了好奇。而市場上的智能體產(chǎn)品從服務(wù)的目標(biāo)客群和具體落地的產(chǎn)品能力來看,可以分為以下幾大類: 01、
非平臺(tái)級(jí)智能體產(chǎn)品
服務(wù)單一場景,集成的自動(dòng)化實(shí)現(xiàn)需外部API們加持
??服務(wù)場景單一 ??缺乏特定行業(yè)知識(shí)庫KNOW-HOW ??非平臺(tái)級(jí)智能體程序聯(lián)動(dòng)與操作差強(qiáng)人意 非平臺(tái)級(jí)AI?Agent智能體產(chǎn)品目前比較常見的運(yùn)用領(lǐng)域包含:使用它自動(dòng)購買機(jī)票、定披薩、寫總結(jié)、收發(fā)郵件,在流程自動(dòng)化實(shí)現(xiàn)方面是屬于提升生產(chǎn)力的工具。在使用GPTs通過Zapier(連接器)后可以通過海量API連接更多商業(yè)應(yīng)用,可以在很多業(yè)務(wù)場景中使用。
而現(xiàn)在市面上的大多數(shù)Agent智能體,包括OpenAI推出的GPTs,不過就是構(gòu)建了一個(gè)基于某知識(shí)庫或者專業(yè)數(shù)據(jù)的Chatbot。使用這些智能體進(jìn)行問答交互,比如獲取行業(yè)資訊、報(bào)告等,都可以做到對(duì)答如流。但如果要求他們針對(duì)特定行業(yè)的業(yè)務(wù)流程進(jìn)行更深的自動(dòng)化實(shí)現(xiàn)或是幫助企業(yè)實(shí)現(xiàn)業(yè)務(wù)邏輯更復(fù)雜的流程自動(dòng)化,這類智能體就會(huì)露怯。 另外這類智能體在程序聯(lián)動(dòng)與操作方面還有很大差距,主要現(xiàn)在還無法用GPTs直接操作SAP或者金蝶等ERP系統(tǒng),因?yàn)橹衅渲猩婕暗搅薃PI的應(yīng)用、授權(quán)、維護(hù)以及無API管理軟件的連接問題。 所以,無論現(xiàn)在對(duì)AI?Agent的討論多么熱烈,不管1.3W+的GPTs和大量第三方Agents展現(xiàn)的應(yīng)用場景有多豐富,它們?nèi)匀恢荒芩闶茿gent智能體的初級(jí)或非平臺(tái)級(jí)運(yùn)用,尚無法深度參與及影響廣大組織的業(yè)務(wù)自動(dòng)化實(shí)現(xiàn)。 而要想發(fā)揮AI?Agent的更大價(jià)值和服務(wù)于更廣闊的業(yè)務(wù)場景,智能體還是要落到B端的商業(yè)落地與超量級(jí)的應(yīng)用上去。而這,也就是比爾蓋茨所提及的智能體的平臺(tái)價(jià)值。
02、AI?Agent平臺(tái)化價(jià)值
為企業(yè)客戶提供閉環(huán),安全、一站式智能體數(shù)字員工體驗(yàn)
??構(gòu)建-應(yīng)用-分享-反饋的平臺(tái)級(jí)智能體 ??一站式智能體數(shù)字員工體驗(yàn) AI?Agent智能體平臺(tái)化本身要實(shí)現(xiàn)的就是構(gòu)建一個(gè)以智能體為主的平臺(tái),它同時(shí)也是Agent?智能體分發(fā)平臺(tái)。是為了讓企業(yè)流程自動(dòng)化負(fù)責(zé)人們更方便的構(gòu)建與應(yīng)用各種Agent,該智能體平臺(tái)會(huì)基于構(gòu)建-應(yīng)用-分享-反饋的應(yīng)用路徑發(fā)展,同時(shí)Agent的架構(gòu)邏輯與思維也會(huì)用于支持平臺(tái)的整體運(yùn)營。 智能體的平臺(tái)屬性意味著它不只僅僅用于構(gòu)建和分發(fā)Agent,更重要的是能夠?yàn)橛脩籼峁┌ò踩⑦\(yùn)營、維護(hù)等在內(nèi)的交付能力。不僅需要內(nèi)置為用戶構(gòu)建智能體所需要的各種插件和組件,還需要能夠在智能體構(gòu)建過程中隨時(shí)給與用戶反饋以保證項(xiàng)目成功。即實(shí)現(xiàn)為B端客戶提供一站式智能體數(shù)字員工解決方案的目標(biāo)。
而智能體的平臺(tái)化實(shí)現(xiàn)可以完美規(guī)避像最近GPTs推出后OpenAI出現(xiàn)的各種安全問題。例如在數(shù)據(jù)安全上根本無法過企業(yè)用戶的關(guān),不是私有化部署的用戶,幾乎都不敢構(gòu)建GPTs,更不用說對(duì)外分享。 從業(yè)務(wù)流程角度來看,Agent的應(yīng)用是在LLM的基礎(chǔ)上進(jìn)一步實(shí)現(xiàn)的業(yè)務(wù)流程自動(dòng)化。而目前包括GPTs在內(nèi)的各種AI智能體表現(xiàn)來看,普遍存在兩種情況: 一是安全系數(shù)不過關(guān),頻頻出現(xiàn)的數(shù)據(jù)泄漏問題讓廣大組織望而生畏,而中小企業(yè)又沒有能力私有化部署LLM; 二是Agent所帶來的流程自動(dòng)化仍停留于粗淺層面,尚無法為企業(yè)內(nèi)部動(dòng)輒幾十上百種的業(yè)務(wù)系統(tǒng)提供業(yè)務(wù)流自動(dòng)化支持。 所以,AI?Agent想要真正在B端實(shí)現(xiàn)大量業(yè)務(wù)場景的落地商用,需要綜合考量其自身的安全性、技術(shù)發(fā)展周期是否成熟以及To?B端的場景是否密切貼合等。
03、企業(yè)級(jí)AI智能體平臺(tái)
你說,PC做!所見即所得
??企業(yè)自動(dòng)化實(shí)現(xiàn)必備的智能體數(shù)字員工 ??自主拆解任務(wù) ??感知當(dāng)前環(huán)境 ??執(zhí)行并且反饋 ??記憶歷史經(jīng)驗(yàn) 在講述企業(yè)級(jí)AI智能體平臺(tái)之前,我們先來看一個(gè)真實(shí)應(yīng)用案例。 這是一個(gè)使用RPA智能體自動(dòng)構(gòu)建「從XX網(wǎng)銀客戶端下載交易數(shù)據(jù)(敏感信息打碼)」自動(dòng)化流程的應(yīng)用案例,可以看到要構(gòu)建這樣一個(gè)自動(dòng)化流程,只需在TARS大模型對(duì)話框輸入“打開客戶端,查詢默認(rèn)賬號(hào)幾年的交易數(shù)據(jù),并下載導(dǎo)出”,TARS就能自動(dòng)創(chuàng)建執(zhí)行計(jì)劃,點(diǎn)擊執(zhí)行它就能按照?qǐng)?zhí)行計(jì)劃一步步去執(zhí)行,等它執(zhí)行完以后,一個(gè)可以復(fù)用的自動(dòng)化流程也構(gòu)建完成了。 使用這種方式構(gòu)建自動(dòng)化流程,人機(jī)協(xié)作的部分也可以出現(xiàn)智能體生成的流程步驟需要修改時(shí)才會(huì)出現(xiàn)。整個(gè)流程構(gòu)建的過程中不再需要
“拖拉拽”
各種組件和代碼塊,任何業(yè)務(wù)線上的工作人員都能隨時(shí)根據(jù)自己實(shí)際業(yè)務(wù)需求來通過企業(yè)級(jí)AI智能體實(shí)現(xiàn)可視,人機(jī)共創(chuàng)的自動(dòng)化流程。 而案例所使用的AI智能體產(chǎn)品,是
實(shí)在智能推出的RPA?Agent智能體
。這是一個(gè)能夠
自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗(yàn)
的RPA?Agent,進(jìn)一步降低了智能體數(shù)字員工的使用門檻。
實(shí)在智能憑借其自創(chuàng)業(yè)初就深深扎根在AI領(lǐng)域強(qiáng)大的自研能力和幫助大中型企業(yè)客戶獲取豐富的自動(dòng)化落地解決方案的經(jīng)驗(yàn),在經(jīng)歷第一代專家模式RPA、第二代易用模式IPA之后,迭代成為現(xiàn)在的第三代對(duì)話模式RPA,即
融合TARS大語言模型的RPA?Agent智能體
。 實(shí)在智能垂直領(lǐng)域大模型TARS的推出,為RPA數(shù)字員工注入
“TARS+ISSUT(智能屏幕語義理解技術(shù))”雙模引擎
。雙?;?dòng)構(gòu)成了TARS-RPA-Agent,實(shí)現(xiàn)對(duì)屏幕上一切元素的自動(dòng)化操作,并為行業(yè)帶來
“你說,PC做”
全新工作布置方式,實(shí)現(xiàn)流程自動(dòng)化創(chuàng)建的
“所說即所得”
。 這里“你說,PC做”的意思是,通過RPA智能體構(gòu)建包括所有企業(yè)管理軟件在內(nèi)的自動(dòng)化操作流程,而并非通過GPT?builder等Agent構(gòu)建平臺(tái)構(gòu)建類GPTs的輕量級(jí)Agent。如果說其他平臺(tái)構(gòu)建的Agent還是Agent工具,RPA?Agent構(gòu)建的Agent則是智能體數(shù)字員工。
RPA?Agent智能體不只發(fā)揮了LLM理解與分析的優(yōu)勢,更借助ISSUT技術(shù)對(duì)各類C/S、B/S架構(gòu)的企業(yè)應(yīng)用進(jìn)行頁面識(shí)別、理解和操作,同時(shí)保留了RPA特色,只要能夠識(shí)別的元素全部都能用來構(gòu)建流程自動(dòng)化的實(shí)現(xiàn)。同時(shí)可以面向包含API接口及UI自動(dòng)化的所有管理程序構(gòu)建自動(dòng)化程序,故而可以完全用于企業(yè)運(yùn)營的業(yè)務(wù)流程自動(dòng)化構(gòu)建。
04、超自動(dòng)化平臺(tái)
Agent?智能體數(shù)字員工才更靠譜
??成熟的超自動(dòng)化底層技術(shù)融合能力 ??最全的平臺(tái)級(jí)部署和交付能力 ??可擴(kuò)展的智能體平臺(tái)級(jí)能力 ??豐富和復(fù)雜業(yè)務(wù)場景自動(dòng)化部署經(jīng)驗(yàn) 企業(yè)要引入AI智能體進(jìn)行流程優(yōu)化,必須經(jīng)過成本控制、投入預(yù)算、實(shí)現(xiàn)效率、安全管控等多方面嚴(yán)格及縝密的評(píng)估。這就要求技術(shù)供應(yīng)商提供的必須是平臺(tái)級(jí)解決方案,而不是只針對(duì)單一、個(gè)別場景需求來提供的智能體自動(dòng)化解決方案。 越復(fù)雜的業(yè)務(wù)流程自動(dòng)化,對(duì)智能體廠商平臺(tái)的底層技術(shù)融合能力、數(shù)據(jù)安全性掌控能力、產(chǎn)品部署后的運(yùn)營和維護(hù)能力、交付能力及產(chǎn)品和解決方案的可擴(kuò)展能力等的要求也就越嚴(yán)格。這也對(duì)AI?Agent技術(shù)供應(yīng)商提出了更高的要求,
必需具備豐富的幫大場實(shí)現(xiàn)超大和復(fù)雜業(yè)務(wù)場景自動(dòng)化落地的經(jīng)驗(yàn)
。
大型企業(yè)引入新的AI技術(shù)不允許任何試錯(cuò)成本,因此技術(shù)供應(yīng)商給出的解決方案必須是開箱即用、具備行業(yè)KNOW-HOW術(shù)語和業(yè)務(wù)規(guī)則的真實(shí)智能體數(shù)字員工。也只有這樣的標(biāo)準(zhǔn)化智能體,才能被納入企業(yè)的內(nèi)部編制中去統(tǒng)一管理和調(diào)度。 除此之外,要實(shí)現(xiàn)AI?Agent更好地商用,需要考慮接口成本、隱私、管理、授權(quán)等諸多因素,這既是很多供應(yīng)商的技術(shù)與產(chǎn)品門檻,也是廣大企業(yè)選型的重要依據(jù)。 所以,企業(yè)在選擇用于業(yè)務(wù)流程自動(dòng)化的AI智能體時(shí),也是優(yōu)先考慮超自動(dòng)化廠商推出的AI智能體產(chǎn)品,而不是選擇LLM廠商推出的尚未成熟的通過API連接各種插件的單一智能體解決方案。 這種情況下,在B端市場,由ERP、BPM、超自動(dòng)化等企業(yè)管理軟件廠商推出的AI智能體反而更受關(guān)注。大部分企業(yè)會(huì)根據(jù)自身需求,選擇能夠能夠結(jié)合業(yè)務(wù)特點(diǎn)、具備豐富流程自動(dòng)化落地經(jīng)驗(yàn)且能夠解決更復(fù)雜更龐大業(yè)務(wù)流程自動(dòng)化的需求的技術(shù)供應(yīng)商,以快速實(shí)現(xiàn)新AI智能體解決方案落地。 這也是為什么老牌RPA廠商融合LLM后,更容易將智能體做成平臺(tái)級(jí)別產(chǎn)品的原因。
就如推出RPA?Agent智能體的實(shí)在智能,除了具備上面所列的多個(gè)先發(fā)優(yōu)勢外:
已經(jīng)擁有豐富落地案例的RPA、IDP、流程挖掘、ISSUT等所有產(chǎn)品組合都是按照平臺(tái)級(jí)別打造的
,現(xiàn)在的RPA智能體也是在之前超自動(dòng)化平臺(tái)的基礎(chǔ)上
融合LLM及Agent架構(gòu)打造的
。 實(shí)在智能的RPA?Agent智能體產(chǎn)品自誕生之日開始,就是比爾蓋茨所說的
平臺(tái)級(jí)智能體產(chǎn)品
。
05、AI?Agent前半場
實(shí)在智能平臺(tái)級(jí)AI智能體先跑出來了
??高安全性 ??高易用性 ??強(qiáng)擴(kuò)展能力 在超自動(dòng)化領(lǐng)域,很多人認(rèn)為LLM廠商推出的AI?Agent,可能會(huì)優(yōu)先顛覆之前的RPA、低代碼、工作流、流程挖掘等企業(yè)管理平臺(tái)。 但現(xiàn)在深入了解后發(fā)現(xiàn)的真相卻是,這些超自動(dòng)化平臺(tái)通過融合自有大語言模型或者集成第三方大語言模型API,在此基礎(chǔ)上推出的AI?Agent反而更勝一籌,無論
在安全性方面,還是易用性、擴(kuò)展能力
等方面,都明顯優(yōu)于現(xiàn)在市面上其他Agent。
如果套上“LLM+規(guī)劃+記憶+工具”這個(gè)Agent架構(gòu),RPA、低代碼等都屬于工具,但這個(gè)工具是融合AI等多種技術(shù)的平臺(tái)級(jí)別工具,它與GPT等通過API調(diào)用的輕量級(jí)工具有著顯著區(qū)別。 有的推出Agent智能體的廠商如實(shí)在智能,也推出了自己的垂直領(lǐng)域大模型,因此在Agent構(gòu)建及技術(shù)架構(gòu)方面可以有更多的選擇以及靈活的策略。更重要的作為超自動(dòng)化廠商,他們擁有更多的技術(shù)、工具、數(shù)據(jù)以及經(jīng)驗(yàn),可以基于自身優(yōu)勢打造更符合產(chǎn)品特性及用戶屬性的AI智能體,并能夠?yàn)橛脩舳ㄖ茖俚膫€(gè)性化企業(yè)級(jí)AI智能體。 這樣的AI智能體能夠更好地理解用戶指令意圖并為RPA等工具規(guī)劃各種任務(wù),更能夠無縫融合及適配所有工具、數(shù)據(jù)、知識(shí)及經(jīng)驗(yàn)。 目前看來由企業(yè)管理軟件廠商推出的平臺(tái)級(jí)AI?Agent明顯要靠譜得多,且已真正實(shí)現(xiàn)落地商用。
AI?Agent前半場,實(shí)在智能平臺(tái)級(jí)AI智能體先跑出來了。