你說,PC做!實在智能推出行業(yè)首個基于大模型的TARS-RPA-Agent產品
你說,PC做!實在智能推出行業(yè)首個基于大模型的TARS-RPA-Agent產品
2023年初,火遍全球的ChatGPT揭開AIGC元年大幕,國內外各家科技公司紛紛發(fā)布大模型,一時間“百模大戰(zhàn)”風起云涌。6月下旬,AI行業(yè)準獨角獸實在智能(Intelligence?Indeed)開啟自研垂直大語言模型“塔斯(TARS)”內測。
在此之前,早在2022年12月,實在智能曾首創(chuàng)基于計算機視覺大模型的“智能屏幕語義理解”技術(ISSUT),并發(fā)布“實在IPA”模式,將RPA從傳統(tǒng)“拖拉拽”的專家模式進階到輕松“點選用”的小白模式,實現(xiàn)RPA的人人可用。
時針再撥到2023年下半年,“大模型如何在真實商業(yè)場景快速、有效落地”成為科技界與產業(yè)界最關注的首要問題。8月16日,實在智能召開第七次新品發(fā)布會,對這個問題交出實實在在的答卷。
會上,實在智能正式發(fā)布“塔斯(TARS)”大模型,并震撼推出行業(yè)首個基于大模型的TARS-RPA-Agent產品,將數(shù)字員工應用門檻進一步大幅降低,實現(xiàn)“所說即所得,你說,PC做!”
下面,小編帶您一同進入TARS的世界,回顧干貨滿滿、精彩紛呈的科技盛宴:
大模型開啟RPA新境界:對話式生成數(shù)字員工,自主完成工作
實在智能創(chuàng)始人兼CEO孫林君(阿寶)在開場致辭中提到,在大模型時代,數(shù)字員工的終極形態(tài)已變得越來越清晰——“大模型與RPA緊密結合,大幅降低使用門檻,突破接口能力邊界。數(shù)字員工將具備自主完成任務的能力,成為每個人的智能數(shù)字助理,讓工作生活更輕松”。本次發(fā)布會推出的“TARS-RPA-Agent”是業(yè)界首款計算機視覺與大語言模型結合的智能體產品,相信會對RPA行業(yè)的發(fā)展具有里程碑的意義。
他同時回顧了五年來的技術迭代和產品創(chuàng)新,“實在智能已擁有50余項發(fā)明專利,300余項知識產權,這是我們踏踏實實做好技術、做好產品的力證”,作為一家平臺型的科技公司,實在智能致力于不斷迭代產品技術,通過標準化產品和解決方案為千行百業(yè)客戶和生態(tài)合作伙伴賦能,同時構建客戶最優(yōu)感知的交付和服務體系。?
實在智能全新技術底:TARS大模型
內測開啟45天之后,實在智能合伙人、核心算法部負責人歐陽小剛(新一)與算法專家汪東瑤(奎托斯)共同揭開了“塔斯(TARS)”大模型的神秘面紗。
在AIGC時代到來之際,實在智能通過“TARS大語言模型(通用基礎模型、各個垂直行業(yè)模型)+ISSUT(智能屏幕語義理解)機器視覺大模型”重構了技術底座,并在這二者之上,對超自動化產品矩陣升級改造,持續(xù)發(fā)布創(chuàng)新應用。
發(fā)布會上,TARS大模型展現(xiàn)了優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力:

其中,與湘財證券共建的“自研、有效、安全、可信任、可落地”的財經(jīng)行業(yè)大模型TARS-Finance-7B,既保留了生成類大模型的通用技能,更在金融財經(jīng)領域得到了顯著的加強和提升,在多個中英文的通用基準測評集和財經(jīng)領域基準測評集上均取得良好成績:
在財經(jīng)領域,與同為60-70億參數(shù)的Baseline模型相比,TARS-Finance-7B模型平均任務得分領先1%~20%;
在通用領域,TARS-Finance-7B相較基座模型和其他同尺寸Baseline模型,旗鼓相當并在部分領域領先。

優(yōu)異測評成績的背后,是歷時4個月實實在在的工作:
基于充分細致的語料收集和清洗、數(shù)據(jù)處理及標注,超千億Tokens的預訓練語料和超百萬條指令微調數(shù)據(jù),實在智能獨立完整復現(xiàn)大模型構建的預訓練、指令微調和人類反饋強化學習(RLHF)三階段,使大模型具備完整能力
自主研發(fā)用于中文不當言論判別和生成終止的Detoxify系統(tǒng),提升模型的安全性和無害性,讓大模型“既懂事,又懂法”

輕便落地的大模型,才是更好的大模型。“成本可控、效果可用、定制化訓練、私有化部署”是TARS大模型在真實場景商用落地的關鍵特性。
在解決大模型的輕便性和易用性方面,實在智能也做了很多創(chuàng)新,如通過模型量化降低推理階段的硬件資源消耗、通過推理加速工具和技術優(yōu)化問答交互產品體驗等。此外,TARS大模型支持無縫對接實在Chatbot產品,可以將大模型的能力通過“?鍵配置”便捷投放到網(wǎng)頁、App、小程序等各個終端,同時支持私有化部署,模型更可控、數(shù)據(jù)更安全!
讓大模型“看得見?動起來”:行業(yè)首發(fā)TARS-RPA-Agent
實在智能進入超自動化賽道以來,不斷將AI技術與RPA產品進行深度融合,持續(xù)推動創(chuàng)新應用。曾在業(yè)內首創(chuàng)“融合拾取”技術,支持頂層拾取與CV拾取無縫融合,使得傳統(tǒng)RPA“拖拉拽”專家模式穩(wěn)定絲滑;進而首創(chuàng)“智能屏幕語義理解”技術(ISSUT),支持對電腦、手機、平板等屏幕的理解,通過實在IPA開創(chuàng)“點選用”的小白模式。
大模型時代開啟后,實在智能一直在思考如何將大模型與RPA產品相結合,通過文本指令或對話聊天的方式直接生成數(shù)字員工,操作PC電腦自主完成工作任務。從而在實在IPA“小白模式”基礎上,將RPA使用門檻再進一步降低,直接進入到“所說即所得,你說,PC做”的“傻瓜模式”。

經(jīng)過不斷探索和嘗試,實在智能在業(yè)界首發(fā)基于大模型的Agent產品,即TARS-RPA-Agent——這是一個基于“TARS+ISSUT”雙模引擎,有“大腦”,更有“眼睛和手腳”的超自動化智能體。同時,也是能夠自主拆解任務、感知當前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗的RPA全新模式。
發(fā)布會上,歐陽小剛(新一)詳細介紹了TARS-RPA-Agent在設計過程中的解決的關鍵問題和創(chuàng)新特性:
①自主拆解任務:復雜問題,分而治之
在實際場景中,人類的復雜指令往往蘊含在非常簡潔的語句當中,并不是通過大模型生成一段Python代碼,或簡單調用3-5個RPA組件就能實現(xiàn)。
TARS-RPA-Agent支持將表述簡單但含義復雜的指令,進行Chain-Of-Thought式的自主拆解和細化,之后將拆解出的子任務和具體步驟與實在RPA的流程塊和組件進行映射,最終完成一體化、高可控的復雜流程生成。
例如,“我要買一臺筆記本電腦,幫我推薦下”,TARS-RPA-Agent可將其拆解成“登錄購物網(wǎng)站,查詢筆記本電腦品牌、配置、價格等信息,完成產品推薦”等多個步驟并加以自動實現(xiàn)。

②感知當前環(huán)境:人類視角,理解屏幕
“如何在理解指令含義的基礎上,精準找到所要操作的屏幕畫面上哪里是輸入框、登錄按鈕或者聊天窗口?如果不僅僅是基于瀏覽器的軟件而是成千上萬種不同CS架構的客戶端軟件怎么辦……”
“你是我的眼”,基于計算機視覺大模型的“智能屏幕語義理解”技術(ISSUT)為TARS-RPA-Agent裝上了感知世界的眼睛,帶來真正基于人類視覺的電腦屏幕和操作對象理解。
ISSUT使得TARS-RPA-Agent可以“秒懂”屏幕畫面,第一時間完成自動解析,無需人工介入?yún)⑴c。在無法解析網(wǎng)頁源代碼或者客戶端軟件不開放API接口的大量真實場景中,ISSUT的價值倍加凸顯。
例如,理解指令并自動操作并不開放API接口的企業(yè)微信:

③執(zhí)行并且反饋:環(huán)環(huán)相扣,單步尋優(yōu)
PDCA(計劃、執(zhí)行、檢查、處理)是人類優(yōu)秀的工作習慣,在執(zhí)行過程中不斷反饋和修正是客觀世界的一般規(guī)律。真實場景的意圖理解和任務執(zhí)行非常復雜,TARS-RPA-Agent同樣需要保證每一步操作的正確性,避免因為理解偏差,或者操作失誤,導致最終無法完成任務。
因此,TARS-RPA-Agent巧妙地設計了“基于強化學習的單步尋優(yōu)策略和每步執(zhí)行的反饋”相關機制,不斷提高決策和執(zhí)行過程的正確性、可控性。
例如,基于之前動作的啟發(fā)式尋優(yōu):

④記憶歷史經(jīng)驗:擴展檢索、長時記憶
“圣斗士不會被同樣的招數(shù)打敗兩次”,作為一個智能體,TARS-RPA-Agent也需要提升自主學習和迭代能力,從而能夠學習歷史經(jīng)驗,并通過歷史案例不斷提升下次遇到類似任務時的自主決策能力,持續(xù)提升人機協(xié)同效率。
大模型的上下文保留和決策優(yōu)化等長時記憶能力,通常通過內存管理等手段實現(xiàn)。TARS-RPA-Agent也結合上下文擴展、向量檢索等技術,配備了長時記憶能力,支持將過往任務的執(zhí)行情況、用戶修正、執(zhí)行結果等保存到數(shù)據(jù)庫,并作為后續(xù)分析和優(yōu)化的基礎。
“TARS+”開啟無限可能
發(fā)布會上,實在智能合伙人、產品創(chuàng)新部負責人周春照(索隆),實在智能合伙人、創(chuàng)新研發(fā)中心負責人趙明(鳴人),以及產品專家張譯顥(拓海)、張鑫燕(虞姬)等,分別接連上新體驗感拉滿、智能感十足的TARS大模型與超自動化產品矩陣的深度融合產品,以及全面支持國產信創(chuàng)的IPA數(shù)字員工。

TARS+RPA=ChatRPA

TARS+IDP=ChatIDP

TARS+Platform=ChatPlatform

TARS+國產信創(chuàng)IPA數(shù)字員工

?
實在智能始終秉持“AI賦能商業(yè)”初心,堅定相信人機協(xié)同及超自動化時代的美好未來,在過往三年里連續(xù)舉辦新品發(fā)布會,不斷帶快行業(yè)創(chuàng)新節(jié)奏:
2022.12.7?“蝶變·新番”,無需拖拉拽、只需點選用的實在IPA模式讓RPA真正人人可用
2022.3.31?“AI你所愛,新益求新”,一直創(chuàng)新,永遠AI
2021.10.18?創(chuàng)新領先的融合拾取技術帶來“拾全拾美·無邊無界”
2021.5.25?“新·動·智·燃”,實實在在的創(chuàng)新突破
2021.1.8?快速迭代進化的實在RPA讓“重復的歸我,創(chuàng)造的歸你”
2020.7.15?實在的第一聲問候:“智驅未來丨Hello,數(shù)字員工”!
本次發(fā)布會,TARS+ISSUT大模型雙底座為超自動化帶來嶄新視野,TARS-RPA-Agent開創(chuàng)人機協(xié)同“你說,PC做!”的更高境界。
后續(xù),在對模型性能、安全性等方面進行充分評估和修正后,實在智能將對社區(qū)開源TARS-Finance-7B財經(jīng)大模型,以促進生成式大模型方向的學術研究和應用發(fā)展。也將繼續(xù)擴大TARS垂直大模型的參數(shù)規(guī)模,迎接更多的能力涌現(xiàn)。
實在智能將繼續(xù)與國內外學界、產業(yè)界同仁一起努力,奔向擁有無限可能的彼岸。
按照慣例,我們不說再見,下一次實在智能產品發(fā)布會,與您在更高峰相見!