散文網(wǎng) » 生活 »日常 » 你說，PC做！實在智能推出行業(yè)首個基于大模型的TARS-RPA-Agent產品

你說，PC做！實在智能推出行業(yè)首個基于大模型的TARS-RPA-Agent產品

2023-08-17 16:50 作者:實在RPA_IPA 0人讀過 | 我要投稿

2023年初，火遍全球的ChatGPT揭開AIGC元年大幕，國內外各家科技公司紛紛發(fā)布大模型，一時間“百模大戰(zhàn)”風起云涌。6月下旬，AI行業(yè)準獨角獸實在智能（Intelligence?Indeed）開啟自研垂直大語言模型“塔斯（TARS）”內測。

在此之前，早在2022年12月，實在智能曾首創(chuàng)基于計算機視覺大模型的“智能屏幕語義理解”技術（ISSUT），并發(fā)布“實在IPA”模式，將RPA從傳統(tǒng)“拖拉拽”的專家模式進階到輕松“點選用”的小白模式，實現(xiàn)RPA的人人可用。

時針再撥到2023年下半年，“大模型如何在真實商業(yè)場景快速、有效落地”成為科技界與產業(yè)界最關注的首要問題。8月16日，實在智能召開第七次新品發(fā)布會，對這個問題交出實實在在的答卷。

會上，實在智能正式發(fā)布“塔斯（TARS）”大模型，并震撼推出行業(yè)首個基于大模型的TARS-RPA-Agent產品，將數(shù)字員工應用門檻進一步大幅降低，實現(xiàn)“所說即所得，你說，PC做！”

下面，小編帶您一同進入TARS的世界，回顧干貨滿滿、精彩紛呈的科技盛宴：

大模型開啟RPA新境界：對話式生成數(shù)字員工，自主完成工作

實在智能創(chuàng)始人兼CEO孫林君（阿寶）在開場致辭中提到，在大模型時代，數(shù)字員工的終極形態(tài)已變得越來越清晰——“大模型與RPA緊密結合，大幅降低使用門檻，突破接口能力邊界。數(shù)字員工將具備自主完成任務的能力，成為每個人的智能數(shù)字助理，讓工作生活更輕松”。本次發(fā)布會推出的“TARS-RPA-Agent”是業(yè)界首款計算機視覺與大語言模型結合的智能體產品，相信會對RPA行業(yè)的發(fā)展具有里程碑的意義。

他同時回顧了五年來的技術迭代和產品創(chuàng)新，“實在智能已擁有50余項發(fā)明專利，300余項知識產權，這是我們踏踏實實做好技術、做好產品的力證”，作為一家平臺型的科技公司，實在智能致力于不斷迭代產品技術，通過標準化產品和解決方案為千行百業(yè)客戶和生態(tài)合作伙伴賦能，同時構建客戶最優(yōu)感知的交付和服務體系。?

實在智能全新技術底：TARS大模型

內測開啟45天之后，實在智能合伙人、核心算法部負責人歐陽小剛（新一）與算法專家汪東瑤（奎托斯）共同揭開了“塔斯（TARS）”大模型的神秘面紗。

在AIGC時代到來之際，實在智能通過“TARS大語言模型（通用基礎模型、各個垂直行業(yè)模型）+ISSUT（智能屏幕語義理解）機器視覺大模型”重構了技術底座，并在這二者之上，對超自動化產品矩陣升級改造，持續(xù)發(fā)布創(chuàng)新應用。

發(fā)布會上，TARS大模型展現(xiàn)了優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等主流能力:

其中，與湘財證券共建的“自研、有效、安全、可信任、可落地”的財經(jīng)行業(yè)大模型TARS-Finance-7B，既保留了生成類大模型的通用技能，更在金融財經(jīng)領域得到了顯著的加強和提升，在多個中英文的通用基準測評集和財經(jīng)領域基準測評集上均取得良好成績：

在財經(jīng)領域，與同為60-70億參數(shù)的Baseline模型相比，TARS-Finance-7B模型平均任務得分領先1%~20%；

在通用領域，TARS-Finance-7B相較基座模型和其他同尺寸Baseline模型，旗鼓相當并在部分領域領先。

優(yōu)異測評成績的背后，是歷時4個月實實在在的工作：

基于充分細致的語料收集和清洗、數(shù)據(jù)處理及標注，超千億Tokens的預訓練語料和超百萬條指令微調數(shù)據(jù)，實在智能獨立完整復現(xiàn)大模型構建的預訓練、指令微調和人類反饋強化學習（RLHF）三階段，使大模型具備完整能力

自主研發(fā)用于中文不當言論判別和生成終止的Detoxify系統(tǒng)，提升模型的安全性和無害性，讓大模型“既懂事，又懂法”

輕便落地的大模型，才是更好的大模型。“成本可控、效果可用、定制化訓練、私有化部署”是TARS大模型在真實場景商用落地的關鍵特性。

在解決大模型的輕便性和易用性方面，實在智能也做了很多創(chuàng)新，如通過模型量化降低推理階段的硬件資源消耗、通過推理加速工具和技術優(yōu)化問答交互產品體驗等。此外，TARS大模型支持無縫對接實在Chatbot產品，可以將大模型的能力通過“?鍵配置”便捷投放到網(wǎng)頁、App、小程序等各個終端，同時支持私有化部署，模型更可控、數(shù)據(jù)更安全！

讓大模型“看得見?動起來”：行業(yè)首發(fā)TARS-RPA-Agent

實在智能進入超自動化賽道以來，不斷將AI技術與RPA產品進行深度融合，持續(xù)推動創(chuàng)新應用。曾在業(yè)內首創(chuàng)“融合拾取”技術，支持頂層拾取與CV拾取無縫融合，使得傳統(tǒng)RPA“拖拉拽”專家模式穩(wěn)定絲滑；進而首創(chuàng)“智能屏幕語義理解”技術（ISSUT），支持對電腦、手機、平板等屏幕的理解，通過實在IPA開創(chuàng)“點選用”的小白模式。

大模型時代開啟后，實在智能一直在思考如何將大模型與RPA產品相結合，通過文本指令或對話聊天的方式直接生成數(shù)字員工，操作PC電腦自主完成工作任務。從而在實在IPA“小白模式”基礎上，將RPA使用門檻再進一步降低，直接進入到“所說即所得，你說，PC做”的“傻瓜模式”。

經(jīng)過不斷探索和嘗試，實在智能在業(yè)界首發(fā)基于大模型的Agent產品，即TARS-RPA-Agent——這是一個基于“TARS+ISSUT”雙模引擎，有“大腦”，更有“眼睛和手腳”的超自動化智能體。同時，也是能夠自主拆解任務、感知當前環(huán)境、執(zhí)行并且反饋、記憶歷史經(jīng)驗的RPA全新模式。
發(fā)布會上，歐陽小剛（新一）詳細介紹了TARS-RPA-Agent在設計過程中的解決的關鍵問題和創(chuàng)新特性：

①自主拆解任務：復雜問題，分而治之

在實際場景中，人類的復雜指令往往蘊含在非常簡潔的語句當中，并不是通過大模型生成一段Python代碼，或簡單調用3-5個RPA組件就能實現(xiàn)。

TARS-RPA-Agent支持將表述簡單但含義復雜的指令，進行Chain-Of-Thought式的自主拆解和細化，之后將拆解出的子任務和具體步驟與實在RPA的流程塊和組件進行映射，最終完成一體化、高可控的復雜流程生成。

例如，“我要買一臺筆記本電腦，幫我推薦下”，TARS-RPA-Agent可將其拆解成“登錄購物網(wǎng)站，查詢筆記本電腦品牌、配置、價格等信息，完成產品推薦”等多個步驟并加以自動實現(xiàn)。

②感知當前環(huán)境：人類視角，理解屏幕

“如何在理解指令含義的基礎上，精準找到所要操作的屏幕畫面上哪里是輸入框、登錄按鈕或者聊天窗口？如果不僅僅是基于瀏覽器的軟件而是成千上萬種不同CS架構的客戶端軟件怎么辦……”

“你是我的眼”，基于計算機視覺大模型的“智能屏幕語義理解”技術（ISSUT）為TARS-RPA-Agent裝上了感知世界的眼睛，帶來真正基于人類視覺的電腦屏幕和操作對象理解。

ISSUT使得TARS-RPA-Agent可以“秒懂”屏幕畫面，第一時間完成自動解析，無需人工介入?yún)⑴c。在無法解析網(wǎng)頁源代碼或者客戶端軟件不開放API接口的大量真實場景中，ISSUT的價值倍加凸顯。

例如，理解指令并自動操作并不開放API接口的企業(yè)微信：

③執(zhí)行并且反饋：環(huán)環(huán)相扣，單步尋優(yōu)

PDCA（計劃、執(zhí)行、檢查、處理）是人類優(yōu)秀的工作習慣，在執(zhí)行過程中不斷反饋和修正是客觀世界的一般規(guī)律。真實場景的意圖理解和任務執(zhí)行非常復雜，TARS-RPA-Agent同樣需要保證每一步操作的正確性，避免因為理解偏差，或者操作失誤，導致最終無法完成任務。

因此，TARS-RPA-Agent巧妙地設計了“基于強化學習的單步尋優(yōu)策略和每步執(zhí)行的反饋”相關機制，不斷提高決策和執(zhí)行過程的正確性、可控性。

例如，基于之前動作的啟發(fā)式尋優(yōu)：

④記憶歷史經(jīng)驗：擴展檢索、長時記憶

“圣斗士不會被同樣的招數(shù)打敗兩次”，作為一個智能體，TARS-RPA-Agent也需要提升自主學習和迭代能力，從而能夠學習歷史經(jīng)驗，并通過歷史案例不斷提升下次遇到類似任務時的自主決策能力，持續(xù)提升人機協(xié)同效率。

大模型的上下文保留和決策優(yōu)化等長時記憶能力，通常通過內存管理等手段實現(xiàn)。TARS-RPA-Agent也結合上下文擴展、向量檢索等技術，配備了長時記憶能力，支持將過往任務的執(zhí)行情況、用戶修正、執(zhí)行結果等保存到數(shù)據(jù)庫，并作為后續(xù)分析和優(yōu)化的基礎。

“TARS+”開啟無限可能

發(fā)布會上，實在智能合伙人、產品創(chuàng)新部負責人周春照（索隆），實在智能合伙人、創(chuàng)新研發(fā)中心負責人趙明（鳴人），以及產品專家張譯顥（拓海）、張鑫燕（虞姬）等，分別接連上新體驗感拉滿、智能感十足的TARS大模型與超自動化產品矩陣的深度融合產品，以及全面支持國產信創(chuàng)的IPA數(shù)字員工。

TARS+RPA=ChatRPA

TARS+IDP=ChatIDP

TARS+Platform=ChatPlatform

TARS+國產信創(chuàng)IPA數(shù)字員工

?

實在智能始終秉持“AI賦能商業(yè)”初心，堅定相信人機協(xié)同及超自動化時代的美好未來，在過往三年里連續(xù)舉辦新品發(fā)布會，不斷帶快行業(yè)創(chuàng)新節(jié)奏：

2022.12.7?“蝶變·新番”，無需拖拉拽、只需點選用的實在IPA模式讓RPA真正人人可用

2022.3.31?“AI你所愛，新益求新”，一直創(chuàng)新，永遠AI

2021.10.18?創(chuàng)新領先的融合拾取技術帶來“拾全拾美·無邊無界”

2021.5.25?“新·動·智·燃”，實實在在的創(chuàng)新突破

2021.1.8?快速迭代進化的實在RPA讓“重復的歸我，創(chuàng)造的歸你”

2020.7.15?實在的第一聲問候：“智驅未來丨Hello，數(shù)字員工”！

本次發(fā)布會，TARS+ISSUT大模型雙底座為超自動化帶來嶄新視野，TARS-RPA-Agent開創(chuàng)人機協(xié)同“你說，PC做！”的更高境界。

后續(xù)，在對模型性能、安全性等方面進行充分評估和修正后，實在智能將對社區(qū)開源TARS-Finance-7B財經(jīng)大模型，以促進生成式大模型方向的學術研究和應用發(fā)展。也將繼續(xù)擴大TARS垂直大模型的參數(shù)規(guī)模，迎接更多的能力涌現(xiàn)。

實在智能將繼續(xù)與國內外學界、產業(yè)界同仁一起努力，奔向擁有無限可能的彼岸。

按照慣例，我們不說再見，下一次實在智能產品發(fā)布會，與您在更高峰相見！

標簽：AI RPA 大模型實在智能