最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

PP-ChatOCRv2、大模型半監(jiān)督學(xué)習(xí)工具PaddleX新特性等你來pick

2023-11-14 15:10 作者:飛槳PaddlePaddle  | 我要投稿

小A是一名剛剛畢業(yè)的算法工程師,有一天,他被老板安排了一個(gè)活,要對(duì)一批合同掃描件進(jìn)行自動(dòng)化信息抽取,輸出結(jié)構(gòu)化的分析報(bào)表。OCR問題不大,但是怎么進(jìn)行批量的結(jié)構(gòu)化信息抽取呢?小A陷入了苦苦思索... 小B是一名項(xiàng)目經(jīng)理,最近他接手了一個(gè)緊急的AI項(xiàng)目,客戶提供的數(shù)據(jù)很多,但是標(biāo)注的樣本很少,很難達(dá)到客戶要求的精度指標(biāo)。而如果大量標(biāo)注數(shù)據(jù),時(shí)間上根本來不及。deadline一天天臨近,小B整天愁眉苦臉... 小C是一家小型AI服務(wù)提供商的老板,長期做項(xiàng)目下來,他總覺得需要沉淀一套標(biāo)準(zhǔn)化的工具,快速應(yīng)對(duì)多種多樣的場(chǎng)景需求,尤其要滿足多種復(fù)雜環(huán)境的模型部署,但公司的研發(fā)力量被項(xiàng)目纏身,陷入了惡性循環(huán)。小C一籌莫展... 俗話說的好,方法總比困難多,新版本的PaddleX有望解決小A、小B和小C的燃眉之急! 轉(zhuǎn)眼間,距離飛槳AI套件PaddleX的正式發(fā)布Run in PaddleX!四步搞定10+任務(wù)場(chǎng)景36個(gè)精選產(chǎn)業(yè)模型開發(fā)與部署!已經(jīng)過去了兩個(gè)月。兩個(gè)月期間,PaddleX團(tuán)隊(duì)快速響應(yīng)AI落地的新需求、新功能,以期能在今天新內(nèi)容發(fā)布中給大家交一個(gè)滿意的答卷!接下來,就讓我們看一看PaddleX都帶來了什么新內(nèi)容吧!

四大更新內(nèi)容速覽

強(qiáng)大的大小模型結(jié)合特色工具

PP-ChatOCRv2:

PP-OCR與

文心一言

強(qiáng)強(qiáng)結(jié)合,支持

1.5萬+大字庫

,

解決生僻字、多頁pdf、表格識(shí)別等難題

,無需訓(xùn)練即可在20+場(chǎng)景實(shí)現(xiàn)關(guān)鍵信息抽取平均準(zhǔn)確率80%以上。

PP-TSv2:

支持

時(shí)序預(yù)測(cè)

時(shí)序異常檢測(cè)

任務(wù)。在用電負(fù)荷預(yù)測(cè)、預(yù)測(cè)性維護(hù)等多場(chǎng)景任務(wù)自適應(yīng)尋優(yōu)!電力場(chǎng)景預(yù)測(cè)誤差降低20%以上,設(shè)備異常檢測(cè)場(chǎng)景召回率提升5%。

大模型半監(jiān)督學(xué)習(xí)工具:

借助

少量有標(biāo)注數(shù)據(jù)和大量無標(biāo)注數(shù)據(jù),大大提升模型的精度

;在分類、檢測(cè)、OCR識(shí)別3類任務(wù)的17個(gè)模型上,實(shí)現(xiàn)小模型精度提升10%~26%。

40+精選產(chǎn)業(yè)高精度模型庫

新增RT-DETR-H、TimesNet_AD、PP-HGNetv2-B4等8個(gè)精選模型,擴(kuò)充時(shí)序分類、時(shí)序異常檢測(cè)等任務(wù)。PaddleX目前已覆蓋目標(biāo)檢測(cè)、圖像分割、3D、OCR、時(shí)序預(yù)測(cè)、圖像識(shí)別系統(tǒng)、PDF轉(zhuǎn)word等40+精選產(chǎn)業(yè)高精度模型庫。

低代碼工具箱全流程開發(fā)

新增數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)劃分、評(píng)估指標(biāo)說明等10+界面功能優(yōu)化,工具箱/開發(fā)者雙模式高低代碼聯(lián)動(dòng)功能更豐富,布局更美觀!

云端&本地端雙平臺(tái)按需使用

云端和

Windows本地端

能力同步升級(jí),雙平臺(tái)按需選擇!AI Studio云端資源隨處可達(dá),實(shí)現(xiàn)24小時(shí)隨處AI開發(fā)。為充分利用本地算力,可一鍵下載本地端軟件,滿足多樣需求。 小伙伴們還等什么,來

AI Studio云端

一鍵體驗(yàn)吧!這里偷偷爆個(gè)料,Linux離線版本地端距離發(fā)布很近了呦! PaddleX云端快速體驗(yàn):

https://aistudio.baidu.com/intro/paddlex/models

PaddleX本地端下載:

https://aistudio.baidu.com/intro/paddlex

想和志同道合的開發(fā)者交流開發(fā)經(jīng)驗(yàn)?想和PaddleX官方開發(fā)者交流?歡迎來PaddleX頻道交流:

https://aistudio.baidu.com/community/channel/610

接下來,讓我們?cè)敿?xì)看一下更新內(nèi)容吧!

新特性詳解

強(qiáng)大的大小模型結(jié)合特色工具

PP-ChatOCRv2

相信大家對(duì)PP-ChatOCR的驚艷效果還有很深的印象,現(xiàn)在,我們正式迎來了它的第2版。 PP-ChatOCRv2是一個(gè)融合了LLM大模型和OCR技術(shù)的通用文本圖像智能分析系統(tǒng),覆蓋20+高頻應(yīng)用場(chǎng)景,支持

5種

文本圖像智能分析能力和部署,包括通用場(chǎng)景關(guān)鍵信息抽?。爝f單、營業(yè)執(zhí)照和機(jī)動(dòng)車行駛證等)、復(fù)雜文檔場(chǎng)景關(guān)鍵信息抽?。ń鉀Q生僻字、特殊標(biāo)點(diǎn)、

多頁P(yáng)DF、表格

等難點(diǎn)問題)、通用OCR、文檔場(chǎng)景專用OCR、通用表格識(shí)別。此外針對(duì)垂類業(yè)務(wù)場(chǎng)景,也支持模型訓(xùn)練、微調(diào)和Prompt優(yōu)化。

PP-ChatOCRv2 多場(chǎng)景識(shí)別效果

PP-ChatOCRv2在PP-ChatOCR的基礎(chǔ)上進(jìn)一步升級(jí),小模型+大模型串聯(lián)邏輯不變,在通用信息抽取、復(fù)雜文檔信息抽取、代碼拓展性、基礎(chǔ)功能完備四個(gè)方面做了更新。下面是v2的特性總結(jié):

場(chǎng)景豐富:

支持5種智能文本圖像分析能力,覆蓋20+高頻應(yīng)用場(chǎng)景,尤其針對(duì)復(fù)雜文檔場(chǎng)景進(jìn)行了專項(xiàng)優(yōu)化。

精準(zhǔn)度高:

「PP-OCR」與「文心一言」強(qiáng)強(qiáng)結(jié)合,支持1.5萬+大字庫,解決生僻字、多頁P(yáng)DF、表格等難題,無需訓(xùn)練即可在20+場(chǎng)景關(guān)鍵信息抽取平均準(zhǔn)確率80%以上。

一鍵部署:

一鍵獲取PP-ChatOCRv2離線部署SDK,助力企業(yè)快速實(shí)現(xiàn)工程落地。

便捷開發(fā):

針對(duì)垂類業(yè)務(wù)場(chǎng)景,通過簡(jiǎn)單點(diǎn)擊UI界面按鈕,可完成Prompt優(yōu)化、模型訓(xùn)練和微調(diào)。

立即在線體驗(yàn):

https://aistudio.baidu.com/projectdetail/paddlex/7050167

PP-TSv2

說到時(shí)序處理,大家一定還記得PaddleX重磅推出的PP-TS,現(xiàn)在讓我們看看v2帶來了什么新特性。

PP-TSv2 電力和交通場(chǎng)景落地效果

場(chǎng)景豐富:

支持

時(shí)序預(yù)測(cè)

時(shí)序異常檢測(cè)

兩大通用任務(wù),在用電負(fù)荷預(yù)測(cè)、預(yù)測(cè)性維護(hù)、能耗分析、交流流量預(yù)估等場(chǎng)景中有重要應(yīng)用價(jià)值。

精準(zhǔn)度高:

多場(chǎng)景任務(wù)自適應(yīng)尋優(yōu)。時(shí)序預(yù)測(cè),在電力場(chǎng)景預(yù)測(cè)誤差降低20%以上;時(shí)序異常檢測(cè),在設(shè)備異常監(jiān)控場(chǎng)景相同精度下,召回提升約5%。

便捷開發(fā):

簡(jiǎn)單點(diǎn)擊UI界面即可完數(shù)據(jù)的預(yù)處理一鍵化去重,數(shù)據(jù)格式轉(zhuǎn)化以及劃分,高精度的自定義訓(xùn)練,研發(fā)成本低。

一鍵部署:

一鍵獲取PP-TSv2離線部署SDK和服務(wù)化部署,助力企業(yè)快速工程落地。

立即在線體驗(yàn):

https://aistudio.baidu.com/projectdetail/paddlex/7044307

大模型半監(jiān)督學(xué)習(xí)工具

不知道大家有沒有遇到過數(shù)據(jù)標(biāo)注成本高、周期長的困擾,有沒有那么一種可能,精心標(biāo)注少量的數(shù)據(jù),配合大量的無標(biāo)注數(shù)據(jù),就能達(dá)到比肩全量標(biāo)注的模型精度呢?是的,PaddleX就帶來了這樣一款提效神器——大模型半監(jiān)督學(xué)習(xí)工具。 大模型半監(jiān)督學(xué)習(xí)工具(LMSSL)利用視覺大模型的強(qiáng)大特征表征能力和PaddleX的特色半監(jiān)督學(xué)習(xí)方法,在少量有標(biāo)注數(shù)據(jù)和大量無標(biāo)注數(shù)據(jù)的混合數(shù)據(jù)上學(xué)習(xí)到更好的特征,從而得到超高精度的大模型;該工具還內(nèi)置了蒸餾和微調(diào)小模型的方法,進(jìn)一步可以得到精度更高的小模型。 為了驗(yàn)證該工具的有效性,我們測(cè)試了其在公開數(shù)據(jù)集的指標(biāo)。最終,該工具刷新了圖像分類-10%ImageNet、目標(biāo)檢測(cè)-10%COCO的半監(jiān)督學(xué)習(xí)SOTA精度。目前,該工具支持圖像分類、目標(biāo)檢測(cè)、OCR識(shí)別三類視覺任務(wù)17個(gè)模型,大家無需關(guān)心細(xì)節(jié),只需提供更多無標(biāo)注數(shù)據(jù),點(diǎn)擊兩次按鈕,即可得到高精度的大模型和小模型。下面列舉了使用該工具后,不同場(chǎng)景中大模型和小模型的精度提升情況。

圖像分類不同場(chǎng)景和指標(biāo)提升情況

目標(biāo)檢測(cè)不同場(chǎng)景和指標(biāo)題提升情況

立即在線體驗(yàn): 圖像分類-大模型半監(jiān)督學(xué)習(xí)工具:

https://aistudio.baidu.com/projectdetail/paddlex/7045718

目標(biāo)檢測(cè)-大模型半監(jiān)督學(xué)習(xí)工具:

https://aistudio.baidu.com/projectdetail/paddlex/7045736

OCR識(shí)別-大模型半監(jiān)督學(xué)習(xí)工具:

https://aistudio.baidu.com/projectdetail/paddlex/7045737

以上這些特色工具有沒有讓大家眼前一亮呢?未來PaddleX將持續(xù)推出更多的特色工具,歡迎保持關(guān)注哦~ 對(duì)這些特色工具很感興趣,想了解得更深入一些?沒問題,關(guān)注本公眾號(hào),后面陸續(xù)會(huì)有針對(duì)性講解的文章~

40+精選產(chǎn)業(yè)高精度模型庫

本次更新中,圖像分類、目標(biāo)檢測(cè)任務(wù)方向分別新增了3個(gè)精選模型,為大家?guī)砹烁嗟木?速度權(quán)衡選擇。另外,額外覆蓋了時(shí)序異常檢測(cè)、時(shí)序分類兩個(gè)任務(wù)方向,各自新增一個(gè)精選模型。這些精選模型個(gè)個(gè)都很能打,有下面的實(shí)測(cè)數(shù)據(jù)為證。大家的模型選型又有新的選項(xiàng)啦!

PaddleX 本次發(fā)版新增模型list

PaddleX已支持的40+算法模型,可參考該鏈接:

https://aistudio.baidu.com/intro/paddlex/models

后續(xù),PaddleX將持續(xù)擴(kuò)大開發(fā)者心心念念的實(shí)例分割模型、LLM模型等,歡迎大家進(jìn)入文章底部的交流頻道,反饋對(duì)新模型的需求!

低代碼工具箱全流程開發(fā)

新版PaddleX正式發(fā)布以來,用戶對(duì)工具箱/開發(fā)者雙模式高低代碼聯(lián)動(dòng)的開發(fā)方式大家贊賞。PaddleX為了做好極致的AI開發(fā)全流程, 這次更新增加了

數(shù)據(jù)分析工具、數(shù)據(jù)格式轉(zhuǎn)換工具、數(shù)據(jù)劃分工具、評(píng)估指標(biāo)說明

等10+功能,低代碼工具箱模式功能更豐富,布局更美觀!

云端&本地端雙平臺(tái)按需使用

云端AI Studio平臺(tái),PaddleX可以通過項(xiàng)目大廳和模型庫兩個(gè)入口使用。 Windows本地端PaddleX2.2.0版本也正式發(fā)布啦,除特色工具外,云端所有能力實(shí)現(xiàn)完全同步。一鍵下載安裝windows本地端,即可完成模型開發(fā)全流程。

結(jié)語

最后,稍微總結(jié)一下:

PaddleX是面向國內(nèi)外主流AI硬件的,全流程、高效率的飛槳精選AI模型的一站式AI開發(fā)套件。PaddleX的使命是助力AI技術(shù)快速落地,愿景是使人人成為AI Developer!

在本次更新中,PaddleX帶來了

強(qiáng)大的大小模型結(jié)合特色工具、40+精選產(chǎn)業(yè)高精度模型庫、低代碼工具箱全流程開發(fā)、云端&本地端雙平臺(tái)按需使用

等特性,希望能給大家?guī)砀蟮腁I開發(fā)效率提升和更好的產(chǎn)品體驗(yàn)! 目前PaddleX依然處在快速迭代中,歡迎大家試用和指正!比心~ 添加AI Studio飛槳AI套件官方頻道,和大家一起討論吧,傳送門:

https://aistudio.baidu.com/community/channel/610

PaddleX云端在線體驗(yàn):

https://aistudio.baidu.com/intro/paddlex/models

PaddleX Windows本地端下載地址:

https://aistudio.baidu.com/intro/paddlex

PP-ChatOCRv2、大模型半監(jiān)督學(xué)習(xí)工具PaddleX新特性等你來pick的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
阳西县| 丹寨县| 牡丹江市| 汉源县| 诏安县| 江安县| 白银市| 靖宇县| 柯坪县| 塔城市| 莫力| 宁河县| 曲周县| 阳泉市| 突泉县| 乡宁县| 平泉县| 侯马市| 大英县| 云阳县| 钟祥市| 宜黄县| 长春市| 洮南市| 石楼县| 台东市| 思南县| 周口市| 中阳县| 新安县| 长治市| 亳州市| 台中市| 綦江县| 达日县| 汤阴县| 彭水| 筠连县| 治多县| 马鞍山市| 裕民县|