最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

用AI抽絲剝繭,讓法律監(jiān)督提質(zhì)增效守護社會和諧安寧

2023-06-30 13:45 作者:飛槳PaddlePaddle  | 我要投稿

人工智能時代下,檢察官用什么工具能更好地提升辦案質(zhì)量和效率,為依法治國貢獻檢察力量?這個問題,嘉誠信息正在與其所服務的人民檢察院一起交出答卷。

作為國家的法律監(jiān)督機關,人民檢察院對司法機關、國家工作人員職務犯罪和公民違法犯罪行為進行監(jiān)督。隨著社會發(fā)展,檢察機關法律監(jiān)督工作面臨更高的要求。2021年6月黨中央印發(fā)《中共中央關于加強新時代檢察機關法律監(jiān)督工作的意見》,明確要求“全面提升法律監(jiān)督質(zhì)量和效果”。在此指導意見下,最高檢于2022年推動實施“數(shù)字檢察戰(zhàn)略”, 強調(diào)數(shù)字技術和檢察工作深度融合,加快推進法律監(jiān)督模式重塑變革,推進溯源治理,實現(xiàn)從個案辦理到類案監(jiān)督再到系統(tǒng)治理,讓法律監(jiān)督更好地服務社會治理。

嘉誠信息,一家致力于通過大數(shù)據(jù)、人工智能等技術助力客戶實現(xiàn)數(shù)智化轉(zhuǎn)型的公司,依托自身大數(shù)據(jù)積累優(yōu)勢與深刻的行業(yè)理解洞察,使用飛槳自然語言處理模型庫PaddleNLP和基于文心大模型的通用信息抽取模型ERNIE-UIE,以“法律文書非結(jié)構(gòu)化數(shù)據(jù)挖掘”為切入點,研發(fā)大數(shù)據(jù)法律監(jiān)督解決方案持續(xù)服務全國檢察機關,共同實踐走通了以“數(shù)字革命”驅(qū)動新時代法律監(jiān)督整體提質(zhì)增效之路。

實現(xiàn)溯源治理?

找到“結(jié)構(gòu)化數(shù)據(jù)”是關鍵

溯源治理,是指在法律監(jiān)督過程中追溯源頭,不僅僅是辦理眼前的一個案子,更要發(fā)現(xiàn)同類型案件規(guī)律,“從個案到類案”,從而針對性地制發(fā)檢察建議,從制度和流程上推動類型案件深層原因的解決,助推社會治理現(xiàn)代化。習近平總書記強調(diào):“法治建設既要抓末端、治已病,更要抓前端、治未病。”因此溯源治理尤為重要。

從個案到類案,踐行溯源治理

如何實現(xiàn)從個案到類案的轉(zhuǎn)變?檢察機關工作人員首先面臨的難題是怎樣從浩如煙海的各類法律文書中發(fā)現(xiàn)有價值的案件監(jiān)督線索。

“大量的案件資料通常以文本文書的方式存在于內(nèi)部或公開信息中,這些非結(jié)構(gòu)化的資料當中包括許多‘關鍵要素’,如案發(fā)地點、行政區(qū)劃、相關金額、訴訟當事人等等,而與類案共性相關的高價值線索就散落其中?!奔握\信息上海創(chuàng)新研究院副院長崔放介紹道,“以往檢察官只能一個一個地去看案件資料、識別關鍵信息,發(fā)現(xiàn)類案監(jiān)督線索的難度較大。隨著數(shù)字檢察戰(zhàn)略的提出,我們緊跟檢察機關工作需求,用大數(shù)據(jù)、人工智能技術把‘非結(jié)構(gòu)化數(shù)據(jù)’進行關鍵要素提取后成為 ‘結(jié)構(gòu)化數(shù)據(jù)’,從而極大地降低檢察官的線索發(fā)現(xiàn)難度,提升類案線索分析和發(fā)現(xiàn)的效率?!?/p>

案件線索紛繁復雜,如何快速找到關鍵要素?


例如,嘉誠信息曾成功協(xié)助某地檢察機關辦理套路貸虛假訴訟案件。此類案件主要內(nèi)容為同一當事人起訴不同被告,在法院的民事裁判文書中包含借款詳情信息,未經(jīng)提取前便是“非結(jié)構(gòu)化數(shù)據(jù)”。檢察官單獨去看一份一份的民事裁判文書,很難發(fā)現(xiàn)各個案件之間隱藏的關聯(lián)性,監(jiān)督難度大。但當從百萬級的裁判文書中提取出一些“結(jié)構(gòu)化數(shù)據(jù)”,如雙方當事人身份信息、原被告出庭情況、借款詳情后,當?shù)貦z察院發(fā)現(xiàn)有很多相同身份信息的人或公司在持續(xù)起訴不同的被告,被告大多不出庭,并且通過分析對比,發(fā)現(xiàn)大多數(shù)為重復使用借條或額外收取費用,從而提高被告還款額度。

因此,這些結(jié)構(gòu)化數(shù)據(jù)構(gòu)成了很明顯的監(jiān)督線索,檢察院判斷相關案件涉及虛假訴訟,提出抗訴和再審檢察建議,并向法院制發(fā)類案監(jiān)督檢察建議,向市場監(jiān)督管理局制發(fā)社會治理檢察建議,建議其加強公司企業(yè)監(jiān)管,摸排涉嫌“套路貸”違法犯罪公司,查處違法違規(guī)公司企業(yè),保障了法律的公平公正。

基于飛槳和文心大模型造“永動機”?

全國1億案件1個月跑完?

用200+法律監(jiān)督模型助力數(shù)字檢察

嘉誠信息的團隊中有很多專業(yè)法學背景的成員,并持續(xù)投入大量精力進行案件研究,使團隊和檢察機關工作人員溝通更高效,能更好地把行業(yè)需求轉(zhuǎn)化為模型開發(fā)邏輯;另一方面,公司從2017年就開始數(shù)據(jù)積累,通過對公開數(shù)據(jù)中涉及各種監(jiān)督模型的關鍵要素持續(xù)挖掘,打下了良好的法律監(jiān)督大數(shù)據(jù)基礎。

然而在非結(jié)構(gòu)化數(shù)據(jù)提取技術上,由于進入行業(yè)較早,市場中可外采的解決方案較少,團隊決定采用自研的方式來訓練法律監(jiān)督模型。最初嘉誠信息采用傳統(tǒng)的信息抽取技術,因過程中需要大量的文本標注工作,還專門組建了十幾個人的數(shù)據(jù)標注團隊,但模型準確度一直不夠理想。尤其是2021年隨著公司業(yè)務拓展至全國范圍后,業(yè)務量和數(shù)據(jù)量大幅增加,客戶對產(chǎn)品的要求也越來越高,傳統(tǒng)的信息抽取技術再難以滿足業(yè)務需求。

“后來我們進行了整體的調(diào)研對比,最終選擇了百度飛槳。首先它是開源的,協(xié)議對商業(yè)化也很友好。技術上,飛槳和基于文心大模型的通用信息抽取模型ERNIE-UIE給了我們很大的驚喜,想不到居然會有這么好的效果?!贝薹沤榻B道,“以前不理解大模型,知道ERNIE-UIE以后甚至覺得有些不可思議。它對標注數(shù)據(jù)量要求非常少,以前我們需要標注幾千上萬個數(shù)據(jù),現(xiàn)在只需標注30-50個就已經(jīng)很好地實現(xiàn)了法律文書數(shù)據(jù)提取,且模型精度由原先的70%提升至91%。我們之前的十幾個數(shù)據(jù)標注人員,現(xiàn)在已經(jīng)全都轉(zhuǎn)型為法研和項目管理人員,為公司發(fā)揮了更大價值,也收獲了個人職業(yè)成長?!?/p>

嘉誠信息的大數(shù)據(jù)法律監(jiān)督解決方案當中,有一款專門針對民事的法律監(jiān)督產(chǎn)品,開發(fā)過程中使用ERNIE-UIE表現(xiàn)極為優(yōu)秀。很多民事虛假訴訟涉及全國跨區(qū)域作案,因此構(gòu)建一個全國范圍的案件庫十分必要,而將所有相關案件匯集后,總數(shù)量超過1億。崔放介紹:“以前我們是不敢去跑全國的案件線索的,都是一個市一個市地去跑,因為數(shù)據(jù)挖掘是有時間需求的,如果要跑全國,可能2、3年都不一定能跑完。現(xiàn)在借助飛槳和ERNIE-UIE,我們構(gòu)建了一個24小時的‘永動機’機制,持續(xù)去跑全國線索。

最終使用ERINIE-UIE的nano模型,一個月左右就可以跑完全國1億案件的數(shù)據(jù)循環(huán),這才得以開發(fā)出極高效能的民事法律監(jiān)督產(chǎn)品,提升檢察機關監(jiān)督效率。比如我們和某區(qū)基層人民檢察院合作,為其提供了民事檢察監(jiān)督助手系統(tǒng),檢察官在使用以后,3個月辦理民事監(jiān)督案件72件,數(shù)量是過去3年的總和。”

飛槳自然語言處理模型庫PaddleNLP的通用信息抽取模型ERNIE-UIE,以文心大模型為基礎,在沒有專業(yè)團隊的情況下,使用小樣本訓練,進行定制化開發(fā),可以大量節(jié)省標注成本。ERNIE-UIE提供了base、medium、mini、micro、nano等多模型尺寸選擇,可滿足精度和速度的不同要求。具體來說,嘉誠信息技術方案歸納為如下步驟:

01 數(shù)據(jù)準備階段

數(shù)據(jù)采集、標注和增強。從公開的合規(guī)網(wǎng)絡途徑獲取數(shù)據(jù)用于研究,利用Python、Flink程序等腳本,對規(guī)范數(shù)據(jù)的格式進行處理。再結(jié)合實際抽取需求對領域數(shù)據(jù)進行標注,通過PaddleNLP提供的數(shù)據(jù)協(xié)議將標注數(shù)據(jù)轉(zhuǎn)為ERNIE-UIE模型訓練的數(shù)據(jù)格式;

02 訓練階段

基于ERNIE-UIE nano在領域標注數(shù)據(jù)上對模型進行微調(diào);

03 模型部署階段

訓練完成后,將模型部署到飛槳預測的服務器上。通過調(diào)用ERNIE-UIE進行信息提取,再將抽取到的實體、關系等結(jié)構(gòu)化數(shù)據(jù)作為基礎標簽供業(yè)務模型使用,完成NLP功能的部署。

技術方案流程圖


目前,嘉誠信息通過和全國多家檢察機關的密切配合,大數(shù)據(jù)法律監(jiān)督解決方案在刑事檢察、民事檢察、行政檢察、公益訴訟檢察、未成年人檢察等領域積累了200余個成熟的法律監(jiān)督模型,支持與其他大數(shù)據(jù)監(jiān)督模型系統(tǒng)對接,提供模型上傳、共享、整合、本地化應用能力。服務覆蓋全國25個省市縣區(qū)的近800家檢察院,把檢察官從相對簡單、繁雜、重復的勞動中解脫出來,讓檢察官有更充裕的時間和精力把檢察智慧用在法律監(jiān)督的提質(zhì)增效上。

嘉誠信息數(shù)字檢察業(yè)務全景

持續(xù)創(chuàng)新,讓技術更易用?

賦能黨政機關、企事業(yè)單位數(shù)智轉(zhuǎn)型?

創(chuàng)造社會價值

讓技術更便捷易用,從而更好地服務檢察機關工作人員,創(chuàng)造真正的應用價值,是嘉誠信息長久以來持續(xù)創(chuàng)新的方向。

在底層技術方面,嘉誠信息自主研發(fā)“慧眼預警指數(shù)”、“時空數(shù)據(jù)分析”兩大技術,與“非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)結(jié)構(gòu)化數(shù)據(jù)”一起,構(gòu)成了助力檢察機關實現(xiàn)監(jiān)督線索發(fā)現(xiàn)的核心技術壁壘。在數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù)后,通過“慧眼預警指數(shù)”, 結(jié)合不同案件類型需要的統(tǒng)計數(shù)據(jù)維度,形成新的要素規(guī)則,從而實現(xiàn)不同類型案件的數(shù)據(jù)關聯(lián)機制,達到預警效果。同時,通過“時空數(shù)據(jù)分析”技術,將大量相關數(shù)據(jù)進行統(tǒng)計,如大量個案的案發(fā)地點識別后,轉(zhuǎn)變?yōu)榻?jīng)緯度投放到地圖上,清晰顯示案件的地理位置聚集情況,從而幫助檢察機關從時空角度發(fā)現(xiàn)案件關聯(lián)的同一時間段相似特征線索的關聯(lián)性和真實性。

在應用側(cè),嘉誠信息持續(xù)優(yōu)化使用體驗,創(chuàng)新開發(fā)了“要素檢索模式”和“可視化知識圖譜”工具。“要素檢索模式”即為將提取出來的核心要素以標簽形式可視化地呈現(xiàn)在檢察官眼前,檢察官可以結(jié)合不同類型案件需求,通過鼠標點擊的方式來組合相關標簽,比如套路貸案件,檢察官可以選擇“當事人未出庭”、“民間借貸”、“某貸款公司”等標簽,實現(xiàn)對此類案件的快速檢索。“可視化知識圖譜”則是在ERNIE-UIE信息抽取的基礎上,進一步做了線索的可視化處理。最常見的應用場景就是將原告、被告、律師、法官信息等人和案信息提取出來,形成參與方關系網(wǎng),幫助檢察官發(fā)現(xiàn)復雜關系網(wǎng)背后的潛在線索。

一案多連可視化知識圖譜:體現(xiàn)法官、律師、第三人關聯(lián),訴訟人關聯(lián)


在此基礎上,嘉誠信息助力各地檢察機關辦理了多起極具社會意義的類案。如在外賣平臺野蠻生長時期,通過大數(shù)據(jù)平臺模型,與某市人民檢察院合作,基于外賣商家公示的數(shù)據(jù)分析,為檢察院提供了一系列不合規(guī)商家清單,從而促進了當?shù)氐氖乘幈O(jiān)部門對于網(wǎng)絡外賣餐飲監(jiān)管的加強。又如與某市人民檢察院合作,開發(fā)校園周邊違規(guī)經(jīng)營監(jiān)督模型,幫助檢察機關及時發(fā)現(xiàn)監(jiān)督校園周邊違法設置的娛樂場所、酒吧、煙酒及彩票銷售點等不適宜未成年人活動場,該案例被最高檢評為大數(shù)據(jù)賦能未成年人監(jiān)督的全國典型案例之一。

除了持續(xù)賦能檢察機關,嘉誠信息也將產(chǎn)品、服務及解決方案拓展至更多黨政機關、企事業(yè)單位,截至目前,嘉誠信息產(chǎn)品、服務及解決方案已應用于全國30個省份、自治區(qū)及直轄市,以智慧政務、網(wǎng)絡安全為兩大核心業(yè)務版塊,服務客戶涵蓋黨委、政府、檢察院、法院、司法監(jiān)獄、生態(tài)環(huán)境、自然資源、衛(wèi)生醫(yī)療、金融、教育等多個領域,攜手實現(xiàn)更廣泛的社會價值。

“我自己是做技術出身,最開始就是希望通過技術的力量去解決一些問題,讓社會變得更好。”崔放介紹到,“而隨著經(jīng)驗的增長,我認識到僅僅憑技術是無法促進社會公共利益和國家利益保護的,但如果我們能將技術賦能到行業(yè),把檢察院、法院等政法機關客戶服務好的話,就可以一起為這個社會、為國家、為我們的公眾利益作出貢獻。這也是嘉誠信息創(chuàng)新發(fā)展的源動力。”

未來,嘉誠信息還將持續(xù)在技術創(chuàng)新上發(fā)力,除文本信息提取,還將拓展到圖片、視頻等關鍵信息的提取。而飛槳與文心大模型也將持續(xù)攜手更多行業(yè)伙伴,共同助力政法行業(yè)使用人工智能技術實現(xiàn)質(zhì)效提升。正如崔放所說,“把法律人工智能發(fā)展得越來越好,讓法律制度的理性之光和科學技術的智慧之光交相呼應,大放異彩。”


用AI抽絲剝繭,讓法律監(jiān)督提質(zhì)增效守護社會和諧安寧的評論 (共 條)

分享到微博請遵守國家法律
石台县| 安义县| 田林县| 霍林郭勒市| 农安县| 图们市| 奉化市| 浦江县| 朝阳县| 开封县| 巴彦县| 黄梅县| 罗源县| 囊谦县| 丹东市| 体育| 兴文县| 襄樊市| 兰西县| 北辰区| 南华县| 广州市| 无为县| 深水埗区| 阿克苏市| 中山市| 清水河县| 昌宁县| 嫩江县| 岐山县| 金乡县| 彩票| 万载县| 高雄市| 科尔| 于都县| 肃北| 信丰县| 通河县| 新绛县| 奉化市|