大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘?yàn)槁蓭煄?lái)哪些商機(jī)和挑戰(zhàn)?
《經(jīng)濟(jì)學(xué)人》曾發(fā)文稱(chēng)“世界上最有價(jià)值的資源不再是石油,而是數(shù)據(jù)”(The world's most valuable resource is no longer oil, but data.)。
得益于互聯(lián)網(wǎng)與大數(shù)據(jù)技術(shù)的迅猛發(fā)展,數(shù)據(jù)正以前所未有的速度巨量生成,海量的數(shù)據(jù)資源由此產(chǎn)生。如何運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)這些大數(shù)據(jù)加以挖掘和分析,即提取(或 "挖掘")有用的情報(bào),預(yù)測(cè)趨勢(shì),減輕風(fēng)險(xiǎn),從而解決問(wèn)題并做出正確的決策,則成為了大數(shù)據(jù)時(shí)代下的全新選題。
數(shù)據(jù)挖掘(Data Mining,DM)又稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是目前人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問(wèn)題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫(kù)的大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息的非平凡過(guò)程。
數(shù)據(jù)是反映事物發(fā)展的直接表現(xiàn),而數(shù)據(jù)挖掘則是一種決策支持過(guò)程,它主要基于人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、可視化技術(shù)等,高度自動(dòng)化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),做出正確的決策。目前數(shù)據(jù)挖掘技術(shù)的價(jià)值已在金融 、醫(yī)療、保險(xiǎn)及零售業(yè)等行業(yè)廣泛運(yùn)用并得到了驗(yàn)證。如果對(duì)法律行業(yè)的大數(shù)據(jù)進(jìn)行挖掘,則可大幅提升法律從業(yè)者的工作質(zhì)量和效率,甚至于顛覆傳統(tǒng)法律行業(yè)的工作模式,這種天然的數(shù)據(jù)價(jià)值與數(shù)據(jù)挖掘技術(shù)十分契合,使其成為數(shù)據(jù)挖掘應(yīng)用的最佳垂直領(lǐng)域。將數(shù)據(jù)挖掘技術(shù)運(yùn)用于法律行業(yè),勢(shì)必會(huì)給法律行業(yè)帶來(lái)前所未有的機(jī)遇與挑戰(zhàn)。


01
律師法律服務(wù)效能得以提高
中國(guó)裁判文書(shū)網(wǎng),自2013年上線(xiàn),截至2022年2月23日,中國(guó)裁判文書(shū)網(wǎng)文書(shū)總量超過(guò)1.2億篇,訪(fǎng)問(wèn)總量超過(guò)811億次,是我國(guó)最大的法律文書(shū)數(shù)據(jù)庫(kù)。
裁判文書(shū)是承載全部審判活動(dòng)、體現(xiàn)審判結(jié)果的“司法產(chǎn)品”。單份裁判文書(shū)就蘊(yùn)含著豐富的信息,包括當(dāng)事人的訴求信息、犯罪行為信息、行政執(zhí)法信息、司法裁判行為和過(guò)程信息、法律的適用信息等,而這些恰恰是集聚法院“大數(shù)據(jù)”的核心要素信息。
當(dāng)大量的裁判文書(shū)集中后,通過(guò)深度挖掘其所承載的信息,既可用于分析社會(huì)矛盾、治安形勢(shì)的發(fā)展?fàn)顩r和依法行政的水平,也可用于分析審判態(tài)勢(shì)運(yùn)行情況和總結(jié)審判規(guī)律、研判預(yù)測(cè)審判形勢(shì),還可用于分析司法的公信力和權(quán)威性狀況,具有明顯的價(jià)值多元性。
對(duì)于訴訟類(lèi)律師法律服務(wù)來(lái)說(shuō),數(shù)據(jù)挖掘技術(shù)能夠幫助他們更高效地厘清案情事實(shí),形成案件涉及的人、事、物等多方面記錄的全景式分析;能夠提供多樣化的證據(jù)材料,準(zhǔn)確 對(duì)案件性質(zhì)以及法律適用作出判斷;能夠全面精準(zhǔn)進(jìn)行案件相關(guān)信息整合與分析,更有針對(duì)性地進(jìn)行案件訴訟方案設(shè)計(jì)。
對(duì)于非訴訟類(lèi)律師法律服務(wù)來(lái)說(shuō),能夠提高法律咨詢(xún)效率、文書(shū)服務(wù)水平,有效監(jiān)督非訴訟法律行為代理、協(xié)助以及合同等履行情況,保證計(jì)劃擬定和談判方案合理性,促進(jìn)服務(wù)對(duì)象內(nèi)部規(guī)章制度的制定。

02
律師法律服務(wù)范圍得以拓展
一方面大量的律師接不到案子,長(zhǎng)久以來(lái),律師業(yè)務(wù)來(lái)源主要依靠口口相傳的口碑模式,律師群體被賦予了一種精英、高端的形象,這樣的形象也使得他們很難像其他行業(yè)那樣進(jìn)行營(yíng)銷(xiāo)活動(dòng);同時(shí)這一行業(yè)的營(yíng)銷(xiāo)也受制于主管部門(mén)的約束和規(guī)定。
另一方面又有大量的客戶(hù)沒(méi)有合適的路徑找到合適的律師,通過(guò)對(duì)超過(guò)1億份裁判文書(shū)進(jìn)行分析,發(fā)現(xiàn)有超過(guò)6700萬(wàn)份案件的當(dāng)事人沒(méi)有獲得律師的幫助。而部分當(dāng)事人即使得到律師的幫助,也會(huì)因?yàn)樾畔⒉粚?duì)稱(chēng),無(wú)法根據(jù)現(xiàn)實(shí)需要找到最合適自己的律師。
如果運(yùn)用數(shù)據(jù)挖掘技術(shù),對(duì)法律大數(shù)據(jù)加以利用,將客戶(hù)的需求、律師的執(zhí)業(yè)信息等數(shù)據(jù)進(jìn)行歸納整合,并對(duì)他們進(jìn)行數(shù)字畫(huà)像,形成一個(gè)專(zhuān)業(yè)的法律服務(wù)平臺(tái)。用戶(hù)通過(guò)平臺(tái)可以篩選出合適的律師,并直接進(jìn)行咨詢(xún);而律師也可以更加充分地了解客戶(hù)需求,為客戶(hù)提供更加專(zhuān)業(yè)性、有針對(duì)性的法律服務(wù)。從而打破過(guò)去受限于時(shí)空的服務(wù)范圍,動(dòng)態(tài)調(diào)節(jié)律師與客戶(hù)間的供需平衡。
例如某一律師的執(zhí)業(yè)年限、辦案經(jīng)歷、擅長(zhǎng)領(lǐng)域甚至是勝訴率等信息,都會(huì)進(jìn)行挖掘和展示;律師也可以根據(jù)自身擅長(zhǎng)和關(guān)注的領(lǐng)域挖掘潛在客戶(hù)、獲取商機(jī),并對(duì)客戶(hù)的需求在數(shù)據(jù)庫(kù)進(jìn)行類(lèi)案比對(duì),了解案件的法律依據(jù)、證據(jù)材料等信息。

03
律師法律服務(wù)環(huán)境得以改善
在以往,大量的數(shù)據(jù)分散在各個(gè)角落,律師在辦案時(shí)往往要往返于各個(gè)平臺(tái),花費(fèi)大量的時(shí)間才能獲取到需要的信息,極其容易造成信息的遺漏或錯(cuò)誤。
而現(xiàn)在,借助已經(jīng)漸漸成體系的權(quán)威數(shù)據(jù)平臺(tái),不僅能更為高效地檢索到所需要的資料和信息,憑借強(qiáng)大的數(shù)據(jù)挖掘技術(shù),還能將大量數(shù)據(jù)進(jìn)行聚合與分析,從而進(jìn)一步節(jié)省律師在立案、開(kāi)庭等環(huán)節(jié)的時(shí)間,基于大數(shù)據(jù)可以獲得法律服務(wù)相關(guān)信息,有利于進(jìn)行信息的社會(huì)反饋,也在很大程度上改善了法律服務(wù)環(huán)境。
前文中提到數(shù)據(jù)挖掘具有規(guī)劃未來(lái)的作用,而這對(duì)于律師業(yè)務(wù)的開(kāi)展而言是不可或缺的資源,試想一下:當(dāng)律師接受案件委托或準(zhǔn)備提供法律服務(wù)時(shí),就已經(jīng)通過(guò)數(shù)據(jù)挖掘,獲得幾方當(dāng)事人的信息及主審法官以往的類(lèi)似裁判案例,結(jié)合這些信息來(lái)為我們之后開(kāi)展的訴訟和非訴業(yè)務(wù)進(jìn)行合理的分析預(yù)測(cè),根據(jù)分析預(yù)測(cè)結(jié)果來(lái)制定和調(diào)整訴訟策略及服務(wù)方案。
通過(guò)數(shù)據(jù)挖掘總結(jié)出來(lái)的模型和規(guī)律,以往是在開(kāi)庭之后或提供法律服務(wù)之后我們才會(huì)知曉的事情,現(xiàn)在便可提前預(yù)測(cè)到,這將極大的提升律師法律服務(wù)的高效性和準(zhǔn)確性。
在未來(lái),法律和法律行業(yè)或許不再只依靠辯論的力量,而是通過(guò)利用先進(jìn)的技術(shù),便可以預(yù)測(cè)訴訟結(jié)果,甚至可以在提起訴訟通知后立即贏得訴訟。但目前,數(shù)據(jù)挖掘仍然是法律領(lǐng)域的一種新實(shí)踐,還有著極其漫長(zhǎng)的路要走。

01
數(shù)據(jù)失真和不全面
數(shù)據(jù)挖掘是基于大數(shù)據(jù)的前提下,前文中提到目前中國(guó)裁判文書(shū)網(wǎng)已公開(kāi)1.2份裁判文書(shū),這一數(shù)據(jù)乍一看確實(shí)龐大,但當(dāng)這1.2億份裁判文書(shū)平均到每個(gè)案由、每個(gè)罪名上,數(shù)據(jù)看上去就沒(méi)有那么大了,如果再進(jìn)一步細(xì)分到數(shù)以千計(jì)的法院、法官上,那么這個(gè)數(shù)字就更少了。
同時(shí)有一項(xiàng)研究顯示,在河南省184個(gè)法院2014年上網(wǎng)公開(kāi)的案件只占全部案件的41%,占比不足一半,而全國(guó)各地不同法院在公開(kāi)程度上亦同樣存在較大的差異(從15%到83%)。當(dāng)數(shù)據(jù)不全面或失真時(shí),對(duì)數(shù)據(jù)樣本進(jìn)行挖掘分析便會(huì)有失偏頗,無(wú)法形成對(duì)律師的案情指導(dǎo)。

02
對(duì)律師的專(zhuān)業(yè)度要求更高
憑借著數(shù)據(jù)挖掘技術(shù),律師能夠?qū)ξ腥说陌讣M(jìn)行一個(gè)前期預(yù)判,但同樣的當(dāng)事雙方也可以利用這一技術(shù)進(jìn)行準(zhǔn)備,為此律師反而必須更加專(zhuān)業(yè)和謹(jǐn)慎地對(duì)待案件,否則一旦因個(gè)人過(guò)失造成敗訴,便會(huì)在平臺(tái)留下執(zhí)業(yè)記錄,從而影響到自己在未來(lái)的職業(yè)發(fā)展。
隨著數(shù)據(jù)挖掘技術(shù)不斷融入法律行業(yè)后,過(guò)去信息不對(duì)稱(chēng)的局面將被逐漸打破,律師的執(zhí)業(yè)信息將會(huì)被完全公開(kāi),客戶(hù)可以通過(guò)這些信息對(duì)律師進(jìn)行篩選,形成更加激烈的競(jìng)爭(zhēng)局面,倘若律師的法律服務(wù)不被認(rèn)可和信任,將會(huì)損失大量的潛在客戶(hù)。

身處大數(shù)據(jù)時(shí)代,我們正無(wú)時(shí)不刻不受到大數(shù)據(jù)廣泛而深刻的影響。這不僅為數(shù)據(jù)挖掘在法律服務(wù)行業(yè)的發(fā)展提供了空前機(jī)遇,也是傳統(tǒng)法律服務(wù)向數(shù)字化法律服務(wù)轉(zhuǎn)型的一個(gè)重要契機(jī)。
而當(dāng)下,更為要緊的工作可能是正視并努力突破數(shù)據(jù)挖掘所面臨的困境與羈絆。要正確理解法律大數(shù)據(jù)并加以利用,科學(xué)、有效地開(kāi)展數(shù)據(jù)分析研究,幫助律師更好地獲取商機(jī),使我們的法律服務(wù)行業(yè)借助數(shù)據(jù)的力量實(shí)現(xiàn)質(zhì)的蛻變。