9月28日+29日,大牛帶你精讀前沿論文,一小時(shí)解讀信息抽取大一統(tǒng)模型UIE
2022年了,有人說信息抽取領(lǐng)域早已是諸神黃昏。然而即使這樣,依然“內(nèi)卷”不止。似乎這個(gè)卷成麻花的領(lǐng)域已經(jīng)看不到希望?
但是不久前,這個(gè)沉寂之地忽然翻起了浪花,一篇發(fā)表在ACL2022上的工作,昭示著這個(gè)領(lǐng)域終于獲得了里程碑式的突破。

用一個(gè)架構(gòu)實(shí)現(xiàn)了對(duì)該領(lǐng)域諸多子任務(wù)的統(tǒng)一建模,就好像秦始皇終于實(shí)現(xiàn)了大一統(tǒng),消除了各個(gè)諸侯國(guó)之間不互通的度量衡(不是)。
之所以說是里程碑式的突破,是因?yàn)檫@項(xiàng)工作,屠爆了學(xué)術(shù)界榜單,成為信息抽取領(lǐng)域學(xué)術(shù)層面的最新SOTA;并且是人人可傻瓜式使用的開源工具,這意味著在這個(gè)應(yīng)用場(chǎng)景非常廣泛的領(lǐng)域,它能夠快速的大規(guī)模落地開花~
原本應(yīng)為任務(wù)難度大,落地成本居高不下的信息抽取,在各個(gè)領(lǐng)域都有了史無前例的可能性。無論是實(shí)體抽取還是事件抽取,都可以做到簡(jiǎn)潔并且精準(zhǔn)!簡(jiǎn)直好用到讓人覺得有點(diǎn)夢(mèng)幻了!
這不禁讓人好奇,這個(gè)開源工具的背后是怎么做到的呢?
這個(gè)在ACL2022大放異彩的信息抽取技術(shù)UIE,聯(lián)合增強(qiáng)語(yǔ)言模型ERNIE3.0,強(qiáng)強(qiáng)聯(lián)合帶來讓人驚艷的效果!
9月28、29日,直播解讀超強(qiáng)UIE。
私信進(jìn)群免費(fèi)看直播
擁有“十八般武藝”的UIE不僅具備超強(qiáng)的zero-shot開放域信息抽取能力,還身具小樣本定制訓(xùn)練能力。所以哪怕它在某些場(chǎng)景中表現(xiàn)欠佳,只要人工標(biāo)幾個(gè)樣本丟過去就能大幅提升效果。這個(gè)強(qiáng)大的Few-Shot能力是工具在大量長(zhǎng)尾場(chǎng)景落地的最后一公里保障。
簡(jiǎn)單來說,UIE借鑒近年來火熱的Prompt概念,將希望抽取的Schema信息轉(zhuǎn)換成“線索詞” (Schema-basedPrompt)作為模型輸入的前綴(SSI),使得模型理論上能夠適應(yīng)不同領(lǐng)域和任務(wù)的Schema信息,并按需抽取出線索詞指向的內(nèi)容,生成結(jié)構(gòu)化語(yǔ)言表述的抽取結(jié)果(SEL)從而實(shí)現(xiàn)開放域環(huán)境下的通用信息抽取。
經(jīng)過UIE預(yù)訓(xùn)練后,模型的小樣本學(xué)習(xí)能力得到了極大的提升,這便是UIE工具具備強(qiáng)大定制化能力,進(jìn)而實(shí)現(xiàn)中長(zhǎng)尾行業(yè)落地的關(guān)鍵。
對(duì)更多細(xì)節(jié)感興趣的小伙伴,可以掃碼預(yù)約UIE講解直播哦~
講師介紹??

當(dāng)然,對(duì)于NLPer來說,最關(guān)心的還是能夠?qū)ψ隹蒲?,寫論文有什么幫助?/p>
不論是繼續(xù)讀博還是為了后面優(yōu)質(zhì)的就業(yè)機(jī)會(huì),甚至就算是畢業(yè),也對(duì)論文水平和質(zhì)量有要求。
而對(duì)于發(fā)論文,最核心的一點(diǎn)仍然是你的工作有沒有作出貢獻(xiàn),有沒有創(chuàng)新。
那么及時(shí)了解領(lǐng)域內(nèi)最前沿的技術(shù),了解最新的sota,對(duì)于激發(fā)出一個(gè)好的idea,至關(guān)重要。
9月28、29日,大牛帶你精讀前沿論文,掌握最新sota,為你的科研答疑解惑。