NLP知識(shí)圖譜項(xiàng)目合集(信息抽取、文本分類、圖神經(jīng)網(wǎng)絡(luò)、性能優(yōu)化等)
NLP知識(shí)圖譜項(xiàng)目合集(信息抽取、文本分類、圖神經(jīng)網(wǎng)絡(luò)、性能優(yōu)化等)
這段時(shí)間完成了很多大大小小的小項(xiàng)目,現(xiàn)在做一個(gè)整體歸納方便學(xué)習(xí)和收藏,有利于持續(xù)學(xué)習(xí)。
1. 信息抽取項(xiàng)目合集
1.PaddleNLP之UIE技術(shù)科普【一】實(shí)例:實(shí)體識(shí)別、情感分析、智能問答?https://aistudio.baidu.com/aistudio/projectdetail/4180615?contributionType=1
NLP領(lǐng)域任務(wù)選擇合適預(yù)訓(xùn)練模型以及合適的方案【規(guī)范建議】【ERNIE模型首選】?https://aistudio.baidu.com/aistudio/projectdetail/4888188?contributionType=1
Paddlenlp之UIE模型實(shí)戰(zhàn)實(shí)體抽取任務(wù)【打車數(shù)據(jù)、快遞單】?https://aistudio.baidu.com/aistudio/projectdetail/4321385?contributionType=1
快遞單信息抽取【二】基于ERNIE1.0 預(yù)訓(xùn)練模型?https://aistudio.baidu.com/aistudio/projectdetail/4157455?contributionType=1
快遞單信息抽取[三]:Ernie 1.0至ErnieGram + CRF改進(jìn)算法?https://aistudio.baidu.com/aistudio/projectdetail/4159638?contributionType=1
UIE之快遞單信息抽取【四】--小樣本標(biāo)注數(shù)據(jù)提高準(zhǔn)確率?https://aistudio.baidu.com/aistudio/projectdetail/4160432?contributionType=1
Paddlenlp之UIE關(guān)系抽取模型【高管關(guān)系抽取為例】?https://aistudio.baidu.com/aistudio/projectdetail/4371345?contributionType=1
文檔級(jí)關(guān)系抽取模型:基于結(jié)構(gòu)先驗(yàn)產(chǎn)生注意力偏差SSAN模型?https://aistudio.baidu.com/aistudio/projectdetail/4666541?contributionType=1
基線提升至96.45%:2022 司法杯犯罪事實(shí)實(shí)體識(shí)別+數(shù)據(jù)蒸餾+主動(dòng)學(xué)習(xí)?https://aistudio.baidu.com/aistudio/projectdetail/4911042?contributionType=1
[信息抽取]基于ERNIE3.0的多對(duì)多信息抽取算法:屬性關(guān)系抽取?https://aistudio.baidu.com/aistudio/projectdetail/5143572?contributionType=1
基于ERNIELayout&PDFplumber-UIEX多方案學(xué)術(shù)論文信息抽取?https://aistudio.baidu.com/aistudio/projectdetail/5196032?contributionType=1
2.文本分類意圖識(shí)別項(xiàng)目合集
應(yīng)用實(shí)踐:分類模型大集成者[PaddleHub、Finetune、prompt]?https://aistudio.baidu.com/aistudio/projectdetail/4357474?contributionType=1
小樣本學(xué)習(xí)分類任務(wù):在文心ERNIE3.0應(yīng)用(提示學(xué)習(xí)),提速提效快用起來!?https://aistudio.baidu.com/aistudio/projectdetail/4438610?contributionType=1
2022 CCF大數(shù)據(jù)與計(jì)算智能大賽:小樣本數(shù)據(jù)分類任務(wù)baseline?https://aistudio.baidu.com/aistudio/projectdetail/4479243?contributionType=1
Paddlenlp之UIE分類模型【以情感傾向分析新聞分類為例】含智能標(biāo)注方案)?https://aistudio.baidu.com/aistudio/projectdetail/4337189?contributionType=1
基于ERNIR3.0文本分類:(KUAKE-QIC)意圖識(shí)別多分類(單標(biāo)簽)?https://aistudio.baidu.com/aistudio/projectdetail/4362154?contributionType=1
基于Ernie-3.0 CAIL2019法研杯要素識(shí)別多標(biāo)簽分類任務(wù)?https://aistudio.baidu.com/aistudio/projectdetail/4280922?contributionType=1
基于ERNIR3.0文本分類:CAIL2018-SMALL罪名預(yù)測(cè)為例(多標(biāo)簽)?https://aistudio.baidu.com/aistudio/projectdetail/4374631?contributionType=1
基于ERNIR3.0文本分類:WOS數(shù)據(jù)集為例(層次分類)?https://aistudio.baidu.com/aistudio/projectdetail/4382251?contributionType=1
3.模型性能提升項(xiàng)目合集
在數(shù)據(jù)增強(qiáng)、蒸餾剪枝下ERNIE3.0模型性能提升詳細(xì)方案?https://aistudio.baidu.com/aistudio/projectdetail/4436131?contributionType=1
Paddle模型性能分析工具Profiler:定位瓶頸點(diǎn)、優(yōu)化程序、提升性能?https://aistudio.baidu.com/aistudio/projectdetail/4482932?contributionType=1
可視化分析工具VisualDL 2.4強(qiáng)勢(shì)來襲!新增:動(dòng)態(tài)圖模型可視化和性能分析?https://aistudio.baidu.com/aistudio/projectdetail/4561034?contributionType=1
推廣TrustAI可信分析:通過提升數(shù)據(jù)質(zhì)量來增強(qiáng)在ERNIE模型下性能?https://aistudio.baidu.com/aistudio/projectdetail/4622139?contributionType=1
AiTrust下預(yù)訓(xùn)練和小樣本學(xué)習(xí)在中文醫(yī)療信息處理挑戰(zhàn)榜CBLUE表現(xiàn)?https://aistudio.baidu.com/aistudio/projectdetail/4592515?contributionType=1
UIE Slim滿足工業(yè)應(yīng)用場(chǎng)景,解決推理部署耗時(shí)問題,提升效能!?https://aistudio.baidu.com/aistudio/projectdetail/4516470?contributionType=1
主動(dòng)學(xué)習(xí)(Active Learning)綜述以及在文本分類和序列標(biāo)注應(yīng)用?https://aistudio.baidu.com/aistudio/projectdetail/4897371?contributionType=1
4.知識(shí)圖譜項(xiàng)目合集
技術(shù)知識(shí)介紹:工業(yè)級(jí)知識(shí)圖譜方法與實(shí)踐?https://aistudio.baidu.com/aistudio/projectdetail/4444783?contributionType=1
特定領(lǐng)域知識(shí)圖譜融合方案:技術(shù)知識(shí)前置【一】-文本匹配算法?https://aistudio.baidu.com/aistudio/projectdetail/5398069?contributionType=1
特定領(lǐng)域知識(shí)圖譜(Domain-specific KnowledgeGraph:DKG)融合方案(重點(diǎn)!)
在前面技術(shù)知識(shí)下可以看看后續(xù)的實(shí)際業(yè)務(wù)落地方案和學(xué)術(shù)方案
關(guān)于圖神經(jīng)網(wǎng)絡(luò)的知識(shí)融合技術(shù)學(xué)習(xí)參考下面鏈接:PGL圖學(xué)習(xí)項(xiàng)目合集&數(shù)據(jù)集分享&技術(shù)歸納業(yè)務(wù)落地技巧[系列十]
從入門知識(shí)到經(jīng)典圖算法以及進(jìn)階圖算法等,自行查閱食用!
文章篇幅有限請(qǐng)參考專欄按需查閱:NLP知識(shí)圖譜相關(guān)技術(shù)業(yè)務(wù)落地方案和碼源
4.1 特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊):優(yōu)酷領(lǐng)域知識(shí)圖譜為例
方案鏈接:https://blog.csdn.net/sinat_39620217/article/details/128614951
4.2 特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊):文娛知識(shí)圖譜構(gòu)建之人物實(shí)體對(duì)齊
方案鏈接:https://blog.csdn.net/sinat_39620217/article/details/128673963
4.3 特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊):商品知識(shí)圖譜技術(shù)實(shí)戰(zhàn)
方案鏈接:https://blog.csdn.net/sinat_39620217/article/details/128674429
4.4 特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊):基于圖神經(jīng)網(wǎng)絡(luò)的商品異構(gòu)實(shí)體表征探索
方案鏈接:https://blog.csdn.net/sinat_39620217/article/details/128674929
4.5 特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊)論文合集
方案鏈接:https://blog.csdn.net/sinat_39620217/article/details/128675199
論文資料鏈接:兩份內(nèi)容不相同,且按照序號(hào)從小到大重要性依次遞減
知識(shí)圖譜實(shí)體對(duì)齊資料論文參考(PDF)+實(shí)體對(duì)齊方案+特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊)
知識(shí)圖譜實(shí)體對(duì)齊資料論文參考(CAJ)+實(shí)體對(duì)齊方案+特定領(lǐng)域知識(shí)圖譜知識(shí)融合方案(實(shí)體對(duì)齊)
4.6 知識(shí)融合算法測(cè)試方案(知識(shí)生產(chǎn)質(zhì)量保障)
方案鏈接:https://blog.csdn.net/sinat_39620217/article/details/128675698
5.圖神經(jīng)網(wǎng)絡(luò)
**1.1 關(guān)于圖計(jì)算&圖學(xué)習(xí)的基礎(chǔ)知識(shí)概覽:前置知識(shí)點(diǎn)學(xué)習(xí)(PGL)系列一]** :[https://aistudio.baidu.com/aistudio/projectdetail/4982973?contributionType=1
本項(xiàng)目對(duì)圖基本概念、關(guān)鍵技術(shù)(表示方法、存儲(chǔ)方式、經(jīng)典算法),應(yīng)用等都進(jìn)行詳細(xì)講解,并在最后用程序?qū)崿F(xiàn)各類算法方便大家更好的理解。當(dāng)然之后所有圖計(jì)算相關(guān)都是為了知識(shí)圖譜構(gòu)建的前置條件
1.2 圖機(jī)器學(xué)習(xí)(GML)&圖神經(jīng)網(wǎng)絡(luò)(GNN)原理和代碼實(shí)現(xiàn)(前置學(xué)習(xí)系列二)?https://aistudio.baidu.com/aistudio/projectdetail/4990947?contributionType=1
現(xiàn)在已經(jīng)覆蓋了圖的介紹,圖的主要類型,不同的圖算法,在Python中使用Networkx來實(shí)現(xiàn)它們,以及用于節(jié)點(diǎn)標(biāo)記,鏈接預(yù)測(cè)和圖嵌入的圖學(xué)習(xí)技術(shù),最后講了GNN分類應(yīng)用以及未來發(fā)展方向!
1.3 圖學(xué)習(xí)初探Paddle Graph Learning 構(gòu)建屬于自己的圖【系列三】?https://aistudio.baidu.com/aistudio/projectdetail/5000517?contributionType=1
本項(xiàng)目主要講解了圖學(xué)習(xí)的基本概念、圖的應(yīng)用場(chǎng)景、以及圖算法,最后介紹了PGL圖學(xué)習(xí)框架并給出demo實(shí)踐,過程中把老項(xiàng)目demo修正版本兼容問題等小坑,并在最新版本運(yùn)行便于后續(xù)同學(xué)更有體驗(yàn)感
1.4 PGL圖學(xué)習(xí)之圖游走類node2vec、deepwalk模型[系列四]?https://aistudio.baidu.com/aistudio/projectdetail/5002782?contributionType=1
介紹了圖嵌入原理以及了圖嵌入中的DeepWalk、node2vec算法,利用pgl對(duì)DeepWalk、node2vec進(jìn)行了實(shí)現(xiàn),并給出了多個(gè)框架版本的demo滿足個(gè)性化需求。
圖學(xué)習(xí)【參考資料1】詞向量word2vec?https://aistudio.baidu.com/aistudio/projectdetail/5009409?contributionType=1
介紹詞向量word2evc概念,及CBOW和Skip-gram的算法實(shí)現(xiàn)。
圖學(xué)習(xí)【參考資料2】-知識(shí)補(bǔ)充與node2vec代碼注解https://aistudio.baidu.com/aistudio/projectdetail/5012408?contributionType=1
主要引入基本的同構(gòu)圖、異構(gòu)圖知識(shí)以及基本概念;同時(shí)對(duì)deepWalk代碼的注解以及node2vec、word2vec的說明總結(jié);(以及作業(yè)代碼注解)
1.5 PGL圖學(xué)習(xí)之圖游走類metapath2vec模型[系列五]?https://aistudio.baidu.com/aistudio/projectdetail/5009827?contributionType=1
介紹了異質(zhì)圖,利用pgl對(duì)metapath2vec以及metapath2vec變種算法進(jìn)行了實(shí)現(xiàn),同時(shí)講解實(shí)現(xiàn)圖分布式引擎訓(xùn)練,并給出了多個(gè)框架版本的demo滿足個(gè)性化需求。
1.6 PGL圖學(xué)習(xí)之圖神經(jīng)網(wǎng)絡(luò)GNN模型GCN、GAT[系列六]?[https://aistudio.baidu.com/aistudio/projectdetail/5054122?contributionType=1](https://aistudio.baidu.com/aistudio/projectdetail/5054122?c ontributionType=1)
本次項(xiàng)目講解了圖神經(jīng)網(wǎng)絡(luò)的原理并對(duì)GCN、GAT實(shí)現(xiàn)方式進(jìn)行講解,最后基于PGL實(shí)現(xiàn)了兩個(gè)算法在數(shù)據(jù)集Cora、Pubmed、Citeseer的表現(xiàn),在引文網(wǎng)絡(luò)基準(zhǔn)測(cè)試中達(dá)到了與論文同等水平的指標(biāo)。
**1.7 PGL圖學(xué)習(xí)之圖神經(jīng)網(wǎng)絡(luò)GraphSAGE、GIN圖采樣算法系列七]** [https://aistudio.baidu.com/aistudio/projectdetail/5061984?contributionType=1
本項(xiàng)目主要講解了GraphSage、PinSage、GIN算法的原理和實(shí)踐, 并在多個(gè)數(shù)據(jù)集上進(jìn)行仿真實(shí)驗(yàn),基于PGl實(shí)現(xiàn)原論文復(fù)現(xiàn)和對(duì)比,也從多個(gè)角度探討當(dāng)前算法的異同以及在工業(yè)落地的技巧等。
1.8 PGL圖學(xué)習(xí)之圖神經(jīng)網(wǎng)絡(luò)ERNIESage、UniMP進(jìn)階模型[系列八]?https://aistudio.baidu.com/aistudio/projectdetail/5096910?contributionType=1
ErnieSage 可以同時(shí)建模文本語義與圖結(jié)構(gòu)信息,有效提升 Text Graph 的應(yīng)用效果;UniMP 在概念上統(tǒng)一了特征傳播和標(biāo)簽傳播, 在OGB取得了優(yōu)異的半監(jiān)督分類結(jié)果。
PGL圖學(xué)習(xí)之ERNIESage算法實(shí)現(xiàn)(1.8x版本)【系列八】?https://aistudio.baidu.com/aistudio/projectdetail/5097085?contributionType=1
ERNIESage運(yùn)行實(shí)例介紹(1.8x版本),提供多個(gè)版本pgl代碼實(shí)現(xiàn)
1.9 PGL圖學(xué)習(xí)之項(xiàng)目實(shí)踐(UniMP算法實(shí)現(xiàn)論文節(jié)點(diǎn)分類、新冠疫苗項(xiàng)目)[系列九]?https://aistudio.baidu.com/aistudio/projectdetail/5100049?contributionType=1
本項(xiàng)目借鑒了百度高研黃正杰大佬對(duì)圖神經(jīng)網(wǎng)絡(luò)技術(shù)分析以及圖算法在業(yè)務(wù)側(cè)應(yīng)用落地;實(shí)現(xiàn)了論文節(jié)點(diǎn)分類和新冠疫苗項(xiàng)目的實(shí)踐幫助大家更好理解學(xué)習(xí)圖的魅力。
PGL圖學(xué)習(xí)之基于GNN模型新冠疫苗任務(wù)[系列九]?https://aistudio.baidu.com/aistudio/projectdetail/5123296?contributionType=1
圖神經(jīng)網(wǎng)絡(luò)7日打卡營的新冠疫苗項(xiàng)目拔高實(shí)戰(zhàn)
PGL圖學(xué)習(xí)之基于UniMP算法的論文引用網(wǎng)絡(luò)節(jié)點(diǎn)分類任務(wù)[系列九]?https://aistudio.baidu.com/aistudio/projectdetail/5116458?contributionType=1
基于UniMP算法的論文引用網(wǎng)絡(luò)節(jié)點(diǎn)分類,在調(diào)通UniMP之后,后續(xù)嘗試的技巧對(duì)于其精度的提升效力微乎其微,所以不得不再次感嘆百度PGL團(tuán)隊(duì)的強(qiáng)大!
PGL圖學(xué)習(xí)項(xiàng)目合集&數(shù)據(jù)集分享&技術(shù)歸納業(yè)務(wù)落地技巧[系列十]?https://aistudio.baidu.com/aistudio/projectdetail/5127575?contributionType=1
6.其他項(xiàng)目
強(qiáng)化學(xué)習(xí)
【強(qiáng)化學(xué)習(xí)項(xiàng)目一】搭建自己的尋寶游戲環(huán)境(Qlearning)?https://aistudio.baidu.com/aistudio/projectdetail/2006781?contributionType=1
MADDPG多智能體深度強(qiáng)化學(xué)習(xí)算法算法實(shí)現(xiàn)(parl)--【追逐游戲復(fù)現(xiàn)】?https://aistudio.baidu.com/aistudio/projectdetail/1864915?contributionType=1
使用TD3解決四軸飛行器懸浮任務(wù)?https://aistudio.baidu.com/aistudio/projectdetail/1705633?contributionType=1
深度學(xué)習(xí)
【深度學(xué)習(xí)項(xiàng)目一】全連接神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)手寫數(shù)字識(shí)別?https://aistudio.baidu.com/aistudio/projectdetail/1926913?contributionType=1
深度學(xué)習(xí)項(xiàng)目二】卷積神經(jīng)網(wǎng)絡(luò)LeNet實(shí)現(xiàn)手寫數(shù)字識(shí)別?https://aistudio.baidu.com/aistudio/projectdetail/1928935?contributionType=1
【深度學(xué)習(xí)項(xiàng)目三】ResNet50多分類任務(wù)【十二生肖分類】?https://aistudio.baidu.com/bd-cpu-01/user/691158/5427356/home#codelab
『深度學(xué)習(xí)項(xiàng)目四』基于ResNet101人臉關(guān)鍵點(diǎn)檢測(cè)?https://aistudio.baidu.com/aistudio/projectdetail/1932295?contributionType=1
【深度學(xué)習(xí)項(xiàng)目五】:利用LSTM網(wǎng)絡(luò)進(jìn)行情感分析?https://aistudio.baidu.com/aistudio/projectdetail/1994431?contributionType=1
??持續(xù)更新中???