交大榮昶杯數(shù)據(jù)集標(biāo)注資源
2022年7月16日至23日,第四屆上海交通大學(xué)“榮昶杯”算法打榜賽道的比賽在線上線下同步進(jìn)行,近百支隊伍參加了這一賽事。本次比賽的主題是通過數(shù)據(jù)集標(biāo)注訓(xùn)練模型實現(xiàn)對給定文本的標(biāo)簽自動標(biāo)注。
本次比賽需要對給定的文本標(biāo)注4種標(biāo)簽,分別是人名(PER),地名(LOC),組織(ORG)以及時間(DATE)。這是一件相當(dāng)繁重的工作,由于在網(wǎng)絡(luò)上目前缺乏符合要求的免費(fèi)資源,我們決定在賽后公開我們隊伍的train.txt(約2350萬行),方便后來者更好地訓(xùn)練模型,同時節(jié)約無聊的標(biāo)注時間。
然而,為了證明你不是一個偷資源到CSDN上去賣的fw,我們準(zhǔn)備了一套試題用于檢驗?zāi)闶欠駬碛幸粋€高一學(xué)生的數(shù)理化認(rèn)知水平。資源在一個QQ群里,群號是9位數(shù)。云剪切板https://www.luogu.com.cn/paste/xyctfr47 中有9道試題,每題的答案都是0~9中的一個數(shù)字,依次串聯(lián)起來即可得到群號。該群允許任何人加入。
祝?訓(xùn)練愉快!
標(biāo)簽: