某大神在商湯的詞嵌入模型基礎(chǔ)上訓(xùn)練出了更強(qiáng)模型
可在線運(yùn)行的notebook:在kaggle網(wǎng)站搜索
stella-base-zh
首先安裝依賴:
接著加載該模型:
那么我們就可以計(jì)算兩段文本的相似度了:

有時(shí)候直接使用該模型無法達(dá)到你的預(yù)期水平,可以考慮微調(diào)該模型。首先我們需要準(zhǔn)備數(shù)據(jù):
接著使用上面準(zhǔn)備的數(shù)據(jù)微調(diào)模型:
接著仍然是計(jì)算兩段文本的相似度,最終的相似度有所提高:
標(biāo)簽: