阿里發(fā)布中文版 gte 文本轉(zhuǎn)向量模型的 small 版本
可在線運行的notebook鏈接:在kaggle網(wǎng)站搜索:
gte_sentence-embedding_chinese_small
首先需要安裝依賴包:
然后下載并加載該模型:
接著我們將文本批量轉(zhuǎn)換為向量:
最終我們計算兩段文本之間的相似度:

不僅如此,我們還可以對模型進(jìn)行微調(diào),首先加載用于微調(diào)的語料:
然后我們就可以進(jìn)行模型微調(diào)了:
最終我們使用微調(diào)后的語料重新計算文本相似度:
標(biāo)簽: