SeqGPT:阿里發(fā)布適用于自然語言理解任務(wù)的大模型
可在線運行的notebook:在kaggle網(wǎng)站搜索
SeqGPT-560M
我們首先加載該模型:
然后使用源模型完成信息抽取任務(wù):
同樣的,我們還可以使用該模型完成文本分類任務(wù):
當然,以上的代碼中有多處地方是重復(fù)的,后續(xù)可以將它們形成一個函數(shù)或者類方便調(diào)用。
該模型是使用bloom模型微調(diào)得到,所以若模型在某些場景效果不好,可以將它進行微調(diào)得到適用于業(yè)務(wù)場景的新模型
標簽: