最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

深藍(lán)-生成式預(yù)訓(xùn)練語言模型:理論與實(shí)戰(zhàn)

2023-07-09 11:01 作者:bili_81527274639  | 我要投稿

什么是預(yù)訓(xùn)練模型(Pretrained model)?

一般情況下預(yù)訓(xùn)練模型都是大型模型,具備復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),眾多的參數(shù)量,以及在足夠大的數(shù)據(jù)集下進(jìn)行訓(xùn)練而產(chǎn)生的模型. 在NLP領(lǐng)域,預(yù)訓(xùn)練模型往往是語言模型,因?yàn)檎Z言模型的訓(xùn)練是無監(jiān)督的,可以獲得大規(guī)模語料,同時(shí)語言模型又是許多典型NLP任務(wù)的基礎(chǔ),如機(jī)器翻譯,文本生成,閱讀理解等,常見的預(yù)訓(xùn)練模型有BERT, GPT, roBERTa, transformer-XL等.


什么是微調(diào)(Fine-tuning)?

根據(jù)給定的預(yù)訓(xùn)練模型,改變它的部分參數(shù)或者為其新增部分輸出結(jié)構(gòu)后,通過在小部分?jǐn)?shù)據(jù)集上訓(xùn)練,來使整個(gè)模型更好的適應(yīng)特定任務(wù).


什么是微調(diào)腳本(Fine-tuning script)?

實(shí)現(xiàn)微調(diào)過程的代碼文件。這些腳本文件中,應(yīng)包括對(duì)預(yù)訓(xùn)練模型的調(diào)用,對(duì)微調(diào)參數(shù)的選定以及對(duì)微調(diào)結(jié)構(gòu)的更改等,同時(shí),因?yàn)槲⒄{(diào)是一個(gè)訓(xùn)練過程,它同樣需要一些超參數(shù)的設(shè)定,以及損失函數(shù)和優(yōu)化器的選取等, 因此微調(diào)腳本往往也包含了整個(gè)遷移學(xué)習(xí)的過程.


說一說常見的兩種遷移方式?

直接使用預(yù)訓(xùn)練模型,進(jìn)行相同任務(wù)的處理,不需要調(diào)整參數(shù)或模型結(jié)構(gòu),這些模型開箱即用。但是這種情況一般只適用于普適任務(wù), 如:fasttest工具包中預(yù)訓(xùn)練的詞向量模型。另外,很多預(yù)訓(xùn)練模型開發(fā)者為了達(dá)到開箱即用的效果,將模型結(jié)構(gòu)分各個(gè)部分保存為不同的預(yù)訓(xùn)練模型,提供對(duì)應(yīng)的加載方法來完成特定目標(biāo).


更加主流的遷移學(xué)習(xí)方式是發(fā)揮預(yù)訓(xùn)練模型特征抽象的能力,然后再通過微調(diào)的方式,通過訓(xùn)練更新小部分參數(shù)以此來適應(yīng)不同的任務(wù)。這種遷移方式需要提供小部分的標(biāo)注數(shù)據(jù)來進(jìn)行監(jiān)督學(xué)習(xí).


深藍(lán)-生成式預(yù)訓(xùn)練語言模型:理論與實(shí)戰(zhàn)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
清水河县| 华阴市| 湖北省| 绥江县| 阿克苏市| 财经| 区。| 马龙县| 德惠市| 郸城县| 扶绥县| 敦煌市| 凤冈县| 大荔县| 永和县| 富蕴县| 崇州市| 华容县| 原阳县| 镇平县| 古田县| 娱乐| 哈密市| 宁都县| 吉木乃县| 望谟县| 宁阳县| 铜陵市| 临猗县| 金沙县| 满洲里市| 巴彦淖尔市| 滕州市| 察哈| 潜山县| 田东县| 平湖市| 水城县| 渝北区| 连江县| 桃江县|