最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

【花師小哲】鑒定網(wǎng)絡熱門(?)AI(6)——Prompt

2023-03-20 20:38 作者:花師小哲-中二  | 我要投稿

今天講一個大件,也是最近非?;鸬?strong>提示(prompt)工程。讓我們來看看最近的prompt已經(jīng)卷到了什么程度。本文大概總結了十五六篇prompt相關的論文,鏈接就不一一發(fā)出來了(有些也是師兄整理的),大家如果有興趣可以私戳我要。

0.prompt是什么

首先還是再介紹下prompt。

如果大家玩過ChatGPT的話,應該知道你的輸入是會影響輸出質量的。例如如果你單純說“給我寫一封信”是很難達到你想要的效果的,如果你說“請幫我寫一封情書,送給ChatGPT”那么輸出的結果就會更傾向于符合你的預期。對于其他大語言模型(LLM)來說也是一樣。

另一點就是在我們做一些數(shù)學題時,如果題干有提示的話做起來會更輕松一些,如果有答題示例就更好了。

沒錯,提示(prompt)就是這么一種東西,就是為了讓你的輸入能夠更好地獲得預期輸出的一種東西,或者說對于單純輸入的修飾。

寫好prompt能夠使得輸出結果的質量高非常多。所以現(xiàn)在有很多廠家招收提示工程師(一如前幾年招收調(diào)參工程師一樣)。

當然,在學術界,prompt的研究也早就卷起來了,我們就隨便按幾個類別來說一下吧。

(本篇不是什么正經(jīng)綜述,分類都是隨便分的)

1.增強方法

就我個人來說,很多增強方法都屬于prompt。

所謂增強,簡單來說就是補充額外信息。補充的途徑是多種多樣的,最經(jīng)典的就是new bing為代表的檢索-增強。我們知道ChatGPT是端到端的模型,本身不存儲和更新任何知識,所以對于2022年及之后的新信息都不知道,對于一些冷門知識也不知道或知道的不準確。而搜索引擎可以一定程度上彌補這一劣勢。

檢索-增強本身很簡單,搜索到有用的東西,就連同你的輸入一起給大語言模型了。所以我們會看到用new bing都是先檢索的。

稍微透露一篇論文

其他的增強方法還有借助外部知識庫的增強,還有背誦-增強(例如我們問π的小數(shù)點后第5位是什么,我們就可以先問ChatGPT π是多少,再問它小數(shù)點后第5位是什么)等

2.思維鏈CoT

思維鏈整體也可以看做是一種prompt工程,或者說一種研究的比較多的可以獨立出來的一種特殊prompt。

簡單來說,思維鏈就是一步步地思考。就像我們做數(shù)學題一樣,一步步得出結果。我個人認為,思維鏈能有作用還是和語言模型的預訓練方式有關。

思維鏈也有很多種形式,例如最基本的就是在輸入問題后加一句“Let's think step by step”(這一句也是實驗出來的,加其他的句子整體效果都不如這一句)。其他的還有思維鏈演示等方法。

當然,作為一種明星prompt方法,CoT也卷的厲害。例如多路CoT、自動CoT、子問題CoT等。

3.多路提示工程

我自己做的一種分類,我們發(fā)現(xiàn),很多prompt都是多路的方法。

我們知道,對于同樣的輸入,ChatGPT是可以輸出不同的內(nèi)容的。最基本的想法是,我們讓ChatGPT多輸出一些結果,然后整合結果,效果應該會更好。這種做法也被大量的應用,舉個例子:

MathPrompt

這也是最近比較火的MathPrompt。我們知道ChatGPT為代表的大語言模型的數(shù)學基本都比較差,這種方法就是試圖提升數(shù)學能力的提示工程。它不讓大語言模型直接解題了,而是讓它寫代碼或表達式之類的來生成答案。一個基本思想是,如果python代碼和表達式的輸出一致,那么答案就更可能對。就像我們做題的時候可以用兩種方法來做,就可以互相驗證。

對,可以看到,多路的好處就有可以互相驗證、可以得到輸出分布并進行采樣等。

4.多模態(tài)提示工程

既然有了純視覺的提示工程,當然離不開多模態(tài),我們?yōu)槭裁床荒馨岩曈X、聲音等模態(tài)加進去呢?

事實上真的有,這里就簡單列舉兩個吧:

(1)先知:

【花師小哲】當代煉金術(神經(jīng)網(wǎng)絡)前沿(24)——往語言大模型里塞視覺模態(tài)

(2)蘇格拉底:

谷歌的一個多模態(tài)prompt框架,是將其他模態(tài)都轉化為語言模態(tài),或者說以語言模態(tài)為中介來做的。不過這個好像是要人工設計prompt的。

可以看到,現(xiàn)在大部分多模態(tài)都仍然是以語言模型為核心

5.大語言模型自己生成prompt

最后放王炸。沒錯,前不久傳的提示工程師這個崗位剛出現(xiàn)就要消失了,就是因為語言模型已經(jīng)可以自己生成合適的prompt了。

其實并沒有那么驚奇,語言模型早就可以在各處打工了。

以下是一個比較著名的語言模型自己生成prompt的模型:

這里用了蒙特卡洛算法,AlphaGO用過的

具體不展開講,但我們會發(fā)現(xiàn),作者在這里讓一個大語言模型以三種身份在工作(或者一個人打了三份工)。其實這種大模型循環(huán)也不是什么新鮮事了。

6.結語

可以看到,關于提示工程現(xiàn)在已經(jīng)卷的很厲害了?,F(xiàn)在很多做機器翻譯的在做的都是積累怎么改進prompt能使得翻譯效果很好的經(jīng)驗了。我們會看到,ChatGPT未來將會被用在各種各樣的地方,例如有些人已經(jīng)把ChatGPT取代知識庫了,有些人已經(jīng)用ChatGPT做教師了,已經(jīng)有人Learning from ChatGPT feedback了。

梗圖

這種勢頭應該還會持續(xù)很久。不過prompt真的就是通向通用人工智能的答案了嗎?未來AI研究的范式就是如此了嗎?可能還有待于進一步觀察。


【花師小哲】鑒定網(wǎng)絡熱門(?)AI(6)——Prompt的評論 (共 條)

分享到微博請遵守國家法律
长汀县| 南靖县| 临猗县| 文成县| 苏尼特右旗| 裕民县| 尚义县| 甘孜| 买车| 开鲁县| 孝感市| 堆龙德庆县| 临西县| 上饶市| 都江堰市| 卓尼县| 大厂| 无为县| 法库县| 浦城县| 新昌县| 太和县| 颍上县| 五华县| 朝阳区| 乐平市| 汾西县| 清苑县| 合江县| 左云县| 修文县| 嫩江县| 巴南区| 慈利县| 西吉县| 清涧县| 宽甸| 那坡县| 湖南省| 舞阳县| 育儿|