【花師小哲】鑒定網(wǎng)絡熱門(?)AI(6)——Prompt
今天講一個大件,也是最近非?;鸬?strong>提示(prompt)工程。讓我們來看看最近的prompt已經(jīng)卷到了什么程度。本文大概總結了十五六篇prompt相關的論文,鏈接就不一一發(fā)出來了(有些也是師兄整理的),大家如果有興趣可以私戳我要。

0.prompt是什么
首先還是再介紹下prompt。
如果大家玩過ChatGPT的話,應該知道你的輸入是會影響輸出質量的。例如如果你單純說“給我寫一封信”是很難達到你想要的效果的,如果你說“請幫我寫一封情書,送給ChatGPT”那么輸出的結果就會更傾向于符合你的預期。對于其他大語言模型(LLM)來說也是一樣。
另一點就是在我們做一些數(shù)學題時,如果題干有提示的話做起來會更輕松一些,如果有答題示例就更好了。
沒錯,提示(prompt)就是這么一種東西,就是為了讓你的輸入能夠更好地獲得預期輸出的一種東西,或者說對于單純輸入的修飾。
寫好prompt能夠使得輸出結果的質量高非常多。所以現(xiàn)在有很多廠家招收提示工程師(一如前幾年招收調(diào)參工程師一樣)。
當然,在學術界,prompt的研究也早就卷起來了,我們就隨便按幾個類別來說一下吧。
(本篇不是什么正經(jīng)綜述,分類都是隨便分的)

1.增強方法
就我個人來說,很多增強方法都屬于prompt。
所謂增強,簡單來說就是補充額外信息。補充的途徑是多種多樣的,最經(jīng)典的就是new bing為代表的檢索-增強。我們知道ChatGPT是端到端的模型,本身不存儲和更新任何知識,所以對于2022年及之后的新信息都不知道,對于一些冷門知識也不知道或知道的不準確。而搜索引擎可以一定程度上彌補這一劣勢。
檢索-增強本身很簡單,搜索到有用的東西,就連同你的輸入一起給大語言模型了。所以我們會看到用new bing都是先檢索的。

其他的增強方法還有借助外部知識庫的增強,還有背誦-增強(例如我們問π的小數(shù)點后第5位是什么,我們就可以先問ChatGPT π是多少,再問它小數(shù)點后第5位是什么)等

2.思維鏈CoT
思維鏈整體也可以看做是一種prompt工程,或者說一種研究的比較多的可以獨立出來的一種特殊prompt。
簡單來說,思維鏈就是一步步地思考。就像我們做數(shù)學題一樣,一步步得出結果。我個人認為,思維鏈能有作用還是和語言模型的預訓練方式有關。
思維鏈也有很多種形式,例如最基本的就是在輸入問題后加一句“Let's think step by step”(這一句也是實驗出來的,加其他的句子整體效果都不如這一句)。其他的還有思維鏈演示等方法。
當然,作為一種明星prompt方法,CoT也卷的厲害。例如多路CoT、自動CoT、子問題CoT等。

3.多路提示工程
我自己做的一種分類,我們發(fā)現(xiàn),很多prompt都是多路的方法。
我們知道,對于同樣的輸入,ChatGPT是可以輸出不同的內(nèi)容的。最基本的想法是,我們讓ChatGPT多輸出一些結果,然后整合結果,效果應該會更好。這種做法也被大量的應用,舉個例子:

這也是最近比較火的MathPrompt。我們知道ChatGPT為代表的大語言模型的數(shù)學基本都比較差,這種方法就是試圖提升數(shù)學能力的提示工程。它不讓大語言模型直接解題了,而是讓它寫代碼或表達式之類的來生成答案。一個基本思想是,如果python代碼和表達式的輸出一致,那么答案就更可能對。就像我們做題的時候可以用兩種方法來做,就可以互相驗證。
對,可以看到,多路的好處就有可以互相驗證、可以得到輸出分布并進行采樣等。

4.多模態(tài)提示工程
既然有了純視覺的提示工程,當然離不開多模態(tài),我們?yōu)槭裁床荒馨岩曈X、聲音等模態(tài)加進去呢?
事實上真的有,這里就簡單列舉兩個吧:
(1)先知:
【花師小哲】當代煉金術(神經(jīng)網(wǎng)絡)前沿(24)——往語言大模型里塞視覺模態(tài)
(2)蘇格拉底:

谷歌的一個多模態(tài)prompt框架,是將其他模態(tài)都轉化為語言模態(tài),或者說以語言模態(tài)為中介來做的。不過這個好像是要人工設計prompt的。
可以看到,現(xiàn)在大部分多模態(tài)都仍然是以語言模型為核心

5.大語言模型自己生成prompt
最后放王炸。沒錯,前不久傳的提示工程師這個崗位剛出現(xiàn)就要消失了,就是因為語言模型已經(jīng)可以自己生成合適的prompt了。
其實并沒有那么驚奇,語言模型早就可以在各處打工了。
以下是一個比較著名的語言模型自己生成prompt的模型:

具體不展開講,但我們會發(fā)現(xiàn),作者在這里讓一個大語言模型以三種身份在工作(或者一個人打了三份工)。其實這種大模型循環(huán)也不是什么新鮮事了。

6.結語
可以看到,關于提示工程現(xiàn)在已經(jīng)卷的很厲害了?,F(xiàn)在很多做機器翻譯的在做的都是積累怎么改進prompt能使得翻譯效果很好的經(jīng)驗了。我們會看到,ChatGPT未來將會被用在各種各樣的地方,例如有些人已經(jīng)把ChatGPT取代知識庫了,有些人已經(jīng)用ChatGPT做教師了,已經(jīng)有人Learning from ChatGPT feedback了。

這種勢頭應該還會持續(xù)很久。不過prompt真的就是通向通用人工智能的答案了嗎?未來AI研究的范式就是如此了嗎?可能還有待于進一步觀察。