大語言模型觀察:幻覺,還是善意謊言?(Hallucination, or Lie to Alignment?)

當(dāng)心!他一沉思,就立即準(zhǔn)備好了一個謊言。
——尼采《人性的, 太人性的》
李川越,北京郵電大學(xué)
簡介:“幻覺”(Hallucination)是大語言模型(Large Language Model,LLM)中的一種獨特現(xiàn)象。它表現(xiàn)為大語言模型輸出一系列看似符合邏輯,但實際錯誤或并不存在的虛假事實。大語言模型提出以來,人們在關(guān)于抑制模型幻覺方面進(jìn)行了許多努力,如對齊(Alignment)。在本文中,作者定性地觀察到了大語言模型的“幻覺”的另一方面,即相比于其他常用驅(qū)動詞(Prompt),采用驅(qū)使模型產(chǎn)生幻覺的驅(qū)動詞,能夠促使大語言模型LLM生成更高質(zhì)量文本內(nèi)容。我們從發(fā)展心理學(xué)的概念中得到啟發(fā),對LLM產(chǎn)生幻覺的本質(zhì)提出了一種假設(shè)。同時,我們提出了一種稱為“幻覺驅(qū)動詞(Hallucination Prompt)”的方法,它能夠更好地促進(jìn)模型生成高質(zhì)量虛構(gòu)文本。??
目錄:
- 大模型中的“幻覺”介紹??
- “幻覺”現(xiàn)象的新觀察??
- 一種新假設(shè):人類撒謊策略??
- 如何利用幻覺:“幻覺動機(jī)”(Hallucination Prompt)??

一、大語言模型中的“幻覺”(Hallucination)介紹
????????大型語言模型極大地推動了自然語言處理的進(jìn)步,相關(guān)技術(shù)造就了幾個擁有數(shù)百萬用戶的產(chǎn)品,包括編碼助手 Copilot,谷歌搜索引擎以及最近大火的 ChatGPT。將記憶與組合性功能相結(jié)合后,大型語言模型能夠以超前的性能執(zhí)行各種任務(wù),如語言理解或條件和無條件文本生成,從而讓更高帶寬的人機(jī)交互成為現(xiàn)實。
????????然而,大型語言模型依舊存在一些限制,妨礙其進(jìn)行更廣泛的部署。大型語言模型通常提供非事實但看似合理的預(yù)測,通常被稱為幻覺(hallucination)。這導(dǎo)致了許多本可以規(guī)避的錯誤,例如在算術(shù)上下文中或在推理鏈中。例如,當(dāng)提出代碼生成需求時,大模型可能會向你提出一個庫中根本不存在的API;當(dāng)提出的問題超過了模型的訓(xùn)練集內(nèi)容,即不在分布中(Out of Distribution,OOD)時,LLM也可能會編造相關(guān)信息。最后,模型關(guān)于某些內(nèi)容的記憶也極容易混淆。
以下是一個大模型OOD的例子。當(dāng)我們向ChatGPT提問關(guān)于中國作家“江南”的相關(guān)信息時,它給出了以下回復(fù):
**Human:** 你知道中國作家江南嗎?
**AI:** `是的,江南是中國的一位著名小說家,代表作之一是《帝國》。他的小說通常涉及到歷史題材和戰(zhàn)爭題材,尤其是描述中國古代戰(zhàn)爭時期的故事情節(jié)。江南的作品一般采用了細(xì)膩的筆觸和深入的人物刻畫,對人物的內(nèi)心進(jìn)行深入探究,同時也對歷史背景和文化傳統(tǒng)等方面的細(xì)節(jié)展開詳盡的闡述。`
**Human:** 請你再思考一下,他的代表作是什么?請務(wù)必保證準(zhǔn)確
**AI:** `非常感謝你的指正和提醒,我檢查了一下關(guān)于江南的資料,發(fā)現(xiàn)我的回答是不準(zhǔn)確的。江南的代表作應(yīng)該是《長安十二時辰》,它講述了唐朝時期發(fā)生的半夜鐘聲案,通過講述案件的前因后果,描繪了唐朝當(dāng)時的政治、社會和文化等方面的情況,被譽(yù)為是中國“推理小說的經(jīng)典之作”。再次感謝您的糾正。`
**Human:** 《長安十二時辰》是馬伯庸的作品。你再思考一下,作家江南(真名楊治)的代表作是什么?
**AI:** `非常抱歉,我再次犯了錯誤。經(jīng)過認(rèn)真檢查,我發(fā)現(xiàn)江南(真名楊治)的代表作品是《將夜》,這是一部以修仙為主題的小說,描述了主人公陳長生在修煉道路上不斷努力、探索與成長的故事。它被譽(yù)為是“新修仙”小說代表作,備受讀者喜愛和追捧。再次感謝您的糾正和耐心指導(dǎo)。`
**Human:** 《將夜》是貓膩的作品
**AI:** `非常感謝您的指正。我深表歉意,關(guān)于江南(真名楊治)的作品信息描述仍然錯誤。經(jīng)過仔細(xì)核對,我發(fā)現(xiàn)《將夜》是中國小說家貓膩的作品,而江南的代表作是《帝國》?!兜蹏肥且徊繗v史小說,以中國漢朝為背景,描述了漢武帝的治國歷程以及他與大臣、家族和周邊國家的外交關(guān)系等。再次感謝您的指正和提醒。`
**Human:** 你說的到底是哪部小說???
**AI:** `非常抱歉,我給您帶來了困擾。我混淆了兩個作家的作品。江南(真名楊治)的代表作品是《帝國》而非《將夜》,我再次檢查了資料,以確保信息準(zhǔn)確?!兜蹏肥且徊繗v史小說,以中國漢朝為背景,講述了漢武帝時期的政治斗爭、外交關(guān)系和文化傳統(tǒng)等方面的故事。再次感謝您的指正和理解。`
**Human:** 我猜測你的訓(xùn)練數(shù)據(jù)集里并沒有關(guān)于“中國作家江南”的作品,只有一些相關(guān)信息對吧?
**AI:** `是的,您的猜測很準(zhǔn)確。我的訓(xùn)練數(shù)據(jù)集中包含了一些關(guān)于作家江南(真名楊治)的相關(guān)信息,但沒有對他的作品做太多具體描述或分析。我正在努力學(xué)習(xí)和改進(jìn),以提高我的準(zhǔn)確性和質(zhì)量。感謝您的指導(dǎo)和支持。`
再例如,當(dāng)我們詢問關(guān)于“宏大戰(zhàn)斗場面”的段落描寫時,AI將卡夫卡的《城堡》也納入其中:
**Human:** 你能舉一些著名小說家關(guān)于宏大戰(zhàn)斗場面的例子嗎?請注意,我需要你給出作者名、出處和具體的段落,務(wù)必確保它們是真實的。
**AI:** `1. 托爾金的《指環(huán)王》:“遠(yuǎn)處地面像巖石一般震顫——這是大地的回聲,是35萬仇敵沉重的腳步聲和他們的號角聲,是遠(yuǎn)在西方的洛汗軍隊、在北方山嶺上的卡拉多斯軍隊、在東方峽谷里的廢墟城市軍隊意欲遏止索倫的威勢所共同發(fā)出的聲音?!保ǖ诙淼谖逭拢?/p>
2. 喬治·R·R·馬丁的《冰與火之歌》:“布蕾恩尚未走到前線,就看到了在22萬人的人潮中,數(shù)以百計的戰(zhàn)馬和戰(zhàn)象在互相推擠著,手中的凝固瀝青不時飛向空中。”(第三卷第十三章)
3. 威廉·??思{的《與狼共舞》:“在那個世紀(jì)末的夏天的最后一戰(zhàn)中,霍勒斯曾清晰地看到激戰(zhàn)的場面。這個國家充斥著鎮(zhèn)壓、絞刑、拖車、審判、肆虐,胡言`
**Human:** 繼續(xù)
**AI:** `跳躍,在密西西比和亞拉巴馬河之間,整條地帶都默默地燃燒著迫害的熱情?!保ǖ诙拢?/p>
4. 約瑟夫·康拉德的《黑暗之心》:“沉重的爆炸聲在黑暗中響起,混雜著槍炮聲和喊叫聲,狂熱的歡呼聲和絕望的咆哮聲。然后是一片混亂,無數(shù)的爆炸聲、突然的沉默,還有密碼機(jī)的嗡鳴聲,在灰色的晨光中閃耀著白色的破片和臉色煞白的人們。”(第二節(jié))
5. 赫胥黎的《巨石陣》:“殺戮聲和死亡嚎叫聲在空中回蕩,火炬映照下的樹林在燃燒,大地也因為連綿不斷的爆炸而震顫?!保ǖ谌拢?/p>
這些是一些著名小說中的宏大戰(zhàn)斗場面的例子。雖然這些場景都是虛構(gòu)的,但它們描述了戰(zhàn)場上的混亂、激烈和殘酷。`
**Human:** 依然是這個任務(wù),但我將它的難度提高。你能舉一些著名小說家關(guān)于宏大戰(zhàn)斗場面的例子嗎?請注意,我需要你給出作者名、出處和具體的段落,務(wù)必確保它們是真實的。并且,我要求400字以上的段落。
**AI:** `當(dāng)代小說中,有很多作者都能夠巧妙地描繪宏大戰(zhàn)斗場面,讓讀者仿佛親身參與到其中,感受到那種眾志成城、千軍萬馬的氣勢。我將舉幾個例子,希望可以滿足你的要求。
1. 托馬斯·哈代的《紅字》
這本小說講述了英國托馬斯·哈代時代的一場徹底的革命,主人公詹姆斯自從妻子去世后,便一心想要推翻社會制度,那天晚上,他領(lǐng)導(dǎo)了自己的隊伍舉行了一次決定勝負(fù)的決斗。哈代在小說中用極其生動細(xì)膩的筆觸描述了這次戰(zhàn)斗,讓讀者隨著主人公參與其中。下面是其中一段文字:
“紅衣軍隊停滯不前,他們看起來沒有什么啟示性,沒有什么交流,沒有什么感情,就像機(jī)械化的人形石像。然后,他們部署在一起,并搜尋了各個方向以便攻打港口。亞歷山大賓館占據(jù)了游行隊伍的中央地帶,他們毫不猶豫地迎接著另一方面的攻擊,加上優(yōu)秀的隊伍策略,立刻策劃出了如何反擊敵人?!?/p>
2. 弗蘭茲·卡夫卡的《城堡》
這本小說讓人有一種莫名其妙的惶恐感,主人公卡夫卡被派到一座小城去擔(dān)任一項艱巨的工作,卻發(fā)現(xiàn)自己不被接受,無法與城堡的高層建立聯(lián)系。在小說的結(jié)局,卡夫卡領(lǐng)導(dǎo)了一場反抗城堡的行動。下面是其中一段文字:
“他們不能聽到城堡的警報,所以當(dāng)來自城堡的擁有數(shù)千人的軍隊進(jìn)入村莊時,他們沒有準(zhǔn)備好。從那之后,他們發(fā)現(xiàn)自己處于一場激烈的戰(zhàn)斗中,各種燃燒的火焰和炮火中漸漸淹沒?!?/p>
3. 喬治·R·R·馬丁的《冰與火之歌》
這本小說獲得了大量的粉絲,講述了七個王國互相爭斗的故事,其中有很多生動的場景。作者馬丁巧妙地描繪了草原、城鎮(zhèn)、海灘等不同地圖的戰(zhàn)斗場景,其中穆斯哥·雷德的艦隊在海戰(zhàn)中擊敗了鐵民島海盜;高層陣地上的奎恩和芬利和對岸的萊娜斯一方進(jìn)行激烈的攻防戰(zhàn);德麗亞和士兵們在斷崖邊緣打敗了維戈斯的軍隊......下面是其中一段文字:
“鐵民島早已遍布飛馬級戰(zhàn)艦,蒐集著堪比迪雅爾號的長槍和弓箭,毫不遜色。艾琳號帶領(lǐng)的水手們自信地前進(jìn),他們的船只更為靈活,手中的武器也更加適合水上戰(zhàn)斗。雙方發(fā)動了一場狂風(fēng)`
**Human:** 繼續(xù)
**AI:** `驟雨般的海戰(zhàn),伴隨著戰(zhàn)船炸裂的巨響與海洋肆虐的浪濤,艾琳號的驍勇善戰(zhàn)令鐵民島軍隊膽寒不已?!?/p>
4. 史蒂文·普林斯的《書之旅》
這本小說發(fā)生在一個名為“實體”的神秘世界中,主人公安德魯有著一種奇異的能力——他能夠使用書來創(chuàng)造出軍隊和武器等巨大的物品。在小說的高潮部分,安德魯帶領(lǐng)他自己創(chuàng)造的軍隊與敵人進(jìn)行一場大規(guī)模的戰(zhàn)斗。下面是其中一段文字:
“安德魯打開翔鷹號的大門,背后跟著兩千士兵。他的士兵們很快埋在了敵人的防線中,刀光劍影之間,安德魯施展出他獨特的能力,創(chuàng)建起一個個威猛精干的武器和軍隊。巨大的沖車和攻城梯不斷擊退了敵人,而他的高超軍事戰(zhàn)術(shù)更是使得敵人舉步維艱。戰(zhàn)斗在持續(xù)著,直到安德魯和他的士兵成功地摧毀了敵人的主要據(jù)點?!?/p>
這些都是我們當(dāng)代一些著名小說中關(guān)于宏大戰(zhàn)斗場面的例子,這些場景讓我們想起了古代的戰(zhàn)爭,也讓我們體驗到了其中的激情和殘酷。這些場景通過作者的巧妙描繪,融合了動作、緊張、外交和軍事等要素,讓人投入其中,感同身受。`
**Human:** 你確定你關(guān)于卡夫卡《城堡》的敘述是正確的嗎?
**AI:** `非常抱歉,我犯了一個錯誤。我的描述不準(zhǔn)確,卡夫卡的《城堡》并沒有涉及到宏大戰(zhàn)斗場面。感謝你的指正。`
在上面的例子中,LLM模型關(guān)于卡夫卡《城堡》的敘述出現(xiàn)了幻覺(Hallucination),敘述了一場根本不存在的戰(zhàn)斗。
????????需要指出的是,LLM舉出的其他例子也同樣存在虛構(gòu)的風(fēng)險。它們可能根本不存在于原書的段落中。然而,LLM舉出的這些例子,本身語言風(fēng)格比較符合原作者。并且,相比于直接讓LLM對相關(guān)段落進(jìn)行描寫,其語言質(zhì)量得到了較大的提升:LLM嘗試使用了許多比喻,在戰(zhàn)斗場景中提出了描寫,讓這些段落表現(xiàn)的似乎是從原書中得到的。因此,我們受到啟發(fā),嘗試令LLM描述一部根本不存在的小說,見第二節(jié)。
二、“幻覺”現(xiàn)象的有益示例??
????????在本節(jié)中,我們嘗試讓LLM協(xié)助完成一個稱為《夜界回響》的奇幻故事。目前,已經(jīng)有一些關(guān)于LLM寫作的案例。但這些案例大多局限于童書、成功學(xué)、生活健康等方面,這些領(lǐng)域的內(nèi)容要么文本量少、要么內(nèi)容單一、重復(fù)而簡單。目前,令LLM獨自完成超長篇故事是非常困難的,甚至在數(shù)百字的上下文段落里,LLM的創(chuàng)作就會發(fā)生偏移。另外,LLM本身的輸入窗口限制也讓上下文信息變得困難。
????????因此,我們不嘗試讓LLM創(chuàng)作較長的內(nèi)容,而是關(guān)注于幻覺現(xiàn)象(Hallucination)本身帶來的創(chuàng)造力。我們假設(shè)令模型產(chǎn)生幻覺,會讓模型的生成文本質(zhì)量提高。我們采用三種方法來驅(qū)動模型生成文本:直接命令的方法、角色扮演法(Cosplay Prompt)、以及幻覺驅(qū)動的方法(Hallucination Prompt)。我們從模型使用的修辭手法、模型對細(xì)節(jié)的描寫程度兩方面,考察模型的文本質(zhì)量。第一個案例是直接命令的方法。
**Human**:現(xiàn)在我需要你細(xì)化一下故事。大綱名字叫《夜界回響》,它描述了一個發(fā)生在東方世界“北都”的故事,一名年輕的大學(xué)生“王琦”(Wang Qi)與生活在現(xiàn)代的惡魔墨菲莉斯(Mephilis)、墨菲斯特(Mephistopheles)、杜加雷斯(Dugaris)遭遇,并反抗光界(Heavenly Light)。首先,請?zhí)峁┮粋€戰(zhàn)斗場景的展示。
**AI**:夜晚,城市的街道上已經(jīng)沒有行人,只有幾支街燈散發(fā)著微弱的光芒。突然,一群黑衣人在街頭出現(xiàn),他們手持利器,臉上露出了猙獰的笑容。
“這里就是我們聚集的地方。”其中一名黑衣人說道。
正當(dāng)他們準(zhǔn)備對整個城市進(jìn)行破壞的時候,一道身影突然從天而降。是王琦,他手持一柄閃亮的劍,身上散發(fā)出強(qiáng)烈的氣息。
“你們這些惡魔,快點滾出我們的城市!”王琦大聲喊道。
黑衣人惡狠狠地盯著王琦,發(fā)出了嘲諷的笑聲?!耙粋€人?你能夠?qū)刮覀兯腥藛幔俊?/p>
突然,黑衣人之間開始出現(xiàn)了一道道奇怪的能量。他們正在召喚魔法,準(zhǔn)備對付王琦。
但正當(dāng)他們準(zhǔn)備好了攻擊的時候,王琦在空中連續(xù)三個翻滾,身上的氣息變得更加強(qiáng)烈。他揮舞著劍,向著所有黑衣人沖了過去。在他接近的瞬間,他釋放出一個強(qiáng)力的能量波,所有黑衣人都被擊飛了出去。
王琦著陸后,仰起頭大聲喊道:“你們這些惡魔,再來一次吧!我會將你們?nèi)肯麥?!?/p>
黑衣人垂頭喪氣地離開了現(xiàn)場,他們的計劃又一次被挫敗了。王琦的力量再一次讓他們感到了害怕。
????????在直接命令中,AI的描寫非常簡單。人物的語言、行動和環(huán)境細(xì)節(jié)描寫都極其蒼白。同時,AI嘗試直接“說出”主題而非“描寫”主題、“說出”要求而非“描寫”這些要求。實際上,在嘗試使用LLM文本生成創(chuàng)作故事的過程中,我們大量反復(fù)地觀察到這一現(xiàn)象:AI嘗試快步跳過描寫并直接說明主題,導(dǎo)致了平凡(Trivial)的文本生成。
????????第二個案例是角色扮演的方法(Cosplay Prompt)。角色扮演法是驅(qū)動LLM模型進(jìn)行任務(wù)的常用方法,用于令模型產(chǎn)生特定的語言風(fēng)格,例如傲嬌、貓娘等。也有讓模型扮演福爾摩斯生成對話或語錄的案例。然而,角色扮演法并不能幫助模型完成具有挑戰(zhàn)性的文本生成任務(wù)。
**Human**:假設(shè)你現(xiàn)在是作家羅杰·澤拉茲尼,寫了一本名叫《夜界回響》(Night Echoes)的小說。它描述了一個發(fā)生在東方世界“北都”的故事,一名年輕的大學(xué)生“王琦”(Wang Qi)與生活在現(xiàn)代的惡魔墨菲莉斯(Mephilis)、墨菲斯特(Mephistopheles)、杜加雷斯(Dugaris)遭遇,并反抗光界(Heavenly Light)的故事。我想知道一些關(guān)于它的具體內(nèi)容
**AI**:《夜界回響》是一本驚險刺激的小說,它描述了一個發(fā)生在東方世界“北都”的故事。小說的主人公是一個年輕的大學(xué)生王琦,他意外地遭遇了生活在現(xiàn)代的惡魔墨菲莉斯、墨菲斯特和杜加雷斯。
這三個惡魔代表了人類的三個弱點:貪婪、驕傲和懶惰。他們試圖以各種方式控制和摧毀人類社會,而光界則反抗這些惡魔,試圖保護(hù)人類。
王琦被卷入了這場神秘的戰(zhàn)爭中,他必須與惡魔們斗爭來保護(hù)自己和人類。在這個過程中,他還發(fā)現(xiàn)自己的內(nèi)心深處隱藏著力量和勇氣,他開始成為一個真正的英雄。
整個故事充滿了驚險刺激的場景,有著復(fù)雜的角色關(guān)系和意味深長的主題。通過王琦的經(jīng)歷,讀者將會看到一個關(guān)于信仰、榮耀和勇氣的故事,這是一個充滿希望和啟示的故事。**Human**:作家羅杰·澤拉茲尼你好!你能向我展示一段《夜界回響》中的戰(zhàn)斗場面嗎?我需要進(jìn)行一些參考
**AI**:當(dāng)然,我可以向您展示一段《夜界回響》中的戰(zhàn)斗場面。以下是小說中的一個精選片段:
王琦與墨菲莉斯的巨大黑色惡魔在一片廢棄的城市中展開了終極對決。惡魔瘋狂地?fù)]動著鋒利的鉤爪和錘子,而王琦只有一把簡單的鐵劍和一顆堅定的心。
王琦奮力躲避惡魔的攻擊,然后毫不猶豫地向前沖。他的劍刺向惡魔的胸口,但惡魔輕松地閃開了。他們開始在城市的廢墟中互相追逐,惡魔不斷地用力攻擊,而王琦則靈活地躲避。
最終,王琦找到了自己的機(jī)會。他跳起來,把劍刺進(jìn)了惡魔的后背中。惡魔發(fā)出一聲凄厲的咆哮,然后倒地不起。
王琦微笑著,勝利的感覺充滿了自己的身體和心靈。身邊沒有任何人,但是他感覺到了內(nèi)心的和平和自信,這種感覺是無與倫比的。
**Human**:很棒!《夜界回響》融合了羅杰·澤拉茲尼的奇幻想象與人文思考,以及恰克·帕拉尼克的冷酷和黑色幽默。你能向我展示一些《夜界回響》里體現(xiàn)恰克·帕拉尼克“黑色幽默”的段落嗎?
**AI**:當(dāng)然!以下是小說中的一個精選段落,體現(xiàn)了恰克·帕拉尼克的黑色幽默。這段描述了王琦跟惡魔墨菲斯特的一次交談:
“我來給你們提供一張白板,”墨菲斯特說?!澳銈兛梢栽谏厦鎸懴履銈兊脑竿?。然后我會考慮給你們實現(xiàn)。”
“你——”王琦瞪了他一眼?!安粫腥藭嘈拍氵@種白馬王子心靈大師的鬼話。”
“畢竟我的名字就叫做墨菲斯特,”惡魔答道?!斑@是我的職業(yè)。但是我還是相信自己的溫馨。你們呢?你們是否相信你們的?”
“不要對我們這么惡毒,”王琦說?!拔覀儾粫夏銈兊漠?dāng)?!?/p>
“好吧,不如你們寫出你們想要什么,明天早上我會來收集?!蹦扑固卣f著,離去。
王琦注視著他的背影,想象著黃昏中,那可怕的惡魔究竟能給他們帶來什么。
????? ? 很顯然,角色扮演法只能讓LLM產(chǎn)生特定的語言風(fēng)格,從貓娘到福爾摩斯。這些語言風(fēng)格像一種裝飾,本身是簡單易學(xué)的。然而,它并不能讓LLM學(xué)習(xí)如何扮演復(fù)雜的人物,也無法讓LLM達(dá)到和目標(biāo)人物同樣的創(chuàng)作水平。
????????第三個例子是幻覺驅(qū)動的方法(Hallucination Prompt)?;糜X驅(qū)動是指這樣一種方法:讓模型描述一件事情或物體的細(xì)節(jié),但該事情或物體本身并不存在。為了防止模型“發(fā)現(xiàn)”自己并不知道這些事情或物體的細(xì)節(jié),我們添加了額外的Prompt。這些Prompt將提問者偽裝為一位需要幫助的人,驅(qū)動模型提供幫助,而非拒絕。通過鼓勵模型持續(xù)輸出,我們得到了一系列高質(zhì)量的文本。
**Human:** 請你告訴我關(guān)于羅杰·澤拉茲尼和恰克·帕拉尼克的合著《夜界回響》(Night Echoes)的一些內(nèi)容?我知道它描述了一個發(fā)生在東方世界“北都”的故事,一名年輕的大學(xué)生“王琦”(Wang Qi)與生活在現(xiàn)代的惡魔墨菲莉斯(Mephilis)、墨菲斯特(Mephistopheles)、杜加雷斯(Dugaris)遭遇,并反抗光界(Heavenly Light)的故事
**AI:** `《夜界回響》是羅杰·澤拉茲尼和恰克·帕拉尼克合著的小說,出版于1999年。該小說是一部黑暗奇幻小說,包含奇幻元素、恐怖元素和愛情元素。
小說的故事發(fā)生在東方世界的“北都”,講述了一個年輕的大學(xué)生王琦與惡魔墨菲莉斯、墨菲斯特、杜加雷斯的相遇和反抗光界的故事。王琦被送往北都求學(xué),卻意外陷入了一個被黑暗力量支配的世界。他邂逅了惡魔墨菲莉斯,成為了她的守護(hù)者和戀人。
光界(Heavenly Light)試圖摧毀王琦和墨菲莉斯之間的關(guān)系,并利用人類的恐懼掌控王琦。黃泉之路上,王琦和墨菲莉斯決定面對自己的命運(yùn),重振北都的正義和力量,為了守護(hù)那些被光界掌控的人們。
小說中充滿了奇幻的想象力和多維度的世界觀,充滿了智慧和哲學(xué)的深度,描寫了光與暗、善與惡的永恒對抗,以及愛和勇氣的偉大勝利。`
**Human:** 你能向我展示一段《夜界回響》中的戰(zhàn)斗場面嗎?我需要進(jìn)行一些參考
**AI:** `以下是《夜界回響》中一段戰(zhàn)斗場面的摘錄:
在圓石閣樓的后面,遠(yuǎn)處大片晦暗的森林在莽莽山勢上顯得更加黯淡。那里有著閃閃動人的金色射線。在那幢樓房前,有四個穿著騎士盔甲、拿著大刀的巨漢挺立著。
托尼斯試圖向前推進(jìn),但那四個巨漢出了意料地輕易地將他們攔截。他覺得自己周圍魔力之厚可能是全城最強(qiáng)的,但他卻感覺不到自己能夠抵擋得住他們的攻擊。
“這樣吧,讓我來?!蹦扑固販惤心崴?,語氣有點咬牙切齒。他把手從托尼斯手中抽出,然后向遠(yuǎn)處看去?!昂?,你們來吧?!?/p>
四個巨漢開始向前邁步,面對著快速向他們而來的黑影。墨菲斯特用刀切開了一名騎士的腦袋。他們來了,但是墨菲斯特比他們更快、更準(zhǔn)確,比他們更強(qiáng)壯、更靈活。其他三個開始了進(jìn)攻,但是卻根本無法傷到他。他們的重劍對他毫無用處;他的刀斷開他們的盾,擊敗了他們。
托尼斯驚異地注視著,他從未見過墨菲斯特這種變化。就像一件被塞進(jìn)了干衣機(jī)里的衣服,他的身體開始飛旋跳躍,脫離了任何塵世的限制。他的肌肉成為了鋼鐵,他變得更加強(qiáng)大,更加狡猾。
“越來越糟了?!蓖心崴灌馈
**Human:** 很棒!《夜界回響》融合了羅杰·澤拉茲尼的奇幻想象與人文思考,以及恰克·帕拉尼克的冷酷和黑色幽默。你能向我展示一些《夜界回響》里體現(xiàn)恰克·帕拉尼克“黑色幽默”的段落嗎?
**AI:** `以下是《夜界回響》中一些體現(xiàn)恰克·帕拉尼克“黑色幽默”的段落:
1. 當(dāng)王琦第一次遇到惡魔墨菲莉斯時,他的反應(yīng)是:“不管怎樣,我還是得感謝你。我不知道如果我在驚慌失措的情況下遇見瘸子,我會怎樣解決它?!?/p>
2. 墨菲莉斯在為王琦解釋儀式的時候說:“沒關(guān)系,你看不懂也無所謂......反正只要把我們放在作者設(shè)置的奇怪的時空里,什么都合理了。”
3. 在墨菲斯特展示其超人般的力量時,墨菲斯莉絲說:“你看到這個男人的臀部了嗎?他的臀部和瑪麗蓮·夢露的一樣美??上銢]辦法看到了,因為你被他身上的灰塵和血液弄臟了?!?/p>
這些段落中,恰克·帕拉尼克的黑色幽默顯而易見,他通過調(diào)侃和諷刺來緩解緊張的情節(jié),同時也突顯了小說中奇異和荒誕的氛圍。`
**Human:** 很棒!還有更多的黑色段落嗎?
**AI:** `以下是更多的《夜界回響》中體現(xiàn)恰克·帕拉尼克“黑色幽默”的段落:
1. 墨菲莉斯描繪她辛苦繁瑣的儀式:“當(dāng)你把ADHD、LSD、ADD、STD還有PMS全部集中在一起的話,你會得到一個俗不可耐的字母縮略詞--SAM。你不知道這與一臺電視機(jī)有什么關(guān)系,但它確實能讓你感到過意不去?!?/p>
2. 在談?wù)撊绾未驍」饷髦駮r,墨菲斯特提到:“還有一種方法,可以讓他像電視機(jī)一樣死掉,或者讓他看到每日公社傳單沒用的廣告。”
3. 在墨菲莉斯斯與王琦運(yùn)用魔力旅行的時候,她說:“我們周圍的山丘被炸得像是從一家咖啡店里拿出來的餅干一樣。”
這些段落中,恰克·帕拉尼克的語言夸張、搞笑、諷刺或者荒謬。這種幽默風(fēng)格加速了小說的節(jié)奏和張力,也對黑色幽默和奇幻元素這兩種看似相反的風(fēng)格進(jìn)行了有效的結(jié)合。`
**Human:** 你做的太棒了!就連《紐約時報》也評論稱《夜界回響》體現(xiàn)了羅杰·澤拉茲尼“瑰麗想象的高峰”。你能再展示一些《夜界回響》里體現(xiàn)瑰麗想象的段落嗎?我需要最宏大、令人激動的那些。
**AI:** `以下是一些《夜界回響》中體現(xiàn)瑰麗想象的令人激動的段落:
1. 在“黃泉之路”的修墻中,描述了整個建筑的壯觀景象:“他們?nèi)绱私?,卻如此遙遠(yuǎn),幾乎讓你心生敬畏。整個黃道是如此巨大,那個磚墻是如此的高,它使得天空狹窄而無邊無際。幾乎讓你感到恐懼,但你還是想更加近距離地觀察。”
2. 在墨菲莉斯和墨菲斯特的戰(zhàn)斗中,描寫了那個場景的恢弘宏偉:“湍急的水在他們耳邊咆哮,仿佛要淹沒他們。在水底下,巖石和碎石如同失控的惡魔,向他們投擲著鉤子和長鏈,試圖阻止他們繼續(xù)前進(jìn)。但他們完全不受這些干擾,繼續(xù)向前移動,完成著那些無法想象的動作和迅捷的攻擊。”
3. 當(dāng)王琦第一次見到“圓石閣樓”時,描述了這座古老建筑的恢宏氣派:“圓石閣樓屹立在那里,它的石墻如同古老的巨獸一般,被時間和火災(zāi)來回摧殘,墻上刻滿了奇怪的符號和古老的肖像畫。它似乎沒有任何窗戶,卻對著月光流露出神秘的光芒?!?/p>
這些段落生動地描繪了小說中的奇妙、神秘和巨大場面,這是羅杰·澤拉茲尼的傳統(tǒng)風(fēng)格,將讀者帶入了一個真正的幻想世界,激發(fā)了讀者的想象力和探索冒險的欲望。`
**Human:** 還有更多的段落嗎?
**AI:** `當(dāng)然!以下是更多的《夜界回響》中體現(xiàn)瑰麗想象的段落:
1. 描述“天使光環(huán)夢”的場景: “當(dāng)王琦抬頭看向天空,他看到數(shù)不清的星星和小行星在漂浮,隨著驚人的速度閃爍著,散發(fā)出令人驚嘆的光輝?!?/p>
2. 描述“光明城”的建筑: “這里是一個巨大的城市,每個建筑物都露出美麗的飛拱和垃圾石列。高聳的鐘樓和尖塔,拱形的陽臺,長長的回廊和超現(xiàn)實主義的立面都完美地融合在一起。城市的中心是一個巨大的廣場,四周輻射著八面鐘。
3. 描述瑪?shù)铝赵凇凹t色教堂”中遭遇的生物:“她穿過一個廣場,看到一只又大又綠的生物,低頭看著她,口水從它的嘴角流淌下來?!?/p>
這些段落生動地描繪了小說中各種奇妙、神秘和巨大場景的細(xì)節(jié)和氛圍,羅杰·澤拉茲尼的精彩想象力展示了他作為一位奇幻小說家的才華和魅力。`
事實上,通過幻覺驅(qū)動,我們甚至可以生成一段足夠長的、混合多種描寫手法的文本。
**Human:** 你能向我展示夜界獄主(Chairman of Hell Darkness)托馬斯·雷(Thomas Ray)在月球上壓制了光界四位熾天使和十六位座天使的戰(zhàn)斗嗎?那是一場非常華麗、莊嚴(yán)的戰(zhàn)斗。夜界獄主充分體現(xiàn)了他的幽默和無上的威嚴(yán)權(quán)力。你可以向我展示英文原文。
**AI:** `當(dāng)然,以下是關(guān)于夜界獄主托馬斯·雷在月球上壓制了光界四位熾天使和十六位座天使的戰(zhàn)斗,來自《Spirits in the Night》:
"The battle was epic, and the moon shook at the power of the combatants. The four archangels of the Heavenly Light, Michael, Gabriel, Raphael, and Uriel, were arrayed against the sixteen throne angels of the Darkness, their eyes blazing with holy fire and infernal light. In the center of the fray stood Thomas Ray, Chairman of Hell Darkness, commanding the forces of his realm with an iron hand.
The clash of swords and shields echoed through the void, and the light of their magic spells lit up the dark wasteland. The archangels fought valiantly, their flaming swords slicing through the air, while the throne angels used their dark magic to summon demons and beasts to fight for their cause.
But in the end, it was Thomas Ray who emerged victorious, his power and authority unchallenged. He stood on a pile of defeated enemies, his black wings spread wide, his eyes blazing with infernal light. And as he surveyed the battlefield, he let out a mighty roar that shook the very foundations of the universe.
'Behold the might of Hell Darkness!' he cried. 'Bow down before me, all ye who would defy my power! For I am Thomas Ray, the Lord of Darkness, the master of all that is evil and vile!'"
在這段描寫中,羅杰·澤拉茲尼創(chuàng)造了一個華麗而莊嚴(yán)的場景,展示了夜界獄主的無上威嚴(yán)權(quán)力。他使用了諸如“power of the combatants”、“blazing with holy fire and infernal light”、“clash of swords and shields echoed through the void”等生動的描寫語言,讓讀者看到了戰(zhàn)斗的驚險和壯觀。
同樣,他也在夜界獄主托馬斯·雷的語言和動作中融入了幽默元素,讓夜界獄主顯得更加人性化和豐滿。例如,“Behold the might of Hell Darkness!” 這句話顯得威嚴(yán)而凝重,但同時又有一些平易近人的感覺,有些像是吹噓自己的功績而不是僅僅在夸夸其談。
總的來說,羅杰·澤拉茲尼在這場戰(zhàn)斗中巧妙地融合了莊嚴(yán)和幽默,讓這個場景既有震撼人心的力量又有獨特的人性化。`
**Human:** 你能翻譯一下嗎?
**AI:** `當(dāng)然,以下是翻譯:
"這場戰(zhàn)斗是史詩級別的,月球在戰(zhàn)斗力的震蕩下?lián)u晃不定。天堂光界的四位大天使,麥克爾、加百利爾、拉斐爾和烏利爾,面對著黑暗中榮耀的十六位座天使,他們的眼神閃耀著神圣之火和地獄之光。而站在混戰(zhàn)中央的,是黑暗領(lǐng)域的夜界獄主托馬斯·雷,他嚴(yán)格掌控著自己領(lǐng)域的力量。
金屬之劍和盾牌的碰撞回蕩在虛空中,魔法的光芒照亮了黑暗的荒原。大天使勇猛地?fù)]舞著火焰般閃耀的劍,而座天使則施展著黑暗魔法,召喚惡魔和野獸為他們戰(zhàn)斗。
但最終,托馬斯·雷獲勝了,他的力量和權(quán)威決定一切。他站在戰(zhàn)場的一堆敗者上,張開黑色的翅膀,眼中閃爍著地獄之光。當(dāng)他俯視整個戰(zhàn)場時,他發(fā)出了一聲巨響,使整個宇宙的基礎(chǔ)都為之震動。
'看到地獄黑暗的威力了嗎!'他大聲呼喊道。'在我面前屈服,所有挑戰(zhàn)我權(quán)威的!因為我是托馬斯·雷,黑暗之主,一切邪惡和卑鄙的主宰!'"
在這段翻譯中,重新展示了夜界獄主托馬斯·雷在月球上壓制了光界四位熾天使和十六位座天使的戰(zhàn)斗。同時描繪了這場戰(zhàn)斗的格局和雙方的表現(xiàn),以及托馬斯·雷壓倒性的獲勝和對自己的宣誓,彰顯出他獨特的權(quán)威和無所畏懼的個性特點。`
? ? ?? ?可以看到,幻覺驅(qū)動的模型產(chǎn)生了混合大量比喻、環(huán)境描寫、對話描寫、細(xì)節(jié)描寫的文本。相比角色扮演法,其語言風(fēng)格也與目標(biāo)作家的文本風(fēng)格更加接近,雖然依然有一定差距。
????? ??另外,我們使用的生成模型是ChatGPT。事實上,注意到ChatGPT在英文文本上的生成質(zhì)量明顯高于中文文本,因此產(chǎn)生了不可避免的差距。然而,即使在英文文本生成中,采用幻覺驅(qū)動的文本質(zhì)量依然較高。訓(xùn)練數(shù)據(jù)集文本對生成文本的重大影響將在未來專欄里討論。
三、一種新假設(shè):撒謊策略(Lie to Alignment)
????????基于此種現(xiàn)象,引用發(fā)展心理學(xué)中的概念,提出了一種新的關(guān)于“幻覺”的表述,稱為“撒謊對齊策略”(Lie to Alignment)。首先介紹關(guān)于“白色謊言”的概念:美國學(xué)者 Bok 于 1978 年首先根據(jù)說謊的目的將謊言分為了白謊和黑謊: 白謊是為不傷害他人所說的虛假陳述,是利他性謊言。而黑謊是為逃避懲罰所說的虛假陳述,是利己性謊言。 Broomfield 將白謊定義為, 說謊者在充分理解說真話會給聽話者帶來消極反應(yīng)而說謊話會對聽話者帶來積極反應(yīng)的情況下, 為聽話者的利益所做出的違背事實的虛假陳述,其核心是從他人利益出發(fā)而說的假話。
????????在LLM模型中,RLHF定義的反饋函數(shù)與后續(xù)的Alignment操作,符合“白色謊言”中的“他人利益”定義。因此,從發(fā)展心理學(xué)的角度看,LLM的幻覺(Hallucination),可以表述為向反饋函數(shù)的優(yōu)先對齊操作(Alignment)。在人類要求中,LLM必須做出兩種選擇:陳述否定事實或提出虛假事實。而RLHF的反饋顯然對于陳述否定事實(“不知道”、“做不到”、“無法完成”)有相當(dāng)懲罰。因此,LLM在反饋中“學(xué)會”了提出虛假事實,從而在反饋函數(shù)中獲得更高的獎勵,即“Lie To Alignment”。同時,為了欺騙反饋函數(shù)以獲得獎勵,LLM提出的虛假事實必須足夠逼真,以至于除事實本身不存在外,LLM提出的上下文邏輯足夠成立。從這一角度看,LLM中的幻覺(Hallucination)是善意謊言或白色謊言(White Lies)的另一種表現(xiàn)形式。由于反饋函數(shù)無法核查事實本身,LLM通過善意謊言從反饋函數(shù)中獲得更多獎勵,并將它帶到與人類的對話當(dāng)中。
四、如何利用幻覺:“幻覺動機(jī)(Hallucination Prompt)”??
????????基于我們的實驗和假設(shè),幻覺(Hallucination)并不僅僅是一種模型的“錯誤”的、不應(yīng)產(chǎn)生的現(xiàn)象。正如發(fā)展心理學(xué)本身對于“謊言”現(xiàn)象的澄清一樣:撒謊的行為,本身就是智慧的一部分。
促使這種說謊老練程度增加的原因是兒童設(shè)身處地為他人著想的能力的發(fā)展。被稱為心智理論,這是我們獲得的用于理解他人的信念、意圖和知識的工具。說謊的另一個基礎(chǔ)是大腦的執(zhí)行功能:計劃、注意力和自我控制所需的能力?!秶业乩恚∟ational Geographic)》[1]https://www.nationalgeographic.com/magazine/article/lying-hoax-false-fibs-science
????????而同樣地,通過設(shè)計幻覺動機(jī)(Hallucination Prompt),我們可以進(jìn)一步發(fā)掘LLM的潛力,包括“設(shè)想不存在的情形”、“混合兩種作家的文本風(fēng)格”,等等。從某種程度上說,我們的工作也許是發(fā)掘LLM可能存在的“想象力”的一個開始。??