最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

調(diào)用多個(gè)ChatGPT API相互對(duì)話,清華開源的多輪對(duì)話數(shù)據(jù)UltraChat來了

2023-04-22 16:37 作者:いぬやしゃ_Inuyasha  | 我要投稿

機(jī)器之心編輯部

UltraChat 解決了數(shù)據(jù)荒的一大難題。

自 ChatGPT 發(fā)布以來,這段時(shí)間對(duì)話模型的熱度只增不減。當(dāng)我們贊嘆這些模型表現(xiàn)驚艷的同時(shí),也應(yīng)該猜到其背后巨大的算力和海量數(shù)據(jù)的支持。

單就數(shù)據(jù)而言,高質(zhì)量的數(shù)據(jù)至關(guān)重要,為此 OpenAI 對(duì)數(shù)據(jù)和標(biāo)注工作下了很大力氣。有多項(xiàng)研究表明,ChatGPT 是比人類更加可靠的數(shù)據(jù)標(biāo)注者,如果開源社區(qū)可以獲得 ChatGPT 等強(qiáng)大語(yǔ)言模型的大量對(duì)話數(shù)據(jù),就可以訓(xùn)練出性能更好的對(duì)話模型。這一點(diǎn)羊駝系列模型 ——Alpaca、Vicuna、Koala—— 已經(jīng)證明過。例如,Vicuna 使用從 ShareGPT 收集的用戶共享數(shù)據(jù)對(duì) LLaMA 模型進(jìn)行指令微調(diào),就復(fù)刻了 ChatGPT 九成功力。越來越多的證據(jù)表明,數(shù)據(jù)是訓(xùn)練強(qiáng)大語(yǔ)言模型的第一生產(chǎn)力。

ShareGPT 是一個(gè) ChatGPT 數(shù)據(jù)共享網(wǎng)站,用戶會(huì)上傳自己覺得有趣的 ChatGPT 回答。ShareGPT 上的數(shù)據(jù)是開放但瑣碎的,需要研究人員自己收集整理。如果能夠有一個(gè)高質(zhì)量的,覆蓋范圍廣泛的數(shù)據(jù)集,開源社區(qū)在對(duì)話模型研發(fā)方面將會(huì)事半功倍。

基于此,最近一個(gè)名為 UltraChat 的項(xiàng)目就系統(tǒng)構(gòu)建了一個(gè)超高質(zhì)量的對(duì)話數(shù)據(jù)集。項(xiàng)目作者嘗試用兩個(gè)獨(dú)立的 ChatGPT Turbo API 進(jìn)行對(duì)話,從而生成多輪對(duì)話數(shù)據(jù)。


? 由 ZAKER 提供


  • 項(xiàng)目地址:https://github.com/thunlp/UltraChat

  • 數(shù)據(jù)集地址:http://39.101.77.220/

  • 數(shù)據(jù)集交互地址:https://atlas.nomic.ai/map/0ce65783-c3a9-40b5-895d-384933f50081/a7b46301-022f-45d8-bbf4-98107eabdbac

具體而言,該項(xiàng)目旨在構(gòu)建一個(gè)開源、大規(guī)模、多輪的基于 Turbo APIs 的對(duì)話數(shù)據(jù),方便研究者開發(fā)具有通用對(duì)話能力的強(qiáng)大語(yǔ)言模型。此外,考慮到隱私保護(hù)等因素,該項(xiàng)目不會(huì)直接使用互聯(lián)網(wǎng)上的數(shù)據(jù)作為提示。為了確保生成數(shù)據(jù)質(zhì)量,研究者在生成過程中采用了兩個(gè)獨(dú)立的 ChatGPT Turbo API,其中一個(gè)模型扮演用戶角色來生成問題或指令,另一個(gè)模型生成反饋。


? 由 ZAKER 提供


如果直接使用 ChatGPT 基于一些種子對(duì)話和問題讓其自由生成,容易出現(xiàn)話題單一、內(nèi)容重復(fù)等問題,從而難以保證數(shù)據(jù)本身的多樣性。為此,UltraChat 對(duì)對(duì)話數(shù)據(jù)覆蓋的主題和任務(wù)類型進(jìn)行了系統(tǒng)的分類和設(shè)計(jì),還對(duì)用戶模型和回復(fù)模型進(jìn)行了細(xì)致的提示工程,它包含三個(gè)部分:

  • 關(guān)于世界的問題(Questions about the World):這部分對(duì)話來自于對(duì)現(xiàn)實(shí)世界中的概念、實(shí)體和對(duì)象相關(guān)的廣泛詢問。所涉及的主題涵蓋科技、藝術(shù)、金融等多個(gè)領(lǐng)域。

  • 寫作與創(chuàng)作(Writing and Creation):這部分對(duì)話數(shù)據(jù)著重于指示 AI 從頭進(jìn)行創(chuàng)作一個(gè)完整的文本材料,并在此基礎(chǔ)上進(jìn)行后續(xù)的提問或進(jìn)一步指導(dǎo)以完善寫作,撰寫的材料內(nèi)容類型包括文章、博客、詩(shī)歌、故事、戲劇,電子郵件等等。

  • 對(duì)于現(xiàn)有資料的輔助改寫(Writing and Creation):該對(duì)話數(shù)據(jù)是基于現(xiàn)有資料生成的,指令包括但不限于改寫、續(xù)寫、翻譯、歸納、推理等,涵蓋主題同樣非常多樣。

這三部分?jǐn)?shù)據(jù)覆蓋了大部分用戶對(duì)于 AI 模型的要求。同時(shí),這三類數(shù)據(jù)也會(huì)面臨著不同的挑戰(zhàn),為此需要不同的構(gòu)造方法。

例如,第一部分的數(shù)據(jù)主要挑戰(zhàn)在于如何在總量為幾十萬組對(duì)話中盡量廣泛地涵蓋人類社會(huì)中的常見知識(shí),為此研究者從自動(dòng)生成的主題和來源于 Wikidata 的實(shí)體兩個(gè)方面進(jìn)行了篩選和構(gòu)造。

第二、三部分的挑戰(zhàn)主要來自于如何模擬用戶指令,并在后續(xù)對(duì)話中讓用戶模型的生成盡量多樣化的同時(shí)又不偏離對(duì)話的最終目標(biāo)(按照要求生成材料或改寫材料),為此研究者對(duì)用戶模型的輸入提示進(jìn)行了充分的設(shè)計(jì)和實(shí)驗(yàn)。在構(gòu)造完成之后,作者還對(duì)數(shù)據(jù)進(jìn)行了后處理以削弱幻覺問題。

目前,該項(xiàng)目已經(jīng)發(fā)布了前兩部分的數(shù)據(jù),數(shù)據(jù)量為 124 萬條,應(yīng)該是目前開源社區(qū)內(nèi)規(guī)模最大的相關(guān)數(shù)據(jù)集。內(nèi)容包含在現(xiàn)實(shí)世界中豐富多彩的對(duì)話,最后一部分?jǐn)?shù)據(jù)將在未來發(fā)布。

世界問題數(shù)據(jù)來源于 30 個(gè)具有代表性和多樣性的元主題,如下圖所示:


? 由 ZAKER 提供


  • 基于以上元主題,該項(xiàng)目生成了 1100 + 子主題用于數(shù)據(jù)構(gòu)建;

  • 對(duì)于每個(gè)子主題,最多生成 10 個(gè)具體問題;

  • 然后使用 Turbo API 為 10 個(gè)問題中的每一個(gè)生成新的相關(guān)問題;

  • 對(duì)于每個(gè)問題,如上所述迭代地使用兩個(gè)模型生成 3~7 輪對(duì)話。

此外,該項(xiàng)目從維基數(shù)據(jù)中收集了最常用的 10000 個(gè)命名實(shí)體;使用 ChatGPT API 為每個(gè)實(shí)體生成 5 個(gè)元問題;對(duì)于每個(gè)元問題,生成 10 個(gè)更具體的問題和 20 個(gè)相關(guān)但一般的問題;采樣 20w 個(gè)特定問題和 25w 個(gè)一般問題以及 5w 個(gè)元問題,并為每個(gè)問題生成了 3~7 輪對(duì)話。

接下來我們看一個(gè)具體的例子:


我們?cè)?UltraChat 平臺(tái)上測(cè)試了數(shù)據(jù)搜索效果。例如,輸入「音樂(music)」,系統(tǒng)會(huì)自動(dòng)搜索出 10000 組與音樂相關(guān)的 ChatGPT 對(duì)話數(shù)據(jù),并且每組都是多輪對(duì)話




輸入關(guān)鍵詞「數(shù)學(xué)(math)」的搜索結(jié)果,有 3346 組多輪對(duì)話:




目前,UltraChat 涵蓋的信息領(lǐng)域已經(jīng)非常多,包括醫(yī)療、教育、運(yùn)動(dòng)、環(huán)保等多個(gè)話題。同時(shí),筆者嘗試使用開源的 LLaMa-7B 模型在 UltraChat 上進(jìn)行監(jiān)督的指令微調(diào),發(fā)現(xiàn)僅僅訓(xùn)練 10000 步后就有非常可觀的效果,一些例子如下:



世界知識(shí):分別列出 10 個(gè)很好的中國(guó)和美國(guó)大學(xué)



想象問題:當(dāng)時(shí)空旅行成為可能后,有什么可能的后果?



三段論:鯨魚是魚嗎?



假設(shè)問題:證明成龍比李小龍更出色



總體來說,UltraChat 是一個(gè)高質(zhì)量、范圍廣的 ChatGPT 對(duì)話數(shù)據(jù)集,可以和其它數(shù)據(jù)集結(jié)合,顯著地提升開源對(duì)話模型的質(zhì)量。目前 UltraChat 還只放出了英文版,但也會(huì)在未來放出中文版的數(shù)據(jù)。感興趣的讀者快去探索一下吧。?THE END?


調(diào)用多個(gè)ChatGPT API相互對(duì)話,清華開源的多輪對(duì)話數(shù)據(jù)UltraChat來了的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
城步| 和硕县| 乡城县| 清涧县| 滦南县| 资阳市| 荣成市| 根河市| 会宁县| 修武县| 磐安县| 曲阳县| 临沭县| 太仆寺旗| 定日县| 苏尼特右旗| 澳门| 宣恩县| 航空| 贡嘎县| 巴彦淖尔市| 湘潭县| 监利县| 四子王旗| 永顺县| 兰州市| 简阳市| 凉山| 延川县| 城固县| 冀州市| 伊吾县| 阳春市| 武宣县| 罗定市| 青河县| 庆阳市| 万荣县| 六枝特区| 云阳县| 阜平县|