國人沒理想?一起來做更好的ChatGPT

美國的對話網(wǎng)站 ChatGPT 最近引起了中文互聯(lián)網(wǎng)圈的軒然大波,許多朋友在討論中國為什么沒有 ChatGPT——“國人沒理想,中文質(zhì)量差,所以國內(nèi)沒有 ChatGPT”??

“先問是不是,再問為什么”,我們先來看看簡中網(wǎng)友們是否認(rèn)同“國內(nèi)沒有 ChatGPT”:


什么是彩云小夢?兩年前就有更聰明的國產(chǎn) ChatGPT 了嗎?

開端
2020 年 12 月 1 日的北大中文系網(wǎng)絡(luò)文學(xué)課堂,三年前“機(jī)器學(xué)習(xí) x 網(wǎng)絡(luò)文學(xué)”的分享是故事的起點(diǎn)。

剛剛研發(fā)出的“大語言模型”技術(shù)讓北大課堂里響起了連綿不絕的掌聲,那時(shí)候的“小夢”還沒有操作界面,只是我電腦上的一段代碼。我們用微信的文字交流,根據(jù)同學(xué)給出的一段文章,讓機(jī)器生成了 1000 字邏輯連貫且文筆細(xì)膩的續(xù)寫內(nèi)容。
簡中互聯(lián)網(wǎng)上的“AI 續(xù)寫”,在這里發(fā)出了它第一聲啼鳴。


北大中文系同學(xué)們熱烈歡迎我們的技術(shù),不僅和 AI 合作寫小說,還制作了小冊子。這啟發(fā)我們向公眾推出“AI 創(chuàng)作”產(chǎn)品。但當(dāng)時(shí)模型有個(gè)致命缺陷,必須要輸入 1000 字的文章寫作效果才好,大部分普通用戶寫不了那么長的故事開頭。


中文系的邵燕君老師給我介紹了她編寫的《中國網(wǎng)絡(luò)文學(xué)雙年選》和《創(chuàng)始者說》,帶我進(jìn)入了一個(gè)全新的世界:《詭秘之主》中克萊恩獲得“歷史學(xué)家”虛空抓物的神奇技能,《贅婿》中寧毅一邊對決蘇家反派一邊“何妨吟嘯且徐行”詩詞劇情神同步,《攻略不下來的男人》韓煙煙快穿之旅里不斷探索世界真相的勇氣,《開端》中李詩情的“再試一次”,還有《天才基本法》中林朝夕“一以貫之的努力!”

2021 年 2 月 7 日,我回憶起讀過的那些網(wǎng)絡(luò)文學(xué),綜合我對語言模型程序的理解,終于調(diào)試出了以一個(gè)字為開頭也能續(xù)寫的模型,并發(fā)現(xiàn)了“自然語言編程”方法,這是我一生中最令我激動的智能科學(xué)發(fā)現(xiàn)之一。?
第二天中午,我們便上線了“彩云小夢”網(wǎng)頁版。我其實(shí)很擔(dān)心,小夢會被大家看到嗎?會有多少人想使用 ai 續(xù)寫呢?我們把目標(biāo)定在了每天 100 個(gè)用戶,每日產(chǎn)出 10000 字的作品。?
但事實(shí)是:
上線半小時(shí),用戶量突破 2 千,超越了最初的設(shè)計(jì)極限;?
2 月 9 日,每小時(shí)用戶量突破 1 萬,我們買空了金山云全部 80 張顯卡;
2 月 15 日,每小時(shí)用戶量突破 5.6 萬,單日用戶突破 20 萬,每日續(xù)寫字?jǐn)?shù)突破 2 億字,線上三個(gè)機(jī)房 160 張顯卡滿負(fù)荷提供服務(wù);
上線一周,彩云小夢已經(jīng)獲得接近 100 萬用戶。
與此同時(shí),B 站上的二創(chuàng)作品也全面開花,用戶自發(fā)編寫了“AI 續(xù)寫宇宙”:獅面1996 給我們帶來了?【AI續(xù)寫宇宙】彩云計(jì)劃 ;

網(wǎng)友用彩云小夢創(chuàng)作的題材層出不窮,比如續(xù)寫電視劇《開端》:

制作視覺小說:

現(xiàn)代詩:


古代詩:

拍電影:

大家甚至制作了 AI 續(xù)寫拜年祭,在每年 2 月 8 日,小夢生日時(shí)候播放,以紀(jì)念小夢上線周年。

通過構(gòu)造各種前文(prompt),網(wǎng)友們利用小夢可以對話、作詩、游戲、對聯(lián)等等。因此,有了語言模型之后,驅(qū)動 AI 的不是你的數(shù)學(xué)能力,而是你的文學(xué)想象力。2021 年 6 月 15 日,我向國家專利局提交了自然語言編程方法專利。


從“斗破蒼穹”到“開端”,從蒲松齡的《狼》到論語的《兩小兒辯日》,由 AI 續(xù)寫驅(qū)動的二次創(chuàng)作生態(tài)獲得了上億的播放量,播放與彈幕互動數(shù)量不僅高于 ChatGPT,也高于所有其他 AI 文學(xué)創(chuàng)作產(chǎn)品。甚至,人民日報(bào)和團(tuán)中央也報(bào)道了彩云小夢,我們受寵若驚。


圖片(團(tuán)中央與人民日報(bào)頭條報(bào)道 AI 續(xù)寫)

一波三折
但聲音也是兩面的——作家要失業(yè)了嗎?文學(xué)作品的傳承會受到影響嗎?這引起了網(wǎng)友廣泛的討論,其中一些網(wǎng)友留言表達(dá)了擔(dān)憂。

輿情告急,為了不讓評論被帶偏,小夢的用戶們發(fā)動了一場輿情保衛(wèi)戰(zhàn)。

迎頭趕上與世界共舞,AI 國風(fēng)正當(dāng)時(shí)。在大家的幫助下,我的評論被頂?shù)搅耸灼?。大家寫下了令人動容的留言?/p>
面對爭議,為了給大家提供更好的服務(wù),我忍痛暫時(shí)下線了小夢網(wǎng)頁版,閉關(guān)修煉,并力圖讓小夢學(xué)會更多語言,與世界共舞。
經(jīng)過 20 年的發(fā)展,中國網(wǎng)絡(luò)文學(xué)早已不是青澀少年,每個(gè)有手機(jī)的人都可以去嘗試發(fā)表小說,但必須是非常有創(chuàng)意的作者才能在激烈競爭中勝出。這些《超長篇章回體小說》讓海外讀者也欲罷不能。起點(diǎn)每日產(chǎn)生 6 萬章節(jié),全網(wǎng)每天產(chǎn)生 2 億字,如此大規(guī)模的內(nèi)容生產(chǎn),不可能通過人工實(shí)時(shí)翻譯給海外。
但我們 2017 年推出的彩云小譯,讓大規(guī)模網(wǎng)文出海成為可能。彩云小譯是全球最大同人小說網(wǎng)站 ao3 最受歡迎的英翻中工具,每日翻譯字符數(shù)超過 2 億字,從 2019 年起,通過與閱文集團(tuán)的合作,彩云大幅度提高了文學(xué)作品機(jī)器翻譯的質(zhì)量,使得中國的網(wǎng)文第一次有了大規(guī)模走出國門的機(jī)會。


(小譯翻譯的讀者評論:太神奇了,完全沒有機(jī)翻痕跡)
我希望在翻譯之外,更近一步把中文小說的創(chuàng)意帶給全世界,結(jié)合英語世界本地的語料,訓(xùn)練一個(gè)既懂中國網(wǎng)文套路,又懂英文習(xí)慣的大語言模型。
2021 年 5 月,彩云新的英文大模型自動測評指標(biāo)和創(chuàng)作效果,在小說領(lǐng)域超越了包括 GPT-neo 在內(nèi)所有開源英文模型。在創(chuàng)造力和文筆的人工測評上,我們超越了 OpenAI 的 GPT3 英文版 davinci 模型。
2021 年 6 月,小夢海外版 Dreamily 上線,很快獲得了海外用戶狂熱的稱贊。
但同時(shí),質(zhì)疑我們中國身份和隱私問題的網(wǎng)絡(luò)謠言和暴力也喧囂而起。
Dreamily is spying on you...
彩云小夢在監(jiān)視你。
Dreamily is NOT free, your personal information is the cost.
彩云小夢不是免費(fèi)的,你的個(gè)人信息是成本。
看到這些不實(shí)言論的時(shí)候我正在醫(yī)院,氣得我發(fā)抖。我拿出手機(jī)開始在 Reddit 上和網(wǎng)友吵架,但過了一陣,令我意外的事情發(fā)生了,經(jīng)過我的解釋,有部分美國用戶竟然會修改帖子并且向我道歉。有一個(gè)用戶在 Discord 里和我說:“人們對你的指責(zé)是不公平的,堅(jiān)持下去,你的程序很棒,繼續(xù)努力,如果需要幫助,隨時(shí)和我留言。讓我們團(tuán)結(jié)一心?!备兄x他的回復(fù),我說到:“善良坦誠可以穿越偏見”。


破繭成蝶
漸漸的,就像國內(nèi) B 站一樣,也有一些海外用戶開始制作 Dreamily 相關(guān)的視頻,比如 Chesh 制作的蒸汽朋克同人動畫:READING A COMPUTER GENERATED FANFICTION,還有網(wǎng)友 ChoccyMilkMen 對主流 AI 創(chuàng)作軟件進(jìn)行了測評 I Let AI Tell Me Why I Should Watch Squid Games,結(jié)果是 Dreamily 得分最高。

2022 年 9 月,以 Dreamily API 為智能引擎的游戲 1001 nights 亮相在希臘雅典舉行的國際學(xué)術(shù)會議 Foundation of Digital Games。我發(fā)表了 Build & Chat with Fictional Characters through a Text-synthetic AI 的演講。

9 月 13 日,我在雅典衛(wèi)城博物館進(jìn)行了 Dreamily 2.0 的直播 發(fā)布會 ,向 Dreamily 的全球用戶介紹了在我所知范圍內(nèi)第一個(gè)可以根據(jù)世界設(shè)定和人物設(shè)定給 AI 機(jī)器人打電話的產(chǎn)品。我發(fā)現(xiàn),沒有人在意我的身份和國籍,直播觀眾都很友好,雖然我直播中因?yàn)橹鳈C(jī)性能不好而不太流暢,但用戶卻在彈幕中說“直播設(shè)備不好難掩真誠,正是這份真誠讓 Dreamily 做的這么好用”。那一刻,我相信,團(tuán)結(jié)友愛才是這個(gè)星球的主流,我們真的可以服務(wù)好全球的用戶。



最讓我感動的,是 AO3 上的一篇 同人文:AI does the writing, but the LOVE is?real?【https://archiveofourown.org/works/32113507/chapters/79558804】

“機(jī)器”寫作,“真愛”暖心。截止今天,Dreamily 累計(jì)用戶 70 萬,月活用戶 10 萬,平均日使用時(shí)長 50 分鐘,英美用戶占比超過 60%。我們在美區(qū) AppStore 獲得了一邊倒的好評。

由中文網(wǎng)絡(luò)文學(xué)驅(qū)動模型的 ai 彩云小夢,不僅可以在中文世界里點(diǎn)燃創(chuàng)意,在海外世界也可以受到諸多好評,甚至戰(zhàn)勝海外諸多本土產(chǎn)品。只要懷著“為人類文明更美好”的愿景,科技創(chuàng)新、造福大眾的產(chǎn)品終將沖破偏見、實(shí)現(xiàn)理解。
中國大陸地區(qū)的彩云小夢網(wǎng)頁版暫停續(xù)寫服務(wù) 4 個(gè)月后,終于回歸。兼具中英文創(chuàng)作能力的彩云小夢 App 也正式上架各大商店,受到用戶熱烈歡迎!當(dāng)月我們即獲評 AppStore 月度最佳應(yīng)用,并隨后多次獲得推薦。



2023 年 1 月,小夢推出了世界廣場,允許用戶分享自己的世界設(shè)定到 App 內(nèi)供其他用戶瀏覽和探索,用戶創(chuàng)作的世界豐富多彩,遠(yuǎn)超想象,例如:
普通日本東京
世界 ID:WF7PQYN

小編(七彩云)說:
發(fā)生在東京的克蘇魯元素怪誕故事,角色的身份背景都很豐富,有一種在跑團(tuán)的感覺。蟲蟲世界
世界 ID:WUK323B

小編(薄桜)說:
非常喜歡這個(gè)設(shè)定!給不同種類的蟲蟲安排了具體有趣的人設(shè),故事背景有賽博朋克元素,非常奇妙!幻想女仆館
世界 ID:WBX3TNY

小編(薄桜)說:
用彩云小夢玩劇本殺,五位 ai 女仆陪玩、多重線索和不同結(jié)局,很有趣的嘗試!

前進(jìn)四
截至目前,全球用戶已經(jīng)創(chuàng)建了超過 2000 萬篇文章,400 萬個(gè)世界設(shè)定,1400 萬個(gè)虛擬角色,每日產(chǎn)生 2 億字的文本,創(chuàng)作量遠(yuǎn)超同類其他產(chǎn)品。小夢成為了全球內(nèi)容最為豐富的 AIGC 創(chuàng)作社區(qū)之一。


ChatGPT 是非常令人稱贊的成果,但是它并不是人工智能的終點(diǎn)。一個(gè)小孩很難只通過看書就學(xué)會一切吧?小夢要成為比 ChatGPT 更強(qiáng)大的 ai,就要在虛擬世界通過行為和語言相結(jié)合的強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)限定領(lǐng)域的完全語義理解。即讓 ai 超出文字的束縛,賦予 ai 更強(qiáng)大的對于行為和語言的鏈接,真正明白“你要做什么”。
我在 2020 年 8 月的 Paper Weekly 分享里縱覽了當(dāng)前 nlp 與冒險(xiǎn)游戲的研究工作,希望有一天,彩云小夢廣場中那些豐富多彩的世界可以 3D 化,你可以走到每個(gè)世界里面去探索,與 AI NPC 互動交流,在世界模擬器當(dāng)中體驗(yàn)不一樣的人生,并給予 AI 反饋,幫助人類解開智能科學(xué)的奧秘。

回到最開始的問題:彩云小夢是什么?
現(xiàn)在我告訴你。
彩云小夢是全球 400 萬網(wǎng)友創(chuàng)作的上億播放量的 AI 續(xù)寫平行宇宙,是 1400 萬個(gè)平行世界人物的家園,是簡中互聯(lián)網(wǎng)從榕樹下、龍空、起點(diǎn)、露西弗、長佩、晉江一路走來網(wǎng)絡(luò)文學(xué) 20 年滋養(yǎng)的幻境,是 Dreamily 海外用戶繪制的五彩 LOGO 和直播打出的“Literal Angle”,是中國網(wǎng)文科技出海的先鋒。彩云小夢是簡中互聯(lián)網(wǎng)一曲理想與堅(jiān)持的贊歌。
中國網(wǎng)絡(luò)文學(xué),奇?zhèn)ス骞?,恢宏壯麗?/strong>
壯哉,我大簡中互聯(lián)網(wǎng)的文學(xué)藝術(shù)!
小夢,我華夏文明信息時(shí)代的榮光!
勇敢的少年們,加入我們,去探索人工智能的未來!
有志的投資者,入股我們,來分享智能時(shí)代的紅利!
國人沒理想?
中文質(zhì)量低?

一起來做更好的ChatGPT!
聯(lián)系我們:future@caiyunapp.com