LexFridman、SamAltman對話摘要,從高維
編輯/宇婷
Lex Fridman(萊克斯·弗瑞德曼)是麻省理工學院的研究科學家、人工智能研究員,也是一位知名的播客主播。他曾在同名播客里,訪談過馬斯克、扎克伯格等知名企業(yè)家。 最近,Lex與OpenAI CEO Sam Altman(山姆·阿爾特曼)進行了一次接近兩個半小時的對話。? 我真的覺得ChatGPT是
讓我們能夠更深入地了解人類自己,反思我們自己的生存、智慧和推理過程。這一點Lex也提到。
以及我非常贊同Sam的價值觀——我們會推出一些有很多缺陷的東西。我們希望在風險較低的時候犯錯,同時每次迭代都能變得更好。???
16、19、20的摘錄,Sam的回答非常有藝術性。?
我看了源碼資本(ID:sourcecodecapital)的整理,我覺得其中有一些問題和觀點的碰撞挺有意思的。摘錄出來給我的讀者們。? 1、從高維度來說,GPT-4是一個人類在未來會回頭翻看的AI系統(tǒng)。是一個非常早期的人工智能,它運行緩慢、有錯誤,很多事情做得不好。需要幾十年的演變。? 2、GPT的所有版本中的哪一個真正具有突破性?Sam會選擇ChatGPT。關鍵的并不是底層模型,而是它的可用性,包括RLHF(Reinforcement Learning from Human Feedback)和與之交互的接口。RLHF解決的并非僅僅是對齊問題,它能幫助構(gòu)建更好、更有用的系統(tǒng),而這也是人們往往忽視的一點。實際上,這是一個我認為業(yè)外人士不太了解的問題。
對齊和性能提升其實是相輔相成的
,更好的對齊技術會帶來更強大的模型,反之亦然。這種區(qū)分很模糊,我們所做的工作包括讓GPT-4更加安全和對齊,看起來與其他研究和工程問題的解決非常相似。? 3、RLHF是利用人類反饋來做調(diào)整的方法,最簡單的版本就是展示兩個輸出,詢問哪一個更好,哪一個人類讀者更喜歡,然后用強化學習將其反饋到模型中。這個過程用相對較少的數(shù)據(jù)就能讓模型變得更有用。所以rlhf讓模型與人類期望的目標保持一致。
對齊(alignment)的感覺。
4、它更容易讓你得到你想要的。你第一次就能做對更多的事情。易用性很重要,即使基本功能以前就存在。 5、我們從許多不同的來源整合這些數(shù)據(jù),付出了巨大的努力。包括很多開源信息數(shù)據(jù)庫、通過合作關系獲得的資料、還有互聯(lián)網(wǎng)上的東西。??? 6、
內(nèi)容實在太多了,我們的任務不是去尋找更多,而是去篩選。
??? 7、像任何新的科學分支,我們將發(fā)現(xiàn)一些不符合數(shù)據(jù)的新事物,并需要提出更好的解釋。這是科學發(fā)現(xiàn)的持續(xù)過程。但是,就我們現(xiàn)在所知道的,甚至我們在GPT-4博客文章中所發(fā)布的,我認為我們都應該對目前能夠預測到這種程度感到驚訝。? 8、評估過程的開源,我認為那會非常有幫助。但是真正重要的是,我們投入了這么多的精力、金錢和時間來完成這個項目,
從中得到的結(jié)果對人們有多大的價值?它能給人們帶來多少快樂?
它能否幫助人們創(chuàng)造一個更美好的世界、新的科學、新的產(chǎn)品、新的服務等等,這是最重要的?;蛘呶覀儼阉斫鉃橐唤M特定的投入,能為人們提供多大的價值和效用。我認為我們對此有了更好的了解。
我們是否了解模型為什么會做一件事而不做另一件事?并不是,至少不總是這樣,但我會說我們正在逐步揭開更多的神秘面紗。
?? 9、
人類知識和人類智慧有區(qū)別嗎?我覺得GPT-4也充滿了智慧。從知識到智慧的飛躍是什么?
關于我們?nèi)绾斡柧氝@些模型的一個有趣之處是,我懷疑太多的處理能力被用于將模型作為數(shù)據(jù)庫,而不是將模型作為推理引擎。這個系統(tǒng)真正令人驚嘆的地方在于,它可以在某種程度上進行推理。從吸收人類知識的過程中,它產(chǎn)生了這種“推理”能力,無論我們?nèi)绾斡懻撨@個問題,在某種意義上,我認為這在現(xiàn)在將增加人類的智慧。而在另一些意義上,你可以用GPT-4做各種事情,然后說它似乎完全沒有智慧。? 10、作為一個工具,我們希望它能夠幫助人們更好地完成他們的工作,提供有價值的信息和見解。雖然我們可能永遠無法完全了解它的工作原理,但我們?nèi)匀荒軌虿粩喔倪M和優(yōu)化它
,使其更加有用、智能和可靠。
11、它為我們提供了一個獨特的機會,
讓我們能夠更深入地了解人類知識、智慧和推理過程。
(Lex)?? 12、有些看起來應該很明顯且容易的事情,模型卻很難處理,計算字符、計算單詞之類的東西對于這些模型來說是很難做好的。因為模型的架構(gòu)方式讓它們不會很準確。? 13、我們把它推向公眾,因為我們認為讓世界盡早獲得這項技術,對塑造它的發(fā)展方式、幫助我們發(fā)現(xiàn)事物的好壞是非常重要的。每次我們推出一個新模型,外部世界的集體智慧和能力幫助我們發(fā)現(xiàn)我們無法想象的事物。這些事物包括模型可以做的偉大的事、新功能以及我們必須解決的真正弱點。因此,這種迭代的過程,發(fā)現(xiàn)事物的優(yōu)點和缺點,快速改進它們,讓人們有時間感受這項技術,與我們共同塑造并提供反饋,我們認為這非常重要。? 14、我們做了一種權(quán)衡,也就是說,
我們會推出一些有很多缺陷的東西。我們希望在風險較低的時候犯錯,同時每次迭代都能變得更好。
15、隨著時間的推移,給用戶更多的個性化控制和粒度控制可能是解決方案。? 16、對于規(guī)則制定,OpenAI必須參與其中。我認為讓聯(lián)合國之類的組織去做這件事然后我們接受他們的結(jié)果是行不通的。因為我們負責推出這個系統(tǒng),
如果出問題,我們必須修復并對結(jié)果負責。
我們比其他人更了解即將到來的事物以及哪些事情更容易實現(xiàn)。所以我們必須積極參與。我們必須在某種程度上負責,但不能僅有我們的意見。 17、我認為人們主要想要的是一個符合他們世界觀的模型。 18、我敢肯定它有各種各樣的微妙影響,我可能不完全了解,但我沒有察覺到很多。我們很高興承認我們的錯誤,因為我們希望越來越好。我認為我們在傾聽所有的批評意見方面做得相當好,深入思考,內(nèi)化我們同意的觀點;至于那些讓人喘不過氣的博眼球新聞,就盡量忽視它們。? 19、
我們在OpenAI擅長的一點是,贏得很多小勝利,并將它們相乘,這樣每一個可能都是一個相當大的飛躍,但實際上是它們的乘法效應以及我們投入的細節(jié)和關注使我們?nèi)〉眠@些大飛躍,然后從外面看起來就像我們可能只是做了一件事,從3到3.5再到4。但實際上是幾百個復雜的事情。
20、我認為重要的是獲得最佳性能。而且,我認為Open AI里有一件非常好的事情是,
我們非常追求真理,只做任何能提供最佳性能的事情,不管它是否是最優(yōu)雅的解決方案。