最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

經(jīng)典Blog | 生成式AI最大的商業(yè)機(jī)會(huì)是文本還是圖像?——《永遠(yuǎn)押注于文本》

2023-02-19 18:57 作者:小野母喵  | 我要投稿

引言:2022年AI領(lǐng)域兩個(gè)引爆點(diǎn)都在生成式AI中產(chǎn)生,一個(gè)是2022年9月發(fā)布的文本-圖像(text-to-image)生成式AI——Stable Diffusion,一個(gè)是2022年11月底發(fā)布的文本生成式AI——ChatGPT,后者更是成為史上最快月活達(dá)到1億用戶的應(yīng)用,至今仍廣受熱議。

熱議程度往往與能夠激發(fā)人們多大的想象力、且這些想象力又能轉(zhuǎn)化為多大的商業(yè)價(jià)值成正比。

生成式AI中,文本和圖像哪個(gè)的商業(yè)價(jià)值更大呢?

就這個(gè)問題,2023年1月27日,美國著名計(jì)算機(jī)科學(xué)家吳恩達(dá)在推特上發(fā)起了一個(gè)簡單的投票:你認(rèn)為哪種生成式AI將會(huì)產(chǎn)生更大的商業(yè)價(jià)值:圖像生成(例如擴(kuò)散模型,stable diffusion)還是文本生成(例如:大型語言模型,ChatGPT)?

在約1.3萬人的投票中,選擇文本生成的占比達(dá)到80%。

網(wǎng)友寫了一些認(rèn)為“生成文本”商業(yè)價(jià)值更大的原因:

更多的人被雇傭來做生成文本的工作,而不是生成圖像,所以我猜文本生成將產(chǎn)生更大的商業(yè)影響(包括大量的文本生成職業(yè),如法律,醫(yī)療賬單,會(huì)計(jì),學(xué)術(shù),編劇,新聞,編程)
兩者都是變化的載體,是真正改變世界的輸出。?在兩者之間,人類似乎更喜歡文本作為更改媒介,它在簡易性和壓縮性方面更優(yōu)。
文本。從記筆記到電子郵件,再到在線文章,有更多的用例。圖像生成對(duì)于為所述文章生成圖像是有用的,但圖像仍然不是文章的必要組建。但一旦人工智能可以制作視頻,再回到這個(gè)話題將會(huì)很有趣。

2014年,Rust編程語言的創(chuàng)造者——Graydon Hoare在其博客中,在一個(gè)更大范圍問題的討論中給出了他的答案。他說他的想法非常絕對(duì):文本才是一切,文本是有史以來最強(qiáng)大、最有用、最高效的通信技術(shù)。

雖已過10年之久,但是Graydon Hoare的觀點(diǎn)在當(dāng)下仍具有一定啟發(fā)性,所以花了些時(shí)間把這篇博文翻譯了一下。以下是全文:


《永遠(yuǎn)押注于文本》(Always?Bet?On Text)

作者:Graydon Hoare(Rust編程語言之父)

發(fā)表于?2014年10月13日https://graydon2.dreamwidth.org/193447.html


我想我應(yīng)該把這個(gè)帖子貼在某個(gè)地方,這樣如果以后有人問起我對(duì)視頻、3D、游戲或 "動(dòng)態(tài) "多媒體系統(tǒng)等有什么看法時(shí),我可以拿出來參考。別誤會(huì),我喜歡插圖、照片、電影和音樂。

但是,文本更勝一籌。文本就是一切。我在這方面的想法很絕對(duì):文本是有史以來最強(qiáng)大、最有用、最高效的通信技術(shù)。

文本是最古老、最穩(wěn)定的交流技術(shù)(假設(shè)我們將語言/符號(hào)視為自然現(xiàn)象,沒有它就沒有人類社會(huì)。而文本能力則必須通過傳播、教導(dǎo)、獲得),而且它擁有不可思議的持久性。我們可以閱讀五千年前(大約是文字誕生時(shí)期)的文本。它"堅(jiān)如磐石" -- 你可以很容易地將它刻在花崗巖上,這很可能會(huì)超過人類的壽命。

文本是最靈活的通信技術(shù)。當(dāng)有一張圖片與你想表達(dá)的內(nèi)容相匹配時(shí),圖片可能勝過千言萬語。但是,讓我們隨機(jī)在維基百科上選擇一個(gè)句子,

看看你是否能畫出一張圖片來表達(dá)它:

“人權(quán)是道德原則或規(guī)范,是描述人類行為的特定標(biāo)準(zhǔn),在國家和國際法中經(jīng)常作為法律權(quán)利受到保護(hù)。"

你是不可能用一張圖片來表達(dá)這段話的。文本可以用精確控制的模糊性和精確性、隱含的背景和詳盡的內(nèi)容來傳達(dá)思想,這是其他東西無法比擬的。所有的文學(xué)和詩歌、歷史和哲學(xué)、數(shù)學(xué)、邏輯、編程和工程都依靠文本編碼來表達(dá)它們的想法,這不是一個(gè)巧合。

文本是最高效的通信技術(shù)。在存儲(chǔ)大小方面是如此。這篇博文可能需要5000字節(jié)的存儲(chǔ)空間,可以壓縮到2000字節(jié);相比之下,下面這個(gè)20像素的鳥類剪影圖片需要4000字節(jié):

在通信技術(shù)中,第一步總是文本編碼,然后才是其他的。因?yàn)樵谥鸱?hào)(一次一個(gè)符號(hào))編碼/解碼的基礎(chǔ)上,它的成本大大降低。

1790年法國就有了一個(gè)可以運(yùn)行的光學(xué)電報(bào)網(wǎng)絡(luò)。

在試圖進(jìn)行語音傳輸之前,人們經(jīng)歷了一個(gè)世紀(jì)的電報(bào)、跨洋電纜等通訊方式。在帶寬變得足夠便宜,可用于圖片、聲音、視頻之前,人們有幾十年的時(shí)間都是在用電傳打字機(jī)和純文本的計(jì)算機(jī)網(wǎng)絡(luò)、郵件和新聞來聊天、出版、編輯和診斷。

在蘋果手機(jī)之前,人們用的是傳呼機(jī)、SMS、WAP、USSD和黑莓手機(jī)。在Web出現(xiàn)之前,人們用的是Teletext、BBS、Netnews和Gopher。

今天,許多最好的、也是Web中最高效的部分仍然是以文本為中心的。我可以下載維基百科的所有內(nèi)容,可以隨身攜帶在普通的智能手機(jī)上。文本是社會(huì)上最有用的通信技術(shù)。它可以在1:1(1對(duì)1)、1:N(1對(duì)多)和M:N(多對(duì)多)的模式下良好運(yùn)行。它可以被高效的索引和搜索,甚至通過手動(dòng)的方式。它可以被翻譯,可以以不同的速度進(jìn)行生產(chǎn)和消費(fèi)(譯注:可按照自己的節(jié)奏閱讀或者回復(fù)信息等)。它是異步的。它可以通過算法進(jìn)行比較、區(qū)分、聚類、修正、總結(jié)和過濾。它允許多方編輯。它允許分支對(duì)話、“潛水”(譯注:在基于文本的討論中,只關(guān)注,不說話)、注釋、引用、回顧、總結(jié)、結(jié)構(gòu)化問答(譯注:例如調(diào)查問卷等),可以進(jìn)行文學(xué)解析或創(chuàng)造性寫作,如同人小說等。人們使用文本的方式的廣度、規(guī)模和深度是任何東西都無法比擬的。在社會(huì)交往、語言溝通、認(rèn)知和反思復(fù)雜性方面,任何其他通信技術(shù)都無法與滿是書籍的圖書館或滿是帖子的互聯(lián)網(wǎng)世界相提并論。其他任何東西都無法與之相比。

因此,這是我對(duì)“文本”的立場:始終先選擇文本。就像我的老上司說的那樣:永遠(yuǎn)押注于文本。如果你可以用文本來做些什么事,那就用吧。它很少會(huì)讓你失望。


附英文原文:

always bet on text

I figured I should just post this somewhere so I can make future reference to how I feel about the matter, anytime someone asks me about such-and-such video, 3D, game or "dynamic" multimedia system. Don't get me wrong, I like me some illustrations, photos, movies and music.


But text wins by a mile. Text is everything. My thoughts on this are quite absolute: text is the most powerful, useful, effective communication technology ever, period.


Text is the oldest and most stable communication technology (assuming we treat speech/signing as natural phenomenon -- there are no human societies without it -- whereas textual capability has to be transmitted, taught, acquired) and it's incredibly durable. We can read texts from five thousand years ago, almost the moment they started being produced. It's (literally) "rock solid" -- you can readily inscribe it in granite that will likely outlast the human species.


Text is the most flexible communication technology. Pictures may be worth a thousand words, when there's a picture to match what you're trying to say. But let's hit the random button on wikipedia and pick a sentence, see if you can draw a picture to convey it, mm? Here:


"Human rights are moral principles or norms that describe certain standards of human behaviour, and are regularly protected as legal rights in national and international law."


Not a chance. Text can convey ideas with a precisely controlled level of ambiguity and precision, implied context and elaborated content, unmatched by anything else. It is not a coincidence that all of literature and poetry, history and philosophy, mathematics, logic, programming and engineering rely on textual encodings for their ideas.


Text is the most efficient communication technology. By orders of magnitude. This blog post is likely to take perhaps 5000 bytes of storage, and could compress down to maybe 2000; by comparison the following 20-pixel-square image of the silhouette of a tweeting bird takes 4000 bytes:. At every step of communication technology, textual encoding comes first, everything else after. Because it's vastly cheaper on a symbol-by-symbol basis. You have a working optical telegraph network running in 1790 in France. You the better part of a century of electrical telegraphy, trans-oceanic cables and everything, before anyone bothers with trying to carry voice. You have decades of teleprinter and text-only computer networking, mail and news, chat and publishing, editing and diagnostics, before bandwidth gets cheap enough for images, voice and video. You have pagers, SMS, WAP, USSD and blackberries before iPhones. You have Teletext and BBSs, netnews and gopher before the web. And today many of the best, and certainly the most efficient parts of the web remain text-centric. I can download all of wikipedia and carry it around on the average smartphone.


Text is the most socially useful communication technology. It works well in 1:1, 1:N, and M:N modes. It can be indexed and searched efficiently, even by hand. It can be translated. It can be produced and consumed at variable speeds. It is asynchronous. It can be compared, diffed, clustered, corrected, summarized and filtered algorithmically. It permits multiparty editing. It permits branching conversations, lurking, annotation, quoting, reviewing, summarizing, structured responses, exegesis, even fan fic. The breadth, scale and depth of ways people use text is unmatched by anything. There is no equivalent in any other communication technology for the social, communicative, cognitive and reflective complexity of a library full of books or an internet full of postings. Nothing else comes close.


So this is my stance on text: always pick text first. As my old boss might have said: always bet on text. If you can use text for something, use it. It will very seldom let you down.

經(jīng)典Blog | 生成式AI最大的商業(yè)機(jī)會(huì)是文本還是圖像?——《永遠(yuǎn)押注于文本》的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
太和县| 三门县| 新平| 湄潭县| 晋州市| 西吉县| 闽清县| 夏津县| 巫山县| 浮梁县| 政和县| 织金县| 兴山县| 增城市| 宝鸡市| 叙永县| 聊城市| 滕州市| 晋江市| 乌兰察布市| 龙山县| 阳高县| 揭阳市| 湘西| 临邑县| 南安市| 兴隆县| 五原县| 上虞市| 安西县| 漳平市| 西藏| 三门峡市| 延边| 九江市| 高雄市| 二连浩特市| 剑阁县| 莱州市| 秭归县| 翁源县|