最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

對(duì)話DataFocus創(chuàng)始人:大模型會(huì)顛覆ToB行業(yè)嗎?

2023-06-30 12:24 作者:肥宅up煮  | 我要投稿

編者按:年初ChatGPT引爆了AIGC,GPT幾乎成了軟件從業(yè)者最高頻的話題了。如今時(shí)過半載,子彈仍然在飛舞,顯然這波浪潮還遠(yuǎn)遠(yuǎn)沒有到平息的時(shí)候。這是一次內(nèi)部分享,我們有幸和DataFocus創(chuàng)始人JET暢聊了大模型的天南海北,匆匆整理以饗讀者。

? ?

第一部分LLM大模型

Chatgpt究竟神奇在哪里?

JET:?jiǎn)柎鹗浇换ィ拇_比傳統(tǒng)列表搜索的方式好很多。Chatgpt比其他的聊天機(jī)器人有了質(zhì)變,體驗(yàn)上完全不在一個(gè)境界。產(chǎn)品還是要死磕體驗(yàn),誰都知道聊天機(jī)器人有用,就是沒人把它做的足夠好用。

ChatGPT多輪對(duì)話的支持很好,能夠很好的結(jié)合上下文,5個(gè)回合的交互,基本上可以在一個(gè)主題下聊天,沒有出戲的感覺,這個(gè)是用戶體驗(yàn)和以前的聊天機(jī)器人不同的地方。當(dāng)然了,也有報(bào)道說15輪以上的對(duì)話它hold不好,回答就容易跑偏,這些都可以通過擴(kuò)展帶入上下文作為Prompt來解決,但是成本更高。

代筆寫點(diǎn)兒小文章,這個(gè)場(chǎng)景肯定是最先有人搞的。復(fù)雜點(diǎn)兒的,用這個(gè)訓(xùn)練專業(yè)領(lǐng)域的智能能客服也是被大量應(yīng)用的方向。


Chatgpt的對(duì)話模式徹底把搜索結(jié)果列表干掉了,這極有可能會(huì)影響現(xiàn)有的競(jìng)價(jià)廣告模式,從而引起商業(yè)模式的變革,就這點(diǎn)來說,谷歌的確緊張了一陣子,年初甚至有點(diǎn)措手不及,顯得格外慌亂。

Chatgpt在哪些領(lǐng)域表現(xiàn)優(yōu)異?

JET:要回答這個(gè)問題,得回看GPT的發(fā)展歷史。其實(shí)早在兩三年前,GPT2出來以后,就已經(jīng)有不少創(chuàng)業(yè)團(tuán)隊(duì)接入其能力,運(yùn)用最好的方向就是內(nèi)容創(chuàng)作。之后直到chatGPT的出現(xiàn),其寫作能力進(jìn)一步提升至人類水平,并且已經(jīng)具備了很好的理解能力和多輪交互能力,這就使得其能力拓展至聊天、客服這類通用場(chǎng)景??梢哉f有了chatGPT,很多公司之前的努力都付諸東流,比如XX問問、XX客服、XX云小蜜等產(chǎn)品,基本上可以丟進(jìn)垃圾桶了?,F(xiàn)在,只需要花很少的功夫就可以用ChatGPT迅速訓(xùn)練出一個(gè)具備某項(xiàng)專業(yè)知識(shí)的智能客服,其表現(xiàn)要遠(yuǎn)勝于上面提到的智能客服產(chǎn)品,體驗(yàn)了GPT4.0之后,你會(huì)發(fā)現(xiàn)智能客服賽道的棺材板上已經(jīng)釘上了最后一顆釘。

除此之外,基于ChatGPT的語言交互能力,有人構(gòu)建了虛擬機(jī)器人社區(qū),有人將它引入到游戲中,賦予游戲人物特定的人格,瞬間激活了虛擬女友,虛擬人生之類的各種應(yīng)用,這是目前能看到的能較好落地的應(yīng)用。

GPT是一個(gè)會(huì)徹底顛覆行業(yè)格局的東西嗎?

JET:微軟公司亂拳打死老師傅,他從搜索切入,對(duì)谷歌形成了極大的威脅,自身的成本反而不高。即使后期全線產(chǎn)品接入試用體驗(yàn)未盡人意,也不妨礙這次戰(zhàn)略競(jìng)爭(zhēng)的策略。GPT如果只是用作客服,價(jià)值是有限的,不太可能會(huì)對(duì)行業(yè)形成很大的沖擊。人們對(duì)其的期待,更多的是微軟的Office實(shí)踐,只是將GPT用作自然語言交互接口,用于理解用戶的輸入,生成內(nèi)容,或者進(jìn)行一系列的動(dòng)作編排。恰恰是后者,使之具備了大規(guī)模用于辦公自動(dòng)化領(lǐng)域的可能。這使得軟件的大部分功能在學(xué)習(xí)成本很低的情況下,可能被釋放給更大量的用戶,這就極大地提升了生產(chǎn)力。這一點(diǎn)從GPT的插件商城也可以看出來,大量的插件做著更專業(yè)的工作,GPT則充當(dāng)交互窗口,降低用戶的交互成本。從這個(gè)角度來講,Iphone時(shí)刻是成立的。大家想一想,這個(gè)生態(tài)成功的前提是什么?一個(gè)是門檻足夠低的自然語言交互模型,一個(gè)是廣泛被用于生產(chǎn)中的各行各業(yè)專業(yè)的API。在中國,我認(rèn)為第一個(gè)問題難度有,但是可以克服,甚至突破的時(shí)間也就幾年。但是第二點(diǎn),將是無解的。中國是平臺(tái)壟斷型的互聯(lián)網(wǎng)、軟件生態(tài)。彼此互相之間封閉作業(yè),各家自成一體。即使你有了智能的交互代理,也無米可炊,除了客服聊天,甚至各種垂直的聊天,比如情感聊天,游戲聊天,虛擬人格之類的,我們尚未看到有價(jià)值的應(yīng)用。

讓我們更深入一點(diǎn)。要想讓智能代理能夠產(chǎn)生更大的價(jià)值,創(chuàng)造更大的生產(chǎn)力,必須讓智能代理可以從事復(fù)雜任務(wù),解決深層問題。但是復(fù)雜任務(wù)的編排依賴于大量成熟的業(yè)務(wù)場(chǎng)景和開放性良好的API生態(tài)。

為什么會(huì)有Prompt工程這種東西?

JET:Prompt是個(gè)很有趣的東西,它給GPT提供了各種稀奇古怪的玩法,一開始,可以說從另一個(gè)角度引爆了OpenAI的傳播。為什么會(huì)有提示詞這種東西呢,這和大模型的基因相關(guān)。由于Transformer算法其實(shí)就是一個(gè)猜猜看接下來會(huì)發(fā)生什么的概率機(jī),模型被海量的語料填喂之后,形成了天量的序列串網(wǎng)絡(luò)。當(dāng)用戶使用時(shí),必須要通過一些提示才能激活網(wǎng)絡(luò)獲得下一串最大概率的字符。這個(gè)網(wǎng)絡(luò)是龐大的,多樣的,隨機(jī)產(chǎn)生的各種回答幾乎都不會(huì)重樣,大大提升了對(duì)話的真實(shí)感。

正是由于他這個(gè)自然語言生成,生成的內(nèi)容是隨機(jī)的,沒法控制,因此,提示語就顯得尤為重要,這就像巫師用來喚醒精靈的咒語。一開始大量的用戶僅僅在提示詞這里都可以找到很多樂趣。OpenAI在發(fā)布GPT模型之前,預(yù)先做了調(diào)整對(duì)齊,用人工進(jìn)行了反饋強(qiáng)化訓(xùn)練,這就像預(yù)置了不少的套路,用戶掌握了這些套路,則可以更高效,更準(zhǔn)確的獲得想要的內(nèi)容。甚至一度有傳,提示詞工程師月薪都可以高達(dá)十幾萬了。為此,deeplearning.ai的創(chuàng)始人吳恩達(dá)教授甚至還開了專門的課程教大家如何設(shè)計(jì)提示詞,這就有了Prompt工程這個(gè)東西。


Prompt提示詞工程,告訴我們,哪怕是再智能的AI,也還是有使用門檻,那種想著躺床上啥也不干全靠AI的人又要失望了,未來的人跟人的差別不是你有沒有AI助理,而是你會(huì)不會(huì)用,是否擅長使用的差別。還是那個(gè)道理,現(xiàn)在大家都有智能手機(jī)了,有的人學(xué)會(huì)用它學(xué)習(xí)、辦公,有的人只學(xué)會(huì)了刷視頻玩游戲。 ?

微軟2023年以來,動(dòng)作越來越大,未來微軟會(huì)通過OpenAI一統(tǒng)天下嗎?

JET:大家注意看最近的幾個(gè)數(shù)據(jù),很有意思。一個(gè)是微軟自去年以來bing搜索引擎的市場(chǎng)占有率,小幅上升后,繼續(xù)下降,目前也僅僅只是超越了百度,離google還有極大的差距,可以說目前微軟借助ChatGPT的這波熱潮,帶來的增量對(duì)撼動(dòng)谷歌搜索引擎統(tǒng)治地位,幾乎沒有啥幫助。

即便如此,微軟最近一個(gè)月仍然動(dòng)作不斷,先是發(fā)布了office copilot,github copilot,newBing,如今直接重磅炸出windows Copilt,還和chatGPT一同共享了50多款插件,接二連三的炸場(chǎng)搞得大家都有點(diǎn)兒審美疲勞了。


? ?

從戰(zhàn)略上來講,微軟目前的每一步動(dòng)作都像是在搶先身位,希望借助chatGPT的熱潮進(jìn)一步拓展市場(chǎng)份額。扶持NewBing這個(gè)親兒子不遺余力,結(jié)果大家都看到了,也就增加了幾個(gè)點(diǎn)的份額,還略有下跌。造成這件事的主要原因,一方面是GPT的流量并沒有完全被微軟吸收,而是被OpenAI的chatGPT吸收了,另一方面,則暴露了問題的關(guān)鍵,那就是目前的GPT使用者,仍然還是社會(huì)精英層的人士,這部分人群相比于數(shù)十億普通網(wǎng)民來說,數(shù)量仍然是極其稀少的。這可能與GPT的使用,與提示詞工程有點(diǎn)兒關(guān)系,提示詞工程說得簡(jiǎn)單點(diǎn)兒,對(duì)用戶的要求是要能夠問得出好問題,或者說,要求用戶能夠很好地問問題。就這一點(diǎn)來說,門檻還是高了點(diǎn)兒。所以說,工具再好,也還是需要有學(xué)習(xí)成本。這個(gè)問題,要么通過長時(shí)間的普及學(xué)習(xí)來解決,要么通過降低提示詞工程難度來解決(微軟最近也有不少項(xiàng)目在做這個(gè)工作)。但是最終,微軟和OpenAI費(fèi)盡心力教育市場(chǎng),教育用戶,最大的價(jià)值還是會(huì)被整個(gè)行業(yè)獲取,Google看起來落后,也許當(dāng)他看清楚之后,很容易就可以追上。

可以說微軟著急放出windows copilot,是希望通過windows的海量用戶來壟斷第一波紅利,NewBing和chrome相比最大的差距就是用戶量,當(dāng)Google也有了palm之后,Newbing的優(yōu)勢(shì)就不明顯了。這次用windows上陣,這是錯(cuò)位競(jìng)爭(zhēng),谷歌沒有應(yīng)對(duì)的條件,然后蘋果躺槍了。在這場(chǎng)亂戰(zhàn)之中,最賺的可能還是OpenAI,蘋果有可能最后會(huì)整合第三方技術(shù)應(yīng)對(duì)挑戰(zhàn)。我很納悶的是,為什么一年以來,Apple能這么淡定?

你對(duì)大模型的涌現(xiàn)能力怎么看,是不是只有參數(shù)越多涌現(xiàn)能力越突出?

涌現(xiàn)這個(gè)東西是科學(xué)家為了解釋深度神經(jīng)網(wǎng)絡(luò)在一種評(píng)測(cè)基準(zhǔn)下,其參數(shù)量和評(píng)測(cè)表現(xiàn)(得分)的非線性關(guān)系的描述。也就是說,一開始,隨著參數(shù)量的增加,評(píng)測(cè)得分的提升并不明顯,但是當(dāng)參數(shù)量增加到某個(gè)量之后,得分一下子顯著提高,這不是線性的,這是個(gè)階躍性質(zhì)的突變。無法解釋這個(gè)現(xiàn)象,給取了個(gè)名字叫涌現(xiàn)。我也不知道這個(gè)原理,深度神經(jīng)網(wǎng)絡(luò)是個(gè)黑盒子,如何運(yùn)作的人們現(xiàn)在是沒法搞清楚。大膽的猜測(cè)一下,之所以會(huì)有涌現(xiàn)這種東西,也許是參數(shù)量達(dá)到一定程度之后,網(wǎng)絡(luò)會(huì)自動(dòng)生成抽象層,正是這些抽象網(wǎng)絡(luò)的存在,使得模型看起來具備了某種意識(shí)或推理能力,雖然很有限,但比以前還是好太多了。如果是這樣的話,那么是不是參數(shù)繼續(xù)增加,當(dāng)突破到另一個(gè)臨界值的時(shí)候,會(huì)有更加抽象的概念層生成?那時(shí)候也許模型的意識(shí)會(huì)更加明顯也更加聰慧。另一個(gè)層面來講,如果不增加模型的參數(shù),有沒有辦法通過降低參數(shù)量,提前讓模型產(chǎn)生涌現(xiàn)呢?也許算法設(shè)計(jì)得更精巧一點(diǎn)兒,可以達(dá)到這個(gè)目的。我們繼續(xù)觀察吧,有可能很多聰明人已經(jīng)在開始這方面的工作了。

大模型都出來3-4年了,發(fā)明者還是谷歌,為什么爆火的是ChatGPT呢?

JET:仔細(xì)研究ChatGPT的爆火,這是一個(gè)典型的又一個(gè)硅谷病毒式傳播的經(jīng)典案例。在正式發(fā)布之前,它精心做了將近1年多的調(diào)優(yōu)工作,這種Fine tunning,我不認(rèn)為是大模型上算法的多大改進(jìn),更多的是針對(duì)許多特定的使用場(chǎng)景進(jìn)行的。比如結(jié)合代碼生成的場(chǎng)景,讓它學(xué)會(huì)寫一段特定的代碼,補(bǔ)全代碼等等。或者讓他寫一篇常用的工作類的文案,請(qǐng)假條,情書,總結(jié),周報(bào),小結(jié)等等。這種細(xì)粒度的調(diào)優(yōu)工作,一定耗費(fèi)了不少時(shí)間,但是San Altman一開始就有可能規(guī)劃好了這些引爆點(diǎn)。只要遵循硅谷的哲學(xué):比現(xiàn)有的產(chǎn)品好上10倍-100倍,就一定會(huì)引發(fā)口碑傳播,而當(dāng)一個(gè)又一個(gè)場(chǎng)景被“發(fā)現(xiàn)”,這種傳播就會(huì)形成一波又一波的聲浪,從而形成一種巨大的輿論傳播。


? ?

反觀ChatGPT這幾個(gè)月的傳播,你會(huì)發(fā)現(xiàn)最初它就是在一些有影響力的工程師那里傳開的,體驗(yàn)確實(shí)超過了他們以前見過的最好產(chǎn)品,于是各種Twitter轉(zhuǎn)發(fā),博客文章紛至沓來,從而引發(fā)一波又一波的輿論浪潮。

拋開它精心準(zhǔn)備的病毒傳播路徑不談,就chatgpt這個(gè)產(chǎn)品上來說,的確在各種常用場(chǎng)景上進(jìn)行了大量的優(yōu)化。目前來看,傳播已經(jīng)趨于平淡,就看后面還有沒有繼續(xù)核彈級(jí)的更新,否則這個(gè)話題將會(huì)逐漸淡下來。而谷歌也會(huì)逐步穩(wěn)住陣腳開始反擊。

大模型的終點(diǎn)是宇宙級(jí)超腦嗎?

JET:建造一個(gè)超級(jí)金字塔的難度是遠(yuǎn)遠(yuǎn)超過建造一群小型金字塔的。GPT模型最大的意義不是越大越好,他最終的進(jìn)化不應(yīng)該是天網(wǎng)那樣的東西,那樣的話能量消耗會(huì)指數(shù)級(jí)增長。最穩(wěn)定和平衡的狀態(tài),將是分布式的各種小型智能代理,就像微機(jī)取代大型機(jī)一樣。未來一定是足夠好的中模型經(jīng)過特定領(lǐng)域的訓(xùn)練,成為一個(gè)垂直場(chǎng)景的優(yōu)秀助理,而不是巨大模型籠罩之下的全能助理。

從prompt工程可以了解到,當(dāng)模型過于龐大,知識(shí)過于繁雜之后,輸入與輸出空間的函數(shù)關(guān)系很難準(zhǔn)確刻畫,于是誕生了各種奇怪的prompt工程。這最終將會(huì)導(dǎo)致模型的精神分裂特質(zhì),也有可能會(huì)導(dǎo)致巨大模型在吸收過多信息之后無法使用的情況。因此,我更看好專業(yè)化或者專家化的中模型。投資人與其去追求下一個(gè)OpenAI,還不如多留意各種垂直領(lǐng)域的LLM應(yīng)用。

大模型是AI最后的答案嗎?

JET:目前的大模型不可能超越人類,其架構(gòu)不比人腦更高明。一個(gè)最直接的證明就是愛因斯坦所接觸的數(shù)學(xué)和物理知識(shí)肯定沒有大模型多,莫言和村上春樹也沒有看那么多書。但是大模型經(jīng)過海量數(shù)據(jù)的訓(xùn)練,依然只是看起來像是個(gè)八面玲瓏的萬金油。干啥都行,就是沒有看到在某個(gè)領(lǐng)域能達(dá)到人類大師的水平。我猜想,人類大腦的神經(jīng)網(wǎng)絡(luò)和現(xiàn)有的大模型網(wǎng)絡(luò)還是有著本質(zhì)的區(qū)別的。這種區(qū)別目前很難搞清楚是什么。秀麗隱桿線蟲簡(jiǎn)單的大腦和昆蟲大腦的區(qū)別在哪里?不同物種之間的大腦構(gòu)造的差異是什么?為什么人類的智商斷層式的領(lǐng)先于其他物種?盡管羚羊或者獵豹的大腦比人類小的多,但是他們對(duì)于在高速中控制肌肉組織的能力相比人類來說卻是大師級(jí)的。種種事實(shí)表明,我們對(duì)神經(jīng)網(wǎng)絡(luò)的理解可能還未窺門徑。

? ?

大模型還會(huì)在哪個(gè)領(lǐng)域創(chuàng)造奇跡?

JET:從GPT4的表現(xiàn)來看,Transform架構(gòu)被證實(shí)了是一種很有效的神經(jīng)網(wǎng)絡(luò)模型。這就是最好的神經(jīng)網(wǎng)絡(luò)模型了嗎?這種基于序列的概率預(yù)測(cè),目前的表現(xiàn)確實(shí)令人驚艷,泛化能力,理解能力都比以前有質(zhì)的提升,但是始終在幻覺問題的解決上無法跨越,此外它明顯還不具備人類的抽象能力,而這是人類智慧的基石。我認(rèn)為,目前的模型架構(gòu),即使規(guī)模再擴(kuò)大1萬倍,也無法解決這個(gè)問題。需要全新的模型。

除了訓(xùn)練圖像、語音等這類多模態(tài)的場(chǎng)景,繼續(xù)擴(kuò)大數(shù)據(jù)的維度外,為什么沒有人嘗試在運(yùn)動(dòng)上去訓(xùn)練出更好的機(jī)器人呢?想想看,人類的小腦更接近于靠直覺行事,如果能有一個(gè)好的空間搜索算法,也許可以通過模仿現(xiàn)有的大模型框架輕松突破和超越波士頓動(dòng)力的機(jī)器人!

沒有andriod時(shí)刻,只有chrome時(shí)刻

JET:大模型代表的能力是人機(jī)交互的范疇,而不是底層操作系統(tǒng)的范疇。樂觀來看,也許大模型足夠好的理解能力,可以進(jìn)一步抹平人類和機(jī)器交互的摩擦,從最早的命令行代碼交互,到基于圖形界面的視窗交互,再到基于自然語言的交互。因此大模型被廣泛使用,一定是賦能式的,它會(huì)被大量嵌入到各種已有的系統(tǒng)中,逐步取代已有的代碼、拖拽等低效的交互方式,將人機(jī)交互進(jìn)一步放大到隨時(shí),隨地,并且降低工作門檻,賦予整個(gè)社會(huì)一個(gè)最低生產(chǎn)力標(biāo)準(zhǔn)。舉個(gè)例子,在計(jì)算器出現(xiàn)之前,會(huì)計(jì)電算化算是一門高級(jí)技術(shù)工作,但是隨著工具的普及,這個(gè)門檻被消除了。門檻被消除,會(huì)產(chǎn)生兩類后果,一個(gè)是將這個(gè)需求領(lǐng)域的供需關(guān)系徹底變成勞動(dòng)力無限供給,隨之而來的就是這類任務(wù)將被最大限度普及。前一個(gè)變化會(huì)帶來失業(yè),后一個(gè)變化會(huì)重塑生產(chǎn)關(guān)系,在生產(chǎn)關(guān)系的重塑過程中,或許會(huì)產(chǎn)生新的工作機(jī)會(huì)。


總之,目前來看,大模型并不具備重構(gòu)操作系統(tǒng)底層的可能性。一些人可能覺得OpenAI既然已經(jīng)搶先,那么它就是未來的IOS,其他人還會(huì)有Andriod的機(jī)會(huì)。遺憾的是,這種機(jī)會(huì)是不存在的,即使真有,那個(gè)機(jī)會(huì)也是給Google留著的。

未來AI進(jìn)化到Moss550的水平,可能會(huì)有不同吧,那是科幻世界,不知道我們的有生之年能不能看到。


GPT插件商城這條生態(tài)之路能走通嗎?怎么看待OpenAI最新的函數(shù)調(diào)用功能?

JET:我認(rèn)為很難在openAI的API上玩出多少花來。這也是前面我說到的,GPT只有chrome的機(jī)會(huì),不太可能有Android的機(jī)會(huì)。基于OpenAI的API能構(gòu)建的應(yīng)用深度不夠,一般不具備復(fù)雜的邏輯處理能力,這注定了它不能產(chǎn)生復(fù)雜應(yīng)用,盡管OpenAI也在不停的優(yōu)化GPT的復(fù)雜任務(wù)處理能力,但是目前來講,要想獲得很好的結(jié)果,還是應(yīng)該盡量做簡(jiǎn)單交互,或者將復(fù)雜問題拆分成簡(jiǎn)單的多輪交互邏輯。一些開源項(xiàng)目也在專注于做這件事,比如agentgpt,autogpt等等,這些東西處理起真實(shí)世界的復(fù)雜任務(wù)依然效果不好。



此外,GPT意識(shí)到這些問題之后,它也開始提供了一些函數(shù)封裝的功能,簡(jiǎn)單點(diǎn)兒講,這個(gè)函數(shù)封裝的功能其實(shí)就是希望將復(fù)雜任務(wù)拆成具體的一個(gè)個(gè)簡(jiǎn)單任務(wù),以便開發(fā)者能夠組合出更復(fù)雜的應(yīng)用。由于大模型的基因如此,這種按照序列概率生成內(nèi)容的方式,不具備更高層次的抽象能力,哪怕如今模型已經(jīng)達(dá)到驚人的萬億參數(shù),其抽象能力依然很差。因此,要想工程上能開發(fā)復(fù)雜應(yīng)用,就必須進(jìn)行人工的抽象,這相當(dāng)于人類基于自身經(jīng)驗(yàn)進(jìn)行人肉建模,這和上個(gè)世紀(jì)的專家系統(tǒng)的思路無差,最后在這條道路上能跑出多少復(fù)雜的應(yīng)用來,我們還需要觀望。


? ?

能不能預(yù)測(cè)一下這波AIGC的未來趨勢(shì)?


JET:任何置身其中的人,都很難做好趨勢(shì)預(yù)測(cè),我也不例外。與其說預(yù)測(cè)未來,還不如站在局中人的角度,提出幾個(gè)問題,我們共同來圍觀一下,將來會(huì)有什么答案吧。

  1. 未來是否會(huì)有比Transformer更好的算法,能夠更快地產(chǎn)生涌現(xiàn);

  2. 1年內(nèi)是否會(huì)出現(xiàn)單顯卡能跑的媲美GPT3.5的LLM;

  3. 自然語言交互接口能否在2年內(nèi)成為ToB軟件的標(biāo)配;

  4. 達(dá)到GPT4.0的語言能力的多模態(tài)模型2年內(nèi)是否會(huì)出現(xiàn);

  5. 世界模型2年內(nèi)是否能達(dá)到12歲人類兒童的智力水平;

  6. 國產(chǎn)大模型2年內(nèi)是否能達(dá)到如今GPT4.0的水平;

  7. 2年內(nèi)會(huì)否出現(xiàn)算力大貶值,A100進(jìn)入尋常百姓家;

  8. 2年內(nèi)大模型進(jìn)入發(fā)展瓶頸期,大量AIGC創(chuàng)業(yè)公司淘汰出局。

  9. 5年后由于大模型的應(yīng)用,大量互聯(lián)網(wǎng)內(nèi)容均由AIGC產(chǎn)生,用戶開始厭倦頭條和抖音,大型真人秀節(jié)目變得更受歡迎;

  10. 由于內(nèi)容的泛濫,互聯(lián)網(wǎng)廣告行業(yè)的價(jià)值將被極大稀釋,品牌的成長變得更具有隨機(jī)性;

? ?

? ?

第二部分GPT和數(shù)據(jù)分析

怎么看Chatgpt在數(shù)據(jù)分析領(lǐng)域的表現(xiàn)?

JET:微軟公司展示過整合了GPT的excel以及office等copilot系列產(chǎn)品,我們可以看到GPT已經(jīng)能夠做簡(jiǎn)單的描述性統(tǒng)計(jì)、數(shù)據(jù)可視化等工作了。GPT4的演示中,我們也看到了更加通用的功能,用戶可以通過上傳excel數(shù)據(jù),GPT就可以通過調(diào)用pyton代碼進(jìn)行常用的數(shù)據(jù)可視化和簡(jiǎn)單分析工作,甚至可以通過與人的交互進(jìn)行簡(jiǎn)單的數(shù)據(jù)預(yù)處理工作。


從以上能力表現(xiàn)可以推斷,GPT至少具備調(diào)用第三方工具進(jìn)行數(shù)據(jù)可視化的能力,同時(shí)它也可以通過其語言能力對(duì)可視化結(jié)果進(jìn)行解讀,寫一些數(shù)據(jù)分析報(bào)告。它也具備一些基本的分析思路,會(huì)通過常用的人類思路出發(fā),通過比較、發(fā)現(xiàn)趨勢(shì)、識(shí)別異常等方法去分析解讀數(shù)據(jù)。但是這些能力均局限在:

    1. 數(shù)據(jù)要有較好的質(zhì)量,過于散亂或不標(biāo)準(zhǔn)的數(shù)據(jù)表,它處理起來效率不高,甚至無法處理;

    2. 數(shù)據(jù)量理論上不能太大,畢竟GPT是個(gè)通用的語言模型,它并不能執(zhí)行大規(guī)模的分析運(yùn)算;

    3. 使用者要較好地表達(dá)自己的意圖,否則GPT可能也不能提供高質(zhì)量的結(jié)果。

我認(rèn)為對(duì)于GPT最好的使用方式不是直接使用它來分析數(shù)據(jù),而是調(diào)用它最擅長的語言處理能力,去理解用戶的意圖,并對(duì)數(shù)據(jù)進(jìn)行總結(jié)解讀,在此基礎(chǔ)上,調(diào)用專業(yè)的大數(shù)據(jù)分析工具如DataFocus,去完成復(fù)雜、深入的數(shù)據(jù)分析工作,最終用戶會(huì)獲得更加沉浸式的使用體驗(yàn)。


GPT會(huì)顛覆BI這個(gè)行業(yè)嗎?

JET:GPT從3.5誕生開始就一路狂飆,到現(xiàn)在,幾乎已經(jīng)通過病毒傳播的形式完成了早期市場(chǎng)教育,大量非IT人士都已經(jīng)了解到AGI、大模型、生成式AI等概念,也有非常多的用戶通過api和bing體驗(yàn)到了其魅力。它最令人驚艷的能力,還是多輪對(duì)話的上下文理解,以及生成內(nèi)容的絲滑自然。偶有破綻,但已無傷大雅,這就使得它具備了大規(guī)模被用戶采用的基礎(chǔ)。說到底,AI好不好用主要取決于使用體驗(yàn),GPT經(jīng)過半年時(shí)間的炒作,應(yīng)該即將達(dá)到愚昧之巔。

但是說到他對(duì)行業(yè)的顛覆,還為時(shí)尚早。目前來看,我們能看到的GPT用于數(shù)據(jù)分析領(lǐng)域的幾類落地應(yīng)用有這么幾個(gè)。一是通過ChatGPT對(duì)話,收集數(shù)據(jù),生成圖表,解釋圖表;一個(gè)是通過插件上傳數(shù)據(jù),進(jìn)行描述性分析;還有一個(gè)就是利用GPT的代碼生成能力,通過自然語言交互生成SQL。第一種ToC的場(chǎng)景居多,造點(diǎn)兒數(shù)據(jù),甚至爬取點(diǎn)兒數(shù)據(jù),不在意數(shù)據(jù)的準(zhǔn)確性,簡(jiǎn)單的玩耍當(dāng)然不成問題,如果收集數(shù)據(jù)足夠多,成本可能是個(gè)問題;第二種場(chǎng)景,也是toC的居多,前提是數(shù)據(jù)要做較好的預(yù)處理,并且使用人員要善于提問,當(dāng)然,仍然存在一個(gè)成本問題,要知道一張10MB的數(shù)據(jù)表,token可是很值錢的;第三種場(chǎng)景,也有很多落地項(xiàng)目,包括阿里的chat2DB,國外的Text2SQL.io,以及Y combinator孵化的幾個(gè)項(xiàng)目。這類和Github的Copilot類似,主要用于提升數(shù)據(jù)庫工程師的開發(fā)速度,用于快速生成SQL。總體來看,ToC領(lǐng)域的落地場(chǎng)景比ToB領(lǐng)域更多。

從BI行業(yè)來看,DataFocus、Thoughtspot是最早致力于自然語言交互方式的BI產(chǎn)品,但目前BI的主流交互方式仍然是拖拽。Tableau、PowerBI等產(chǎn)品也曾經(jīng)嘗試在拖拽交互之外增加了NLI的交互方式,國內(nèi)如SmartBI、sugarBI、網(wǎng)易有數(shù)和億信BI等也是這種技術(shù)路線,但是這種畫蛇添足的方法,反而給用戶帶來了困擾,革命不夠徹底。2021年初創(chuàng)企業(yè)北極九章、MagicBI等則是徹底采用了DataFocus和Thoughtspot一樣的交互方式,只提供自然語言搜索的交互方式,這些產(chǎn)品都還不能提供免費(fèi)試用,目前難以評(píng)估其效果。但是這種聚焦于自然語言一種交互方式的BI產(chǎn)品,才應(yīng)該是未來BI領(lǐng)域最終的產(chǎn)品形態(tài)。

? ?

而ChatGPT出來之后,關(guān)于數(shù)據(jù)分析問答式交互,搜索式分析這種體驗(yàn)的市場(chǎng)教育工作,大大地減輕了。當(dāng)大量的用戶習(xí)慣于通過自然語言交互的方式獲得答案之后,他們將會(huì)徹底接受類DataFocus的交互方式,拖拽式交互也將隨著上一代BI產(chǎn)品引入GPT的能力而逐漸退出歷史舞臺(tái)。與其說GPT會(huì)顛覆BI產(chǎn)業(yè),還不如說GPT將大幅改造BI行業(yè),把整體的BI軟件的使用體驗(yàn)提升一個(gè)檔次, 從而大幅提升BI產(chǎn)品的采用率,促進(jìn)BI行業(yè)健康發(fā)展。

? ?

DataFocus的關(guān)鍵技術(shù)是Text to SQL,大模型是否已解決這個(gè)問題?

JET:大模型出來之前,Text2SQL一直是NLP領(lǐng)域的一個(gè)細(xì)分的熱門研究方向,也是一個(gè)難度極大的課題。其根本問題在于人類語言表達(dá)的隨意性收斂到規(guī)范的SQL表述中時(shí),很難找到一個(gè)很好的函數(shù)去刻畫。大模型基于語言能力的涌現(xiàn),很好地突破了這個(gè)問題。

從我們的測(cè)試結(jié)果來看,GPT3.5在Text to SQL上的表現(xiàn)已經(jīng)超越了此前已發(fā)表的技術(shù)文獻(xiàn)中的最好成績,GPT4的準(zhǔn)確率更是幾乎可以達(dá)到89%以上。當(dāng)然,要獲得如此成績,前提是你得認(rèn)真地問問題,需要準(zhǔn)確和完備的上下文提示。這個(gè)要求對(duì)于非技術(shù)人員來說,其實(shí)是很高的,換句話說,你首先得是一名有經(jīng)驗(yàn)的數(shù)據(jù)庫工程師,可以熟練操作數(shù)據(jù)庫。這方面和用Copilot進(jìn)行輔助編程體驗(yàn)差不多,如果你有很好的代碼基礎(chǔ),GPT可以很好的提升你的生產(chǎn)效率,但如果你不具備這些技術(shù)基礎(chǔ),就不能很好的發(fā)揮效率優(yōu)勢(shì)。



DataFocus也集成了GPT的SQL生成能力,用以給技術(shù)人員開發(fā)數(shù)據(jù)視圖。但是更好的使用樣例,還是把GPT和Focus Search相結(jié)合,提供關(guān)鍵詞搜索輔助。這有兩個(gè)吸引人的優(yōu)勢(shì):一方面,使用者只需要能有效理解自然語言,不需要掌握SQL語言,就可以很好地操作;另一方面,可以通過這種方式熟練掌握關(guān)鍵詞搜索技巧,從而最大限度地提升輸入效率??梢哉f,關(guān)鍵詞輸入是最精煉、最準(zhǔn)確的提示工程用例。

談?wù)凣PT出現(xiàn)以后,對(duì)DataFocus產(chǎn)品的沖擊有多大?

JET:大家都知道DataFocus的搜索分析能力我們團(tuán)隊(duì)是潛心開發(fā)了近6年時(shí)間的。一開始我還以為被革命了。深入使用以后,我發(fā)現(xiàn)還是有差距,目前來看,直接利用GPT的API改造傳統(tǒng)BI,增加自然語言查詢的接口,很容易實(shí)現(xiàn),但是使用體驗(yàn)還達(dá)不到工業(yè)可用的程度。這種不可行性體現(xiàn)在兩個(gè)方面:一是真正商用場(chǎng)景上的數(shù)據(jù)分析,其復(fù)雜程度遠(yuǎn)高于OpenAI的Demo水平,你很難控制用戶的使用方式,這將導(dǎo)致使用體驗(yàn)很難對(duì)齊;另一個(gè)是GPT的SQL生成,仍然存在準(zhǔn)確度不夠的問題,這在正式的商用場(chǎng)景上是不可接受的。在商業(yè)軟件上引入不完全可靠的功能,有可能會(huì)得不償失。

如今,半年過去了,GPT對(duì)DataFocus,甚至對(duì)數(shù)據(jù)分析行業(yè)的利好逐漸增多,由于對(duì)大眾用戶的普及,大家接受了問答式交互方式,不再質(zhì)疑五年前DataFocus提出的搜索式分析,問答式交互的概念,也開始逐步認(rèn)識(shí)到拖拽式分析方式要逐漸退出歷史舞臺(tái)。

聊一下關(guān)鍵詞的問題。一開始我們就發(fā)現(xiàn),數(shù)據(jù)分析工作要做好,提出好問題最重要。因此,如果放開讓用戶完全放飛自我進(jìn)行自然語言查詢,最終的結(jié)果就是狀況百出,你會(huì)發(fā)現(xiàn)除了輸入法錯(cuò)誤,俚語,表達(dá)方式錯(cuò)亂以及摸棱兩可的問題之外,更可怕的是用戶的問題跟數(shù)據(jù)的相關(guān)性完全無法控制,這將導(dǎo)致大量的衍生問題,最終都導(dǎo)向一個(gè)結(jié)果,那就是用戶體驗(yàn)參差不齊,根本就達(dá)不到一個(gè)工業(yè)軟件的可使用狀態(tài)。

其實(shí)GPT同樣存在此類問題。大家現(xiàn)在看OpenAi,尤其是微軟的各種demo演示,各種發(fā)布會(huì)演示,驚為天人,都感覺以后的工作就只需要一句話了,AI能把所有的事情都干了。這是最大的問題,這種用戶認(rèn)知和用戶體驗(yàn)上的鴻溝至少還需要1年時(shí)間來填平,如果填不平,AIGC將淪為下一個(gè)元宇宙,尷尬地退出舞臺(tái)。

DataFocus的關(guān)鍵詞設(shè)計(jì)是出于什么考慮呢?這個(gè)我們以前也有講過,你仔細(xì)琢磨一下就會(huì)發(fā)現(xiàn),其實(shí)人類的語言交互包含大量的冗余信息,這些冗余信息導(dǎo)致了信息的模糊,語境差異等等豐富的場(chǎng)景化的東西。這些東西在數(shù)據(jù)分析的時(shí)候有必要嗎?我們不是在演話劇,也不是搞社交,完全沒有必要把問題弄得摸棱兩可。如果有一套關(guān)鍵詞體系,你會(huì)發(fā)現(xiàn),輸入效率有極大的提升,同時(shí)精準(zhǔn)度也會(huì)有質(zhì)的提升,這些都降低了計(jì)算的復(fù)雜性,降低了對(duì)硬件的消耗。那么關(guān)鍵詞有什么好處呢?一是大幅提升輸入效率和精準(zhǔn)度,另外,也可以訓(xùn)練用戶能夠提出正確的問題。這就像你讓車手在大草原上飆車,效果肯定不如在高速公路上好的原因。有一些簡(jiǎn)單的規(guī)則,會(huì)極大地提高解決問題的目的性,速度和效率。

GPT出來之后,DFC的產(chǎn)品演化方向是什么?

JET:積極擁抱大模型的能力,這是所有現(xiàn)有軟件產(chǎn)品都必須做的功課。我們也不例外。盡管很早以前我們就一直在教育市場(chǎng),對(duì)話式的,搜索式的交互方式,擁有更高的效率,更絲滑的體驗(yàn),但是,直到GPT風(fēng)靡之后,大家才逐漸認(rèn)識(shí)到這一點(diǎn)。GPT的多輪交互能力,意圖識(shí)別能力以及總結(jié)寫作能力,是目前最成熟的,最容易被用戶認(rèn)可的,應(yīng)該有限引入。

DFC將會(huì)全面接入GPT這方面的能力,從而加強(qiáng)產(chǎn)品的體驗(yàn),讓用戶體驗(yàn)到完全的AI驅(qū)動(dòng)的數(shù)據(jù)分析軟件,這將會(huì)在原來的基礎(chǔ)上,產(chǎn)生更深的代際進(jìn)步,從而真正實(shí)現(xiàn)讓業(yè)務(wù)精英都成為數(shù)據(jù)科學(xué)家,人人都是數(shù)據(jù)分析師不再是口號(hào)。

前不久,DataFocus發(fā)布了小慧Beta版,借助語言模型的能力,強(qiáng)化DataFocus的用戶體驗(yàn)。小慧的目標(biāo)是降低用戶使用門檻,提升使用體驗(yàn):一是作為搜索輔助,可以幫助用戶更快地上手搜索分析,用戶可以通過完全自然語言的提問,展開數(shù)據(jù)分析,小慧會(huì)將用戶的問題轉(zhuǎn)化成DataFocus的關(guān)鍵詞語句,從而確保數(shù)據(jù)計(jì)算的準(zhǔn)確性,同時(shí)可以幫助用戶理解和學(xué)習(xí)DataFocus的關(guān)鍵詞搜索方法;此外,小慧還可以支持在移動(dòng)端直接通過語音查詢分析數(shù)據(jù)。??

第三部分聊聊ToB行業(yè)

有人說GPT將完全顛覆ToB軟件行業(yè),你怎么看。

JET:GPT將會(huì)全線賦能ToB軟件行業(yè),這是毋庸置疑的。但是說GPT會(huì)完全顛覆ToB軟件行業(yè),我覺得危言聳聽了,或者至少言之過早。我的判斷是3-5年內(nèi),toB軟件的格局基本上不會(huì)有太大的變化。首先,強(qiáng)者恒強(qiáng)的邏輯不會(huì)變。這里面有兩層含義,一方面toB的獲客流程不象ToC那么簡(jiǎn)單,是一個(gè)復(fù)雜的過程,因此銷售驅(qū)動(dòng)型的軟件企業(yè),尤其是行業(yè)頭部具備一定品牌能力的軟件企業(yè),仍然是不容易被撼動(dòng)的。另一方面,ToB軟件的遷移成本過高,客戶也不太可能快速、大范圍地遷移到新產(chǎn)品上去。此外,由于大語言模型是一種賦能型的服務(wù),可以被所有人調(diào)用,因此,老牌軟件公司,也可以通過調(diào)用API的方式引入GPT的能力。

雖然,總體上來說ToB軟件不太會(huì)發(fā)生大的革命,但是在一些細(xì)分賽道或行業(yè),的確會(huì)受到毀滅性的打擊,比如一些客服軟件,一些售后支持軟件,一些內(nèi)容創(chuàng)作軟件,可能大概率都會(huì)消亡。因?yàn)檫@些都是GPT原生的能力,并且也很容易被使用,尤其是大量的開源生態(tài)、框架出來之后,開發(fā)一個(gè)售后服務(wù)支持軟件的難度已經(jīng)最大限度地降低。當(dāng)然,除非一些壟斷了獨(dú)家數(shù)據(jù)或知識(shí)的企業(yè),他們可以在其產(chǎn)品上集成GPT的能力,同時(shí)整合自身的數(shù)據(jù)優(yōu)勢(shì),從而獲得大模型AI加持,繼續(xù)維持其競(jìng)爭(zhēng)力。

最后,會(huì)有少量企業(yè)借助這一波大模型的AI熱潮走出來。這類產(chǎn)品本身結(jié)合了GPT的問答交互體驗(yàn),從根本上就創(chuàng)造了完全不同的用戶體驗(yàn),這類產(chǎn)品會(huì)隨著GPT能力的增強(qiáng),繼續(xù)強(qiáng)化這種交互上的體驗(yàn)差異,從而獲得一波用戶交互體驗(yàn)范式轉(zhuǎn)變的紅利,成為新品類軟件的領(lǐng)頭羊。比如DataFocus,從一開始就基于問答的交互方式去構(gòu)建,完全摒棄傳統(tǒng)BI的拖拽模式;隨著GPT影響的深入,并最終落地,大量用戶將會(huì)最終接受搜索、問答作為默認(rèn)交互方式,這樣DataFocus將會(huì)完全區(qū)別于過時(shí)的拖拽式體驗(yàn),而獲得新品類產(chǎn)品的認(rèn)知優(yōu)勢(shì),成為搜索式分析產(chǎn)品的代名詞。? ??

SaaS企業(yè)還能投嗎

JET:現(xiàn)在有一種論調(diào)是說SaaS在中國已經(jīng)全軍覆沒,完全沒有機(jī)會(huì)了?,F(xiàn)在SaaS行業(yè)還值得投資嗎?其實(shí)很多人并沒有認(rèn)識(shí)到SaaS的本質(zhì),有人覺得SaaS就應(yīng)該是切入到垂直領(lǐng)域極小功能的最大市場(chǎng)化,這些人是Copy from American的信徒;也有人認(rèn)為SaaS本質(zhì)上就是軟件的分期付款;還有人認(rèn)為SaaS就是云服務(wù)。

在談SaaS之前,我們首先得搞清楚軟件服務(wù)這個(gè)行業(yè),它包含至少兩類典型的公司形態(tài),一種就是做產(chǎn)品的,一種是提供開發(fā)服務(wù)的。后面這一類,國際上如Infosys,國內(nèi)如中軟國際、軟通動(dòng)力是最大的代表,也能上市,但是其沒落的趨勢(shì)是有目共睹的。我始終認(rèn)為,提供軟件開發(fā)服務(wù),以項(xiàng)目定制為基本商業(yè)模式的企業(yè),無論包裝得多光鮮亮麗,也算不上是SaaS企業(yè)。



SaaS企業(yè)必須以軟件產(chǎn)品為中心,這樣才能夠提供足夠標(biāo)準(zhǔn)化的服務(wù),才具備邊際成本遞減等規(guī)模效應(yīng)。

搞清楚了這個(gè)問題,我們?cè)賮砜磭鴥?nèi)的toB行業(yè),為什么SaaS一直在底部徘徊,看不到歐美那種高光的表現(xiàn)?問題并不是出在在座的各位,問題出在市場(chǎng)上。要知道中國的軟件服務(wù)市場(chǎng)是非常割裂的,否則你們很難看得懂為什么搞服務(wù)器的浪潮能在切入軟件賽道搞得風(fēng)生水起,一個(gè)市場(chǎng)上知名度并不高的航天云網(wǎng)是一家以軟件服務(wù)作為主營業(yè)務(wù)的上市公司。上面這兩家公司主營體制內(nèi)市場(chǎng),很多saas企業(yè)都懂,軟件市場(chǎng)很大一部分在國企,在央企,在事業(yè)單位,但是這些都不太可能成為他們的客戶。

于是,大部分沒有特殊市場(chǎng)能力的saas企業(yè)僅剩的客戶群體就是以民營經(jīng)濟(jì)為主的各類企業(yè)了,在這個(gè)客戶群體里面,小微企業(yè)并不需要ToB的軟件服務(wù),他們可以借助一些ToC的工具解決問題。

如此貧瘠的土壤上并不能期望開出一片花海,難道就沒有希望了嗎?

我相信中國將會(huì)繼續(xù)堅(jiān)定的走市場(chǎng)經(jīng)濟(jì)之路,疫情三年的壓力緩過勁兒來之后,民營經(jīng)濟(jì)也將重新煥發(fā)生機(jī),到那時(shí)候,SaaS企業(yè)的生存環(huán)境一定會(huì)比現(xiàn)在好很多。至于體制內(nèi)那一片大市場(chǎng),一方面我認(rèn)為SaaS企業(yè)仍然有機(jī)會(huì)進(jìn)入這個(gè)體系,當(dāng)然這取決于一些政策的變化;另一方面我們可以看到當(dāng)僅僅只有市場(chǎng)能力,產(chǎn)品力和實(shí)施能力跟不上的那些軟件公司在這一波數(shù)字化浪潮中把口碑搞砸了之后,一些極具競(jìng)爭(zhēng)力的SaaS企業(yè)仍然有機(jī)會(huì)進(jìn)入一些縫隙市場(chǎng)。當(dāng)然,最后,我覺得有能力卷到國際上的SaaS企業(yè)也將收獲另一片天空。

? ?

接下來,也許1年之內(nèi),隨著美聯(lián)儲(chǔ)再次開啟閘門,SaaS企業(yè)將有機(jī)會(huì)再一次領(lǐng)略山頂?shù)娘L(fēng)光,所以,對(duì)于有好的產(chǎn)品,好的口碑的SaaS企業(yè),此時(shí)此刻,該出手時(shí)就出手,是一個(gè)聰明的投資人的選擇。

對(duì)話DataFocus創(chuàng)始人:大模型會(huì)顛覆ToB行業(yè)嗎?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
海口市| 孝义市| 哈巴河县| 道孚县| 佛教| 岫岩| 永兴县| 于田县| 民乐县| 竹北市| 长春市| 湾仔区| 墨竹工卡县| 鄂州市| 浦北县| 马山县| 昌江| 东安县| 清流县| 咸丰县| 万载县| 金塔县| 商水县| 周口市| 阿图什市| 桂东县| 莱芜市| 崇仁县| 肃南| 平邑县| 荣昌县| 黔西| 银川市| 永济市| 舒城县| 上虞市| 贡嘎县| 桃园市| 团风县| 永兴县| 大兴区|