百模大作戰(zhàn) 僅5個(gè)月就推出山海大模型的云知聲成為七十九分之一
作者:李東耳
來源:IPO參考(ID:IPOCIA)

大模型發(fā)展勢(shì)頭如火如荼,不少公司都已經(jīng)發(fā)布了自己的大模型。專注AI和智能語音的云知聲也于5月24日發(fā)布了通用大模型產(chǎn)品——山海大模型。
云知聲推出自己的大模型產(chǎn)品并不意外,此前也一直有消息稱云知聲將發(fā)布醫(yī)療版ChatGPT。不過相比于2個(gè)月前各公司推出大模型時(shí)的聲量,云知聲的大模型似乎沒有引起太大的聲響。
5個(gè)月推出山海大模型 ?但客戶使用是個(gè)問題
根據(jù)科技部5月28日發(fā)布的《中國人工智能大模型地圖研究報(bào)告》,目前國內(nèi)10億參數(shù)規(guī)模以上的大模型已發(fā)布至少79個(gè)。隨著大量大模型的發(fā)布,人們關(guān)注的重點(diǎn)已經(jīng)不是大模型能夠回答幾個(gè)問題或能不能算對(duì)數(shù)學(xué)題,而是這些大模型能在哪些領(lǐng)域應(yīng)用,目前是否具備使用能力,以及能否與自身業(yè)務(wù)相結(jié)合。
云知聲山海大模型目前的應(yīng)用行業(yè)主要有醫(yī)療、銷售、知識(shí)管理、口語、物聯(lián)網(wǎng)等幾個(gè)領(lǐng)域。
醫(yī)療領(lǐng)域是云知聲的主要服務(wù)領(lǐng)域,此前還曾因在醫(yī)療領(lǐng)域的市場(chǎng)份額引來行業(yè)巨頭的公開“打假”。但云知聲確實(shí)是在醫(yī)療這一垂直領(lǐng)域長期研究了不少年,擁有一定的專業(yè)數(shù)據(jù)基礎(chǔ)。在大模型發(fā)布已經(jīng)較晚的當(dāng)下,發(fā)揮在醫(yī)療行業(yè)的優(yōu)勢(shì)做垂直領(lǐng)域大模型,已經(jīng)是云知聲這些后發(fā)小廠商不得不采取的戰(zhàn)略。
同理,云知聲在銷售、知識(shí)管理等領(lǐng)域也已經(jīng)有了相應(yīng)的系統(tǒng)積累,在此基礎(chǔ)上利用大模型進(jìn)行升級(jí)也可以提供更好的服務(wù)。
除了將現(xiàn)有業(yè)務(wù)與AI相結(jié)合外,云知聲目前所發(fā)布的內(nèi)容主要還是集中在NLP(自然語言處理)上。如在山海大模型,用戶可以借助AI發(fā)現(xiàn)并改正自己的英語發(fā)音,并進(jìn)行對(duì)話以提升英語能力。如果得到大規(guī)模應(yīng)用,可以幫助不少有英語聽說練習(xí)需要的人減少大量學(xué)習(xí)成本,在教育領(lǐng)域可以得到廣泛的應(yīng)用。在物聯(lián)網(wǎng)領(lǐng)域,云知聲可以讓智能家居產(chǎn)品不再只是簡(jiǎn)單執(zhí)行命令,而是可以更好地理解人們所說的自然語言,并進(jìn)行更加接近人的語言互動(dòng)。
只從發(fā)布的內(nèi)容看,山海大模型具備一個(gè)成熟大模型應(yīng)有的基本條件,功能豐富并可以滿足基本需要,準(zhǔn)確率也在及格線之上,不少功能具備大規(guī)模商業(yè)化應(yīng)用的基礎(chǔ)。從發(fā)布時(shí)間上看,山海大模型雖然發(fā)布得相對(duì)較晚,但也只是晚于行業(yè)巨頭。
根據(jù)IDC的數(shù)據(jù),2022年上半年中國人工智能語音語義市場(chǎng)中,科大訊飛、阿里云和百度智能云共占25.6%的市場(chǎng)份額,思必馳、小I機(jī)器人、拓爾思市場(chǎng)份額位居其后,但3家加起來只能與市場(chǎng)份額前三中的一家相當(dāng),其他廠商的具體市場(chǎng)份額IDC未公布,但被包含在“其他”里的云知聲市場(chǎng)份額顯然排在上述6家之后。

來源:IDC
然而一個(gè)擺在云知聲面前的問題就是,并非先發(fā)布了大模型就能迎來轉(zhuǎn)機(jī),是否有足夠的客戶使用是個(gè)問題,畢竟只談功能的話,云知聲山海大模型所能提供的能力,其他友商似乎也可以提供,即便是在醫(yī)療領(lǐng)域,也有不少競(jìng)爭(zhēng)者。
兩年未獲新融資 云知聲或?qū)⒃俅紊鲜校?/strong>
AI是一個(gè)需要大量時(shí)間和資本支撐的領(lǐng)域,這也是為何率先發(fā)布大模型的大多是頭部科技公司。云知聲從成立以來就一直備受關(guān)注,除2015年沒有宣布融資消息外,直到2020年正式遞交招股書,云知聲每年都有新的融資消息出現(xiàn)。
但云知聲的上市計(jì)劃并未能像其融資一樣順利。雖然科創(chuàng)板的設(shè)立讓不少企業(yè)科技公司有了上市融資的機(jī)會(huì),但一眾AI獨(dú)角獸的科創(chuàng)板IPO均不順利,有些AI公司后來不得不暫時(shí)擱置上市計(jì)劃,其中就包括云知聲。
但云知聲IPO的終止或許還有其他原因,其中來自科大訊飛的公開質(zhì)疑,被不少人看作是云知聲放棄上市計(jì)劃的原因。
兩家公司的恩怨或許早已埋下。成立于2012年的云知聲就因創(chuàng)始人的原因受到不少關(guān)注,但真正讓云知聲成為焦點(diǎn)的,恐怕還是2013年的“錘子ROM”發(fā)布會(huì)。由于錘子使用的是云知聲的解決方案,“云知聲擊敗科大訊飛成為錘子ROM語音解決首選方案”一度出現(xiàn)在一些媒體對(duì)云知聲的報(bào)道中。
雖然是第一次發(fā)布,但憑借羅永浩的網(wǎng)紅效應(yīng),云知聲之后很快就獲得了樂視電視和搜狗的關(guān)注并成功達(dá)成合作。
或許是因?yàn)榭拼笥嶏w并沒有把云知聲的這一營銷口號(hào)當(dāng)回事,再加上確實(shí)因此開了個(gè)好頭,2020年云知聲遞交招股書時(shí)就更加大膽,聲稱自己在白電市場(chǎng)和語音病歷系統(tǒng)領(lǐng)域市占率均為70%,在病例質(zhì)控系統(tǒng)方面市占率30%。
這一數(shù)據(jù)一出,科大訊飛的投資者先坐不住了。由于這兩個(gè)領(lǐng)域也是科大訊飛的重要業(yè)務(wù),若按云知聲的說法,科大訊飛在相關(guān)領(lǐng)域早已沒有了領(lǐng)先優(yōu)勢(shì),因此投資人在互動(dòng)平臺(tái)上向科大訊飛詢問相關(guān)數(shù)據(jù)。
科大訊飛隨后以數(shù)據(jù)回應(yīng)投資者稱,以覆蓋醫(yī)院數(shù)量,云知聲在2017年至2020年上半年的四個(gè)報(bào)告期分別為10、36、91和112家,科大訊飛同期分別為11、77、264和489家。從收入看,云知聲上述時(shí)期智能語音病歷收入分別為170.96萬元、926.39萬元、1628.91萬元和895.48萬元,科大訊飛同期分別為664.28萬元、2937.27萬元、3554.48萬元、3571.11萬元。在白電市場(chǎng)方面,科大訊飛也以數(shù)據(jù)反駁,云知聲并沒有達(dá)到領(lǐng)先科大訊飛的程度。
雖然云知聲并沒有回應(yīng)此事,但不久后選擇撤回IPO材料終止上市,難免讓人懷疑云知聲的底氣。
IPO終止后,云知聲又在2021年6月得到了一筆近億美元的融資,但到目前為止,云知聲已經(jīng)差不多2年沒有再拿到新融資了。
不過,也有人從2023年上半年云知聲的頻頻亮相中,看到了一點(diǎn)云知聲要再次IPO的端倪。如在3月發(fā)布的一篇名為《未來云知聲上市可期?云知聲賦能智能產(chǎn)品加速發(fā)展》的文章中,就明確提到“云知聲將繼續(xù)向感知與分析、認(rèn)知技術(shù)、決策與生成三大方向發(fā)力,持續(xù)探索智能交互邊界,以技術(shù)優(yōu)勢(shì)賦予 AIoT 無限想象,打開更多市場(chǎng)空間,并賦能企業(yè)自身發(fā)展,實(shí)現(xiàn)上市目標(biāo)”?。在一篇對(duì)云知聲創(chuàng)始人黃偉的采訪中,黃偉表示云知聲的估值還應(yīng)該再高一些。
云知聲能否破解AI企業(yè)盈利難題?
不過,云知聲當(dāng)年終止IPO更主要的原因,可能還是難以盈利。AI公司不盈利問題一直被人詬病。
若以IDC的數(shù)據(jù)為準(zhǔn),排名前三的3家企業(yè),均是規(guī)模較大,業(yè)務(wù)較為成熟的企業(yè),其中科大訊飛很早就是國內(nèi)智能語音方面的領(lǐng)跑者,阿里云和百度智能云的主要業(yè)務(wù)也不是依靠智能語音,并且都已經(jīng)實(shí)現(xiàn)了盈利。排名第六的拓爾思雖然體量上不及科大訊飛,但目前的主要收入來源是大數(shù)據(jù)軟件產(chǎn)品及服務(wù),也有能力支援大模型相關(guān)的研發(fā)。
反觀剩下兩家第二梯隊(duì)的智能語音企業(yè),思必馳因盈利問題IPO被否,小I機(jī)器人雖然成功上市,但盈利情況也不穩(wěn)定,上市以來股價(jià)基本上都在發(fā)行價(jià)以下。
云知聲雖然在終止IPO后就沒有公布過財(cái)務(wù)數(shù)據(jù),但在招股書中,云知聲曾明確表示短期內(nèi)將無法盈利。而從組建團(tuán)隊(duì)到發(fā)布大模型,云知聲只用了5個(gè)月的時(shí)間,這難免又需要大量資金。若無法得到新的融資,云知聲的業(yè)績(jī)將會(huì)繼續(xù)承壓。
云知聲也有一些比較獨(dú)特的AI技術(shù),比如聲音克隆。云知聲的聲音克隆就是復(fù)制一個(gè)與某人幾乎一樣的AI聲音,使用者可以自己上傳文本,并生成通過這個(gè)聲音讀出來的音頻。
前段時(shí)間AI孫燕姿的大火,又一次引發(fā)了人們對(duì)AIGC在語音方面的關(guān)注。云知聲雖然未對(duì)聲音克隆功能做太多宣傳,也還是有不少人想要嘗試。根據(jù)筆者在云知聲微信上線的小程序上的測(cè)試,從聲音采集到生成完畢只用了不到半個(gè)小時(shí)的時(shí)間,生成完畢后再輸入文本,確實(shí)可以得到和筆者朗讀相似的聲音。
或許是因?yàn)樵摴δ茉谖⑿判〕绦蛏现皇怯脕眢w驗(yàn),用戶雖然可以自定義語音內(nèi)容但文本生成的語音無法下載,只能分享由小程序隨機(jī)生成文本生成的音頻,這雖然引來了關(guān)注度,但是如何實(shí)現(xiàn)商業(yè)化則有點(diǎn)令人費(fèi)解。
回顧AI孫燕姿“出圈”不難發(fā)現(xiàn),這不過是2022年AI繪畫大火后在音樂領(lǐng)域的重現(xiàn),雖然操作起來有些門檻,但要掌握并不難。不過,云知聲在C端并沒有什么運(yùn)營經(jīng)驗(yàn),目前似乎也沒進(jìn)入C端的打算,在B端,聲音克隆在醫(yī)療、銷售等領(lǐng)域的應(yīng)用空間也未形成。該功能雖然在文娛等領(lǐng)域確實(shí)存在一定的應(yīng)用前景,但從公開信息來看,云知聲似乎還沒能將服務(wù)范圍擴(kuò)展到文娛行業(yè)的計(jì)劃。
作為一家AI獨(dú)角獸,云知聲肯定是有獨(dú)到之處,但發(fā)布得晚又沒有打算商業(yè)化的特色業(yè)務(wù),在智能語音這個(gè)巨頭林立的行業(yè),想要靠大模型殺出重圍有點(diǎn)難。
(本文僅供參考,不構(gòu)成投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān))