云會議們開始打群架
導(dǎo)語:
正在舉行的北京InfoComm China,是亞太最具影響力的專業(yè)視聽及集成體驗展,但業(yè)內(nèi)人士更傾向于認為,這其實是一場云會議市場的“生態(tài)展”。
雖然現(xiàn)場展示的各種會議硬件五花八門、無所不有,但在各類硬件的開屏畫面中,展示其支持的云會議服務(wù)提供商的認證LOGO時,不難發(fā)現(xiàn)這個市場的集中度其實相當(dāng)之高,即主要是由互聯(lián)網(wǎng)廠商發(fā)展而來的專業(yè)會議服務(wù)提供商在主導(dǎo),如騰訊會議、釘釘會議等。
而且,更耐人尋味的是,絕大多數(shù)硬件廠商都獲得了兩家以上的、處于競爭位置的云會議提供商的認證或授權(quán),更顯示了這是一個無邊界的殘酷市場,一個正在“打群架”的市場。

1. 云會議“打群架”白熱化
2020年以來三年間的特殊背景,造成了傳統(tǒng)會議市場的徹底改變和云會議巨頭的崛起。
早期的軟硬件深度捆綁、由專業(yè)會議硬件廠商主導(dǎo)的市場格局已被徹底打破——得益于移動互聯(lián)網(wǎng)和云計算的發(fā)展,網(wǎng)絡(luò)資源的成本極速下滑,互聯(lián)網(wǎng)出身的巨頭企業(yè)得以利用自身先天的資源、技術(shù)優(yōu)勢,把需求側(cè)市場的門檻拉低到近乎為零。
云會議看著并不復(fù)雜,但底層需要強大的音視頻算法能力,后端需要龐大的彈性云端資源,使得供給側(cè)市場的實際門檻極高,這里沒有“小而美”,明面上是各個軟硬件解決方案商的炮火連天,背后其實是少數(shù)幾個巨頭的 “生態(tài)戰(zhàn)爭”,也就是“打群架”。
比如釘釘會議,從明面看,此次會上宣布音視頻開放算法已商用,將通過算法、軟件能力、硬件能力、整機和模組五種方式去贏得生態(tài)伙伴的“擁抱”的策略,其實質(zhì)則是徹底放棄自研硬件,走純軟件+生態(tài)戰(zhàn)略的又一次深化和強化。

而這,也是2022年3月,釘釘宣布推出釘閃會等五種認證,整個音視頻硬件體系開始生態(tài)化后的又一劑“猛藥”。
不得不說,釘釘會議后來在產(chǎn)品上從快到慢,聚焦體驗,在生態(tài)建設(shè)上奮起直追,全面開放,和其在歷史上走的幾步彎路,實在關(guān)系重大。
如果單論發(fā)布時間,釘釘在2017年就上線語音電話、視頻會議功能,遠遠早于騰訊會議。
而盡管騰訊會議最初是一個只為5萬DAU設(shè)計的、帶有一定試驗性質(zhì)的視頻會議系統(tǒng)。但誰也沒有想到,這款云會議單品,竟然在區(qū)區(qū)的245天之后,就擁有了自己的第1億名用戶,成為云會議市場的領(lǐng)先者。
回看當(dāng)時騰訊會議vs釘釘?shù)牟呗?,會發(fā)現(xiàn)釘釘體系走了一些彎路。
——從戰(zhàn)略決心來看,2022年的釘釘體系較之彼時企業(yè)微信體系的整體優(yōu)勢較大,同時也是疫情期間遠程辦公需求暴增的最大受益者之一,“整體贏麻了”,故此對騰訊在單點創(chuàng)新上強勢反擊的應(yīng)對準(zhǔn)備不足;
——從產(chǎn)品特點來看,騰訊會議聚焦于“開會”這一場景,更純粹、也更容易獲得心智認知,當(dāng)時火起來的一批會議軟件也多有類似特點,如Zoom等;
——從用戶體驗來看,騰訊會議有騰訊多年積累的音視頻技術(shù)優(yōu)勢,更重要的是,用戶并不需要下載企業(yè)微信甚至個人版微信,只要用手機驗證碼注冊下載即可使用,而釘釘會議則需要下載釘釘并注冊認證,同時用戶還需要在諸多功能中找到“隱藏”的會議功能。
但是,釘釘并不是一個輕易說放棄的玩家。
2. 快慢之間:打磨細節(jié)體驗,也追趕最前沿技術(shù)
在意識到騰訊會議已經(jīng)取得一個身位的優(yōu)勢后,釘釘會議開始奮起直追。
資源也及時到位,2021年的11月15日,釘釘宣布成立音視頻事業(yè)部,下設(shè)釘釘蜂鳴鳥音頻實驗室,聚焦研究音頻技術(shù)及算法創(chuàng)新,后來又收購了音視頻云服務(wù)公司拍樂云的核心技術(shù)團隊。
但釘釘團隊卻發(fā)現(xiàn),技術(shù)的提升和用戶體驗的提升并不能直接劃等號,很多時候用戶的需求是很微妙的,例如,有很多用戶強調(diào)開會的時候“沉浸感”不夠。
“沉浸感”是一個沒有客觀標(biāo)準(zhǔn)的優(yōu)化方向,所以釘釘團隊從細節(jié)入手,開始提升一些看上去很小的亮點。比如,大部分人在會議時都會在發(fā)言和靜音之間切換,釘釘會議就把這個功能極簡化,使得在會議過程中想發(fā)言時,不需要挪動鼠標(biāo),長按空格就可臨時發(fā)言,松開就自動閉麥。
產(chǎn)研團隊的動作很快,僅半年時間,釘釘會議就發(fā)布了 100多項產(chǎn)品體驗優(yōu)化和數(shù)百項技術(shù)優(yōu)化,使得產(chǎn)品界面更簡潔了、操作更快捷、開會也更流暢了。事實證明,這些細節(jié)都非常討喜。
當(dāng)然,僅僅微調(diào)細節(jié)是不夠的,趕超還要追趕最前沿的技術(shù)。
在這方面,釘釘音視頻技術(shù)團隊把人工智能技術(shù)引入到了整個音頻鏈路中,讓 AI 模型不僅僅用在降噪、去回聲和去混響上,也在研究如何用于丟包補償,音頻超分和編解碼器。本次大會上重點發(fā)布的算法賦能,就是這些AI算法的真實落地,它們將會陸續(xù)應(yīng)用到釘釘會議的各個合作硬件中,讓整個生態(tài)都提升為全帶語音 AI 降噪的會議平臺。
3. 自研or開放的分界線,最后一款自研硬件F2
2020年以前,釘釘是為數(shù)不多的、定位于一個辦公協(xié)同套件而又有規(guī)模不小的硬件自研團隊的一個體系。
帶著自研硬件這種歷史慣性,釘釘在早期對于會議硬件產(chǎn)品是自研還是開放生態(tài)化,實際上是相當(dāng)?shù)膿u擺。早期曾和知名會議硬件廠商聯(lián)合摸索過打造終端,也曾拒絕過希望集成和打通的設(shè)備商。
究其根本,還是當(dāng)時釘釘會議的整個硬件戰(zhàn)略并沒有梳理清楚,其中,自研硬件并追求軟硬件完美閉環(huán)的想法,一度占據(jù)上風(fēng)。
而相應(yīng)來看,騰訊會議在非常早期就宣布不做硬件產(chǎn)品,專注做好平臺及標(biāo)準(zhǔn)SaaS服務(wù),這就是著名的“被集成”戰(zhàn)略,對騰訊會議快速建設(shè)伙伴生態(tài)起到了重要的作用。
其實,做軟硬件閉環(huán)和主動被集成,如果純從戰(zhàn)略角度來說,并無高下之分。
蘋果體系就是典型的全閉環(huán),保證了蘋果能夠?qū)崿F(xiàn)端到端優(yōu)化,系統(tǒng)的安全性和生態(tài)的“純凈度”都有充分的保證;而谷歌的安卓基本是全開放策略,雖然這也不免導(dǎo)致泥沙俱下,但在智能設(shè)備操作系統(tǒng)的總體市場占有率上,安卓遠遠高于IOS陣營。
釘釘目前的最后一款自研硬件是F2,這是一款相對于F1機型進行重大迭代的標(biāo)志性產(chǎn)品,主要解決中大型會議問題,集合了諸多的黑科技,具有強大的競爭力。
釘釘相關(guān)負責(zé)人告訴筆者,F(xiàn)2一體機的研制,從技術(shù)上來說是一個非常正確的決定。為了打造F2,釘釘會議惡補了一批音視頻技術(shù)方面的算法、軟件、硬件、工程等方面的“短板課”,相當(dāng)于“讀了一個音視頻領(lǐng)域的博士生”,這些行業(yè)know-how的獲取和軟硬件、算法上的突破,打造了釘釘會議獨有的差異化優(yōu)勢。
“事實上,如果沒有F2研發(fā)上的一路顛簸,我們不會在音視頻技術(shù)、會議軟件和硬件結(jié)合、工程設(shè)計等方面那么快的補齊短板,也就無法更通透的了解硬件伙伴的需求點和困難點,以及如何與生態(tài)伙伴協(xié)同”,釘釘音視頻的生態(tài)負責(zé)人說:“所以說F2的研發(fā)成功是釘釘會議的一個里程碑,也并不為過?!?/p>
只不過,從產(chǎn)品的角度來看,F(xiàn)2的自研價值極大;而從戰(zhàn)略的角度,F(xiàn)2可謂“出世即末代”,它不再是一款單品,而是在上線之時就被定義為一款“音視頻能力的開放容器”。
這也意味著,釘釘選擇了一條更高效、但也更硬核的打法——用類似競爭對手的策略,希望在正面戰(zhàn)場上硬碰硬的開始一場對決。
4. 認證決定下限,賦能決定上限
釘釘會議所面臨的是一個異常復(fù)雜的市場。
這個市場的特點是,硬件廠商大多會和不止一家會議服務(wù)提供商合作,兼容性越強,就越好賣;而這種背景下,軟件平臺的賦能越有效率、越有深度,就越容易占據(jù)優(yōu)勢。為此,釘釘提出了五種認證和五種賦能方式。
先推出認證體系,時隔一年再推出賦能體系,并不是一種巧合。
前面曾敘及,開放生態(tài)面臨的問題是容易泥沙俱下,為了使用戶的體驗保證在一個水準(zhǔn)之上,認證體系就起到了非常重要的作用。
認證體系決定了產(chǎn)品體驗的下限,而賦能體系決定了產(chǎn)品創(chuàng)新的上限。
我們重點將分析釘釘在InfoComm大會上面向生態(tài)伙伴推出的音視頻算法開放的新策略。
首先,這個能力的開放前提,是釘釘會議通過放棄自研,使自己處于更加中立的地位,讓第三方伙伴有更強的創(chuàng)新動力,同時不與伙伴在硬件層面產(chǎn)生競爭。
而由于雙方的策略都不設(shè)置排他屬性,絕大多數(shù)的硬件廠商都可以選擇同時接受兩家及以上競爭企業(yè)的認證,這意味著市場將徹底進入“打群架”的狀態(tài)。
但認證可以兩家都去接受,賦能卻未必能(不絕對),因為同一個硬件很難容納兩套軟件邏輯,因而,最終決定勝負的,是誰能夠給集成廠商帶來更好的賦能和更多的利益。
在釘釘會議的賦能體系中,“算法被集成”是首要的路徑,說來其實也很簡單,就是將智能音頻、智能導(dǎo)播、遠場拾音等算法原子化后開放給伙伴。
現(xiàn)在在云會議市場中應(yīng)用的算法,并不是普通的算法,所指的都是結(jié)合人工智能技術(shù)中的音頻算法或視頻算法模型。
比如,就音頻3A算法而言,就需要大量的噪音樣本訓(xùn)練,來去除會議中的環(huán)境噪音和干擾音。再比如,在大型線下會議室里,需要解決每個發(fā)言人說話都能夠被遠端聽到的問題,即便是相距10米。此外,還需要解決發(fā)言人在說話時被聚焦的問題,實時保持在畫面C位。
運用人工智能和深度學(xué)習(xí)模型是至關(guān)重要的,可以說如果信號處理的基礎(chǔ)框架沒有和AI做配合,即使是大參數(shù)模型來了也無從落地。
這也是為什么遠程會議進入云原生階段后,軟件平臺的價值快速超過了硬件平臺,這是由“算法定義軟件,軟件定義服務(wù)”的必然邏輯決定的,也是釘釘賦能的底氣。
以影石Insta360為例,這是一家全球全景相機市場第一的智能影像品牌,2022年開始涉足視頻會議市場。

但是,雖然影石科技擁有深厚的視頻技術(shù)積累,但在音頻3A算法能力上卻沒有積累,也沒有做過會議硬件。故此,影石提出希望獲得釘釘F2上使用的音頻算法、硬件工程化方案。
而釘釘果斷開放了這些能力,使得影石在視頻會議硬件終端領(lǐng)域的基礎(chǔ)研發(fā)能力大幅度提升,具備了與F2機相當(dāng)?shù)倪h距離拾音、智能降噪和聲源定位等能力,和釘釘也從早期的客戶關(guān)系,成長為生態(tài)伙伴關(guān)系。
也并非所有的賦能都要從算法層面開始,例如在釘釘會議的rooms這種特定場景中,就可以將算法及能力打包在釘釘會議rooms內(nèi),通過軟件形態(tài)向生態(tài)輸出。例如,釘釘會議就和英特爾聯(lián)合推出了的新一代智能化釘釘會議Windows Rooms,這種降維打擊能力的獲得,與釘釘開放軟件能力和英特爾開放硬件能力上的徹底和通透,也關(guān)系密切。
而此前我們反復(fù)提及的釘釘F2,也大有用武之地。當(dāng)初,F(xiàn)2選定高通平臺后,釘釘會議的研發(fā)團隊自我審視,認為由自己做核心智能模組并不經(jīng)濟,于是在高通的推薦下找到了創(chuàng)通聯(lián)達。
其中,釘釘負責(zé)整機的定義和輸出音視頻算法,而創(chuàng)通聯(lián)達則包下了模組的打造工作,最后,這一產(chǎn)品得以問世后,直接通過ODM的形式對外推出,獲得大量的海外訂單。
而雙方開發(fā)的核心模組則直接成為另一種賦能方式,直接提供給許多需要嵌入模組能力的硬件企業(yè),可以說,釘釘會議為F2流的每一滴汗水都沒有被浪費。
可以說,由于釘釘會議非常及時的調(diào)整了策略,充分發(fā)揮了身段的柔軟和賦能方式的多樣化,使得其在生態(tài)建設(shè)、海外市場、渠道市場等方方面面都開始贏得主動,加之釘釘套件的用戶規(guī)模和市場優(yōu)勢,使得其快速縮小了與騰訊會議在細分賽道的差距。
某種意義上,說是生態(tài)策略的改變才改變了釘釘會議的發(fā)展道路乃至命運,也并不為過。
結(jié)語: 會議市場的終局模式是什么?
值得思考的一個問題是,云會議市場是否存在終局模式?
事實上,作為一個資源、技術(shù)、能力、渠道都要求非常高的市場,目前云會議市場的集中度已經(jīng)非常之高,基本形成了騰訊會議和釘釘會議的兩強格局。
筆者認為,真正會影響到未來的終局模式的,一個是大模型等先進技術(shù)的應(yīng)用落地,另一個就是生態(tài)格局,而后者更為關(guān)鍵。
音視頻算法的大模型在某種程度上決定了未來會議產(chǎn)品基礎(chǔ)體驗的天花板有多高,而生成式AI大模型則是在業(yè)務(wù)場景層的最大變量。
特別是基于生成式AI能力,釘釘會議推出的一系列AI功能,讓會議的基本形態(tài)都開始發(fā)生變化:智能生成重點突出、章節(jié)清晰的會議紀(jì)要、用自然語言“指揮”會議系統(tǒng)、“以文生圖”來為對話生成多樣化的虛擬背景……這些都可以為企業(yè)用戶帶去更高效的開會體驗,甚至已經(jīng)在逐步變革人們的工作協(xié)作方式乃至組織形態(tài)。
在這一點上,釘釘會議無疑在生成式AI的落地突破上有巨大的想象空間。
而另一變量則是生態(tài)建設(shè),生態(tài)建設(shè)將決定是否有足夠多的用戶參與催生基于新需求和新場景的創(chuàng)新;是否有足夠多高價值數(shù)據(jù)的產(chǎn)生;是否有足夠大的用戶體量參與攤薄成本等等,這一切都需要生態(tài)伙伴的充分參與。所謂的五種認證和五種賦能,本質(zhì)上還是想把生態(tài)做大,而前提是,只有先讓生態(tài)硬件廠商找到新的生意、拓展到新的市場,才能收獲生態(tài)帶來的回報。
因此,會議市場的終局模式之戰(zhàn),即是AI大模型等前沿技術(shù)的落地之戰(zhàn),也是生態(tài)建設(shè)之間的終極PK。