頻頻“翻車”的搜狗AI錄音筆,真的是業(yè)內(nèi)領(lǐng)先嗎?
?

編輯 | 于斌
出品 | 于見(ID:mpyujian)
未來在線辦公的形態(tài)到底會發(fā)展到什么樣的程度?這是這段時間以來很多企業(yè)都在認(rèn)真思考的問題。疫情之下,智能辦公、遠(yuǎn)程辦公正成為風(fēng)口。
就在不久之前,搜狗全新發(fā)布的AI錄音筆產(chǎn)品引起了我們的注意。用人工智能與硬件產(chǎn)品的結(jié)合來解決專業(yè)的“錄音轉(zhuǎn)文稿”痛點(diǎn),這個細(xì)分領(lǐng)域開始成為很多公司聚焦的方向。
2月底,搜狗舉辦了一場線上新品發(fā)布會,發(fā)布了旗下多款搜狗AI智能錄音筆新品。在搜狗語音識別技術(shù)賦能之下,據(jù)稱該系列AI錄音筆產(chǎn)品的語音轉(zhuǎn)文字準(zhǔn)確率可以達(dá)到98%,此外還有AI降噪、自由對話翻譯、個人同傳等功能。
需要指出的是,在AI錄音筆這一垂直領(lǐng)域并非只有搜狗這一個玩家,以百度、科大訊飛、谷歌等為代表的AI巨頭都深入布局。在這種背景下,以輸入法起家的搜狗就難免會面臨與頭部AI企業(yè)的直接對比。
主打賣點(diǎn)頻頻“翻車”,搜狗錄音筆遭質(zhì)疑
按照官方介紹,搜狗AI智能錄音筆具備強(qiáng)大的AI 實(shí)力,擁有業(yè)內(nèi)領(lǐng)先的轉(zhuǎn)寫準(zhǔn)確率,而這也是錄音筆產(chǎn)品最為核心的賣點(diǎn)。
對于錄音筆產(chǎn)品的核心受眾來說,如何將錄音更高效、智能、準(zhǔn)確地轉(zhuǎn)換成文本是最大的痛點(diǎn),如果使用產(chǎn)品之后還需要反復(fù)進(jìn)行聽寫、比對、校正才能最終成稿,那么AI錄音筆產(chǎn)品就跟傳統(tǒng)的錄音筆、錄音設(shè)備沒有多大區(qū)別了。
從第一款A(yù)I錄音筆產(chǎn)品C1開始,搜狗錄音筆就將“錄音一小時,出稿5分鐘”作為主打賣點(diǎn),再加上搜狗輸入法詞庫等相關(guān)領(lǐng)域的積累,似乎搜狗AI錄音筆產(chǎn)品是可以給用戶帶來良好的錄音轉(zhuǎn)文本體驗(yàn)的。
可事實(shí)上,搜狗AI錄音筆的實(shí)際使用體驗(yàn)并不如大家想象的那么美好。
就像很多用戶曾經(jīng)反饋過的那樣,他們在使用搜狗AI錄音筆產(chǎn)品時,往往并不能做到所謂的“錄音一小時,出稿5分鐘”,文本的語言邏輯和識別錯誤情況很多,錄音轉(zhuǎn)文本后經(jīng)常需要你花費(fèi)大量的時間進(jìn)行重聽、校正與修改。考慮到現(xiàn)實(shí)生活中的錄音場景畢竟比不得標(biāo)準(zhǔn)的播報場景,在日常工作、會議等場景下,搜狗AI錄音筆產(chǎn)品的識別能力和語句邏輯上體驗(yàn)并不好。
客觀來看,市面上所有的AI錄音筆產(chǎn)品當(dāng)然都無法做到“零修改”,但是即便部分語句識別的并不準(zhǔn)確,整體文本的邏輯性與通順程度仍然至關(guān)重要。只有這樣,用戶在二次校正的時候才能做到花更少的時間進(jìn)行修改。
“正常的中國人看不懂吧”、“的確不好用啊,距離嘴唇幾厘米說話,還能錯字”、“千萬別買了!轉(zhuǎn)換率能到95,我把它吃了”、“翻譯出來的東西慘不忍睹”......以搜狗AI智能錄音筆C1為例,這些都是該款產(chǎn)品在京東上的代表性用戶差評。
另外,針對最新推出的S1、E1等幾款新品,兩款產(chǎn)品的售價都比原先幾百元的C1產(chǎn)品高出了不少,E1要在京東上要1298元,S1更是售價達(dá)到了2698元。
那么這樣大幅的產(chǎn)品高端化價格提升有沒有讓搜狗AI錄音筆的核心錄音轉(zhuǎn)文本能力得到提升?
從目前的情況來看,可能并沒有,因?yàn)楹诵牡恼Z音識別能力和文本邏輯調(diào)教還是那些技術(shù)。那么這么高的溢價體現(xiàn)在哪里?可插卡、多語言翻譯、高清降噪、收音能力更強(qiáng)......搜狗AI錄音筆好像正在往智能手機(jī)的方面上發(fā)展,卻并未能在核心錄音轉(zhuǎn)文本上有本質(zhì)提升。
此外,搜狗AI錄音筆產(chǎn)品還存在耗電較大、待機(jī)時間不長等相關(guān)投訴,這些問題都直指AI錄音筆產(chǎn)品的基本使用體驗(yàn)。一直以來,對錄音筆強(qiáng)“剛需”的人群基本都是需要進(jìn)行會議采編、會議翻譯的工作人員等,它們一方面要求錄音轉(zhuǎn)文本的效率,另一方面要求產(chǎn)品耐用、可持續(xù)使用的時間長,但在這兩點(diǎn)上搜狗AI錄音筆產(chǎn)品做得并不好。
從這些角度上看,2698元的搜狗AI錄音筆S1雖然看起來是大屏顯示、具備多語言翻譯機(jī)功能,但這些功能似乎只是幫助產(chǎn)品實(shí)現(xiàn)了高溢價,卻并未能讓產(chǎn)品在基本的用戶需求上實(shí)現(xiàn)突破。
不容樂觀的是,在搜狗AI錄音筆產(chǎn)品錄音轉(zhuǎn)文本功能受到質(zhì)疑的背景下,其多語言翻譯的同聲傳譯功能同樣不能受到業(yè)內(nèi)人士的認(rèn)可,這更加深了對于產(chǎn)品在實(shí)際應(yīng)用場景中頻繁“翻車”的吐槽。
還有一點(diǎn)不得不提的是,搜狗AI錄音筆的語音轉(zhuǎn)錄功能是收費(fèi)的,這也讓它面臨著“技術(shù)水平撐不起價格”的廣泛質(zhì)疑。
競品口碑更好,搜狗AI錄音筆任重道遠(yuǎn)
在AI錄音筆這一賽道,搜狗的技術(shù)積累并沒有太大的優(yōu)勢,這可能是搜狗AI錄音筆產(chǎn)品目前在行業(yè)中的最大隱患。
盡管AI錄音筆行業(yè)還在發(fā)展期,但該領(lǐng)域的未來發(fā)展?jié)摿κ枪J(rèn)的巨大,此時搜狗AI錄音筆如若不能搶占優(yōu)勢、獲得用戶認(rèn)可的話,那么它的未來將會走的更加艱難。
以同類競品進(jìn)行對比來看,比如訊飛錄音筆在用戶層面的口碑就比搜狗錄音筆要好。
同樣是官方宣稱的識別準(zhǔn)確率達(dá)到98%、“1小時的會議錄音,5分鐘即可轉(zhuǎn)寫完成”,訊飛錄音筆產(chǎn)品的實(shí)際轉(zhuǎn)錄體驗(yàn)要比搜狗錄音筆好得多。
這可能是因?yàn)橛嶏w錄音筆的語音識別模塊采用了科大訊飛基于深度全序列卷積神經(jīng)網(wǎng)絡(luò)的語音識別框架,再加上科大訊飛長期以來在語音識別領(lǐng)域的領(lǐng)先優(yōu)勢,最終讓語音轉(zhuǎn)文字的結(jié)果變得更加“靠譜”。
據(jù)悉,訊飛錄音筆的智能轉(zhuǎn)寫引擎在轉(zhuǎn)寫過程中會針對整句語音識別結(jié)果及時調(diào)整,利用相關(guān)聲學(xué)信息、語言模型等進(jìn)行重新評估來給出更合理可靠的轉(zhuǎn)錄結(jié)果。與此同時,產(chǎn)品還會對整句進(jìn)行口語規(guī)整操作,去除語氣詞、無意義的詞、重復(fù)詞或調(diào)整詞序,用這些技術(shù)來實(shí)現(xiàn)文字轉(zhuǎn)寫結(jié)果的流暢性、可閱讀性。
而一旦語音轉(zhuǎn)錄的結(jié)果變得整體流暢、可讀了,用戶才能在二次校正時省去更大的精力,這與搜狗錄音筆轉(zhuǎn)錄后出現(xiàn)的大量不流暢內(nèi)容形成了鮮明對比。
再加上自定義標(biāo)簽方便檢索、邊錄邊譯等亮點(diǎn)功能,訊飛錄音筆在整體轉(zhuǎn)錄、同聲傳譯上的表現(xiàn)相對更加優(yōu)秀,搜狗錄音筆還有很長的一段路要走。