AI賦能,發(fā)布四款消費(fèi)類新品!科大訊飛如何"頂天立地"?
對(duì)科大訊飛的認(rèn)知,大多數(shù)人還停留在中國(guó)最大的智能語(yǔ)音技術(shù)提供商的層面。實(shí)際上,科大訊飛在多個(gè)領(lǐng)域都有廣泛布局,現(xiàn)已推出覆蓋全行業(yè)的智能產(chǎn)品及服務(wù),引領(lǐng)在消費(fèi)者、智慧教育、智慧城市、智能客服、智能汽車、智慧醫(yī)療、智能家居等領(lǐng)域的深度應(yīng)用,占有中文語(yǔ)音技術(shù)市場(chǎng)70%以上的市場(chǎng)份額。
隨著AI、IoT以及5G等前沿技術(shù)的發(fā)展,科大訊飛正推動(dòng)語(yǔ)音及語(yǔ)言、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)推理及自主學(xué)習(xí)等核心技術(shù)與各行業(yè)的結(jié)合,用AI技術(shù)重新賦能傳統(tǒng)硬件,從而為用戶帶去軟硬結(jié)合的極致體驗(yàn)。

9月1日,科大訊飛在"聲來(lái)即王者"的消費(fèi)類新品發(fā)布會(huì)上,連續(xù)推出訊飛智能錄音筆SR901、SR702、SR101,訊飛首款智能TWS耳機(jī)iFLYBUDS四款新品。科大訊飛輪值總裁胡郁在現(xiàn)場(chǎng)解讀了科大訊飛"頂天立地"的含義,"頂天"就是人工智能核心技術(shù)要保持全球領(lǐng)先。"立地",是不僅有技術(shù),還要它真正變成產(chǎn)品,為廣大用戶產(chǎn)生價(jià)值。而這四款新品正承載了科大訊"To B+To C"的雙輪驅(qū)動(dòng)戰(zhàn)略,讓AI應(yīng)用服務(wù)大眾的初衷。
聚焦AI轉(zhuǎn)寫賽道,消費(fèi)者業(yè)務(wù)發(fā)力
科大訊飛此次發(fā)布三款智能錄音筆新品,補(bǔ)全了智能錄音筆全系列,覆蓋了從入門、旗艦再到尊享版全線機(jī)型。更重要的是,經(jīng)過AI的賦能,解決了傳統(tǒng)錄音筆存在的痛點(diǎn)。

訊飛智能錄音筆SR101是面向職場(chǎng)新人和學(xué)生推出的入門級(jí)新品,標(biāo)配1.4英寸觸摸屏使得轉(zhuǎn)寫實(shí)時(shí)可見,同時(shí)搭載1顆定向麥克風(fēng)+2顆矩陣麥克風(fēng)的組合,四核處理芯片,8GB存儲(chǔ)空間和1500mAh電池容量,在硬件配置上毫不妥協(xié)。SR101售價(jià)599元,轉(zhuǎn)寫終身免費(fèi)并享有3年5GB云空間服務(wù)。

訊飛智能錄音筆SR702為旗艦新品,擁有一體設(shè)計(jì)的3D陶瓷背板和航空級(jí)鋁合金,其采用高密度2600mAh大容量電池,搭載2顆定向麥克和6顆矩陣麥克風(fēng),配置3.5英寸高清屏幕,并配備800萬(wàn)像素?cái)?shù)字變焦后置攝像頭。
訊飛智能錄音筆SR901則是尊享版,采用鋼琴黑全陶瓷機(jī)身,搭載6.01英寸AMOLED屏幕,64GB存儲(chǔ)空間及4000mAh支持18W快充大容量聚合物鋰電池。還擁有豪華三攝配置和2顆哈曼MEMS定向麥克風(fēng)+10顆全向麥克風(fēng)。通過全面升級(jí)的轉(zhuǎn)寫引擎。
值得一提的是,SR702和SR901搭載了行業(yè)首發(fā)的離線轉(zhuǎn)寫、OCR圖文識(shí)別、視頻字幕等新功能,再次拓寬了轉(zhuǎn)寫記錄的易用性和使用場(chǎng)景。此外,三款新品均沿襲了訊飛智能錄音筆識(shí)別準(zhǔn)、錄得遠(yuǎn)、錄得清、語(yǔ)種全四大標(biāo)準(zhǔn)。不僅識(shí)別準(zhǔn)確率達(dá)98%,最遠(yuǎn)拾音距離更是達(dá)到了15米。另外,基于AI算法降噪處理前端語(yǔ)音信號(hào),保證拾音的準(zhǔn)確性,并提供高清無(wú)損音質(zhì)的音頻格式。在關(guān)鍵的語(yǔ)種方面,三款新品都支持12種方言轉(zhuǎn)寫、2種少數(shù)民族語(yǔ)言轉(zhuǎn)寫、8種外語(yǔ)轉(zhuǎn)寫,并經(jīng)過IT科技、醫(yī)療、政法、教育等7大專業(yè)領(lǐng)域轉(zhuǎn)寫優(yōu)化。

除了三款新品,科大訊飛還發(fā)布了首款TWS智能耳機(jī)iFLYBUDS。憑借通話實(shí)時(shí)轉(zhuǎn)寫、智能撥號(hào)識(shí)別、通話譯文對(duì)照三大核心AI功能,能夠輕松滿足商務(wù)人士在自駕、通勤、會(huì)議等多場(chǎng)景中,解放雙手、重要信息記錄和從容溝通的需求。iFLYBUDS支持智能語(yǔ)音助手,只要說(shuō)"小飛小飛"即可快速喚醒語(yǔ)音助手。同時(shí)iFLYBUDS的特點(diǎn)還包括:支持輕擊耳機(jī)交互,并且支持自定義功能;佩戴檢測(cè),摘下耳機(jī)時(shí)暫停播放,再次戴上音樂繼續(xù)。不僅如此,訊飛智能耳機(jī)iFLYBUDS續(xù)航可以滿足日常商務(wù)溝通。

iFLYBUDS還充分考慮了應(yīng)用場(chǎng)景,在常規(guī)電話和網(wǎng)絡(luò)電話會(huì)議中,可以實(shí)時(shí)轉(zhuǎn)寫,轉(zhuǎn)寫準(zhǔn)確率在98%以上。在通話結(jié)束后可以形成智能摘要,自動(dòng)提煉重點(diǎn)內(nèi)容,還支持對(duì)通話內(nèi)容進(jìn)行快速查找、多終端分享(手機(jī)端和電腦端)和編輯。在外語(yǔ)電話交流場(chǎng)景中,iFLYBUDS打造了堪稱逆天的通話譯文對(duì)照功能。在英語(yǔ)通話時(shí),可將通話內(nèi)容實(shí)時(shí)轉(zhuǎn)譯為漢字,輔助英語(yǔ)溝通,是你耳朵上的助理翻譯官,溝通更加自信、簡(jiǎn)單。未來(lái)將會(huì)支持更多的語(yǔ)種。
保持技術(shù)領(lǐng)先,方能頂天立地
在科大訊飛副總裁李傳剛看來(lái),"技術(shù)革新與消費(fèi)升級(jí)雙輪驅(qū)動(dòng),將出現(xiàn)巨大的顛覆式創(chuàng)新機(jī)會(huì),并催生新的領(lǐng)導(dǎo)品牌。訊飛智能錄音筆和訊飛智能耳機(jī)均是這一理念的實(shí)踐。通過頂尖的AI語(yǔ)音技術(shù)、優(yōu)質(zhì)的硬件和軟件三位一體,打造極致便捷的體驗(yàn),幫助用戶有效提升效率,享受高品質(zhì)智慧生活。

以轉(zhuǎn)寫引擎技術(shù)為例,訊飛智能錄音筆SR901和SR702兩款新品在行業(yè)率先搭載了離線轉(zhuǎn)寫功能。無(wú)需4G/WIFI網(wǎng)絡(luò),用戶也能實(shí)現(xiàn)語(yǔ)音實(shí)時(shí)轉(zhuǎn)文字、轉(zhuǎn)寫后的文字內(nèi)容即刻保存,離線轉(zhuǎn)寫準(zhǔn)確率高達(dá)95%,無(wú)懼?jǐn)嗑W(wǎng)環(huán)境。同時(shí)離線轉(zhuǎn)寫也防止了高度機(jī)密信息的泄露,保障了用戶信息安全和特有轉(zhuǎn)寫需求的實(shí)現(xiàn)。同時(shí),通過SR901和SR702的攝像頭可將圖片上的文字內(nèi)容提取出來(lái)并實(shí)時(shí)呈現(xiàn),便于用戶實(shí)現(xiàn)重要音頻和圖文信息的混合記錄,用于后期記錄及整理。同時(shí),這兩款新品還支持錄制視頻、實(shí)時(shí)收音并實(shí)時(shí)生成字幕,同時(shí)后期也可編輯字幕,打造多場(chǎng)景重要信息記錄的全新AI交互體驗(yàn)。
在訊飛智能錄音筆前端降噪處理上,通過訊飛原創(chuàng)神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)信號(hào)處理深度結(jié)合的降噪算法(SSA-IME),可以有效降低環(huán)境干擾噪聲。除了硬件,訊飛大力投入語(yǔ)音識(shí)別后處理技術(shù)并運(yùn)用到訊飛智能錄音筆上,先后上線語(yǔ)氣過濾詞、口語(yǔ)規(guī)整、文本語(yǔ)義分段、文本智能摘要等文本理解能力。針對(duì)多人交談會(huì)議場(chǎng)景,上線了分離與ASR聯(lián)合建模的說(shuō)話人分離方案,說(shuō)話人分離的準(zhǔn)確率達(dá)到95%讓用戶能夠快速檢索到目標(biāo)說(shuō)話人數(shù)據(jù),提升編輯體驗(yàn)。
在人工智能落地過程中,訊飛消費(fèi)者業(yè)務(wù)連續(xù)三年保持超過30%的高增速。隨著訊飛智能硬件產(chǎn)品體系不斷完善,C端營(yíng)收占比在2020年上半年達(dá) 37.59%。在AI轉(zhuǎn)寫賽道上,訊飛打造的智能硬件成為用戶的知識(shí)管理工具,并逐步開啟高效記錄新時(shí)代。
嚴(yán)格要求自身,堅(jiān)持源頭技術(shù)創(chuàng)新
縱觀行業(yè)龍頭的崛起都離不開企業(yè)的核心競(jìng)爭(zhēng)力,人工智能企業(yè)同樣如此。為了保持技術(shù)領(lǐng)先,科大訊飛一直堅(jiān)持技術(shù)創(chuàng)新,強(qiáng)化企業(yè)核心競(jìng)爭(zhēng)力,在研發(fā)投入上已經(jīng)連續(xù)6年超營(yíng)收20%。據(jù)科大訊飛近日發(fā)布的2020年上半年財(cái)報(bào)顯示,科大訊飛營(yíng)收43.49億元,同比增長(zhǎng)2.86%;凈利潤(rùn)2.58億元,同比增長(zhǎng)36.28%。財(cái)報(bào)顯示,科大訊飛將其20%的營(yíng)收約9.62億元用于研發(fā)。

研發(fā),只是保持領(lǐng)先的秘訣之一。從最早的支撐軟件及行業(yè)應(yīng)用到教育大賽道,再到目前司法、消費(fèi)者等明星賽道業(yè)務(wù),訊飛不斷拓展技術(shù)的商業(yè)應(yīng)用領(lǐng)域?yàn)樗麕?lái)了強(qiáng)勁增長(zhǎng)。伴隨語(yǔ)音交互應(yīng)用泛化,AI+行業(yè)應(yīng)用深化,更多新增長(zhǎng)點(diǎn)值得期待。而胡郁也在前場(chǎng)表示,為了保持公司在人工智能領(lǐng)域的競(jìng)爭(zhēng)水準(zhǔn),每年都會(huì)參加大量的國(guó)際比賽,來(lái)驗(yàn)證技術(shù)創(chuàng)新是否處于源頭。以語(yǔ)音轉(zhuǎn)寫功能應(yīng)用到的語(yǔ)音識(shí)別技術(shù)為例,早在2016年9月,在業(yè)界影響力最大、參賽隊(duì)伍最多、水平最高的國(guó)際多通道語(yǔ)音分離和識(shí)別大賽CHiME-4中,科大訊飛包攬了全部三個(gè)項(xiàng)目的冠軍;2018年再次包攬CHiME-5大賽全部四個(gè)項(xiàng)目的冠軍并大幅刷新了各項(xiàng)目的最好成績(jī);2020年的CHiME-6,在被稱為"史上最難的語(yǔ)音識(shí)別任務(wù)"中,科大訊飛不僅在給定說(shuō)話人邊界的多通道語(yǔ)音識(shí)別兩個(gè)參賽任務(wù)上奪冠,更一鼓作氣刷新自己在CHiME-5中46.1%的語(yǔ)音識(shí)別錯(cuò)誤率冠軍成績(jī),直降至30.5%。
近期在VoxSRC國(guó)際說(shuō)話人識(shí)別比賽限定訓(xùn)練數(shù)據(jù)任務(wù)中(公開刷榜階段),科大訊飛刷新世界紀(jì)錄,等錯(cuò)誤率(EER)降低到0.81%。同時(shí),科大訊飛在學(xué)術(shù)界公開測(cè)試集合VoxCeleb1上取得0.63%的EER,是截止目前的State Of The Art(最好結(jié)果),上述兩個(gè)新紀(jì)錄表明科大訊飛說(shuō)話人識(shí)別技術(shù)站在了世界前列。
曾經(jīng)中國(guó)的科技水平一直處于落后的狀態(tài),但在華為、科大訊飛等科技企業(yè)的努力趕超,終于在全球領(lǐng)域有了一席之地。而中國(guó)科技水平的快速發(fā)展讓處于"霸主"地位的美國(guó)感受到了危機(jī),于是它采用各種手段來(lái)阻礙中國(guó)科技企業(yè)的發(fā)展。胡郁也在此次發(fā)布會(huì)上回應(yīng)了公司被列入美國(guó)實(shí)體清單,他表示,科大訊飛堅(jiān)持源頭技術(shù)自主創(chuàng)新,擁有的核心技術(shù)全部來(lái)自科大訊飛的自主研發(fā),擁有自主知識(shí)產(chǎn)權(quán)。而被列入"實(shí)體清單"之后,也并沒有對(duì)科大訊飛造成多大的影響。