機遇與挑戰(zhàn)并存 思必馳“兩手抓”闖關(guān)發(fā)展新路徑
根據(jù)Gartner預測,到2025年,各行業(yè)的AI/ML(機器學習)滲透率將會達到70%以上,AI軟件行業(yè)增長率也將達31%。未來十年,人工智能將進入大規(guī)模商業(yè)落地階段幾乎已在業(yè)內(nèi)達成共識。

毫無疑問,這十年間,行業(yè)競爭將異常激烈,業(yè)內(nèi)企業(yè)將在實踐中集體迎來了AI規(guī)?;涞嘏c持續(xù)經(jīng)營的關(guān)鍵挑戰(zhàn)。對于如何打好這場突圍戰(zhàn),思必馳給出了一個新的解決思路,通過“終端+AI”“行業(yè)+AI”等方式深度賦能各行業(yè)場景,促進諸多應用落地。
自成立以來,思必馳便深諳“技術(shù)為王,創(chuàng)新為本”的重要性,不斷加碼研發(fā)投入。多年的技術(shù)沉淀,如今的思必馳擁有全鏈路的智能語音語言技術(shù),自主研發(fā)了新一代人機交互平臺(DUI)和人工智能芯片(TH1520);為車聯(lián)網(wǎng)、IoT及政務、金融等眾多行業(yè)場景合作伙伴提供自然語言交互解決方案。
在2022年,思必馳發(fā)展勢頭不減,技術(shù)研發(fā)不斷突破自我。
發(fā)音人音色定制平臺
2022年3月,思必馳推出易操作的發(fā)音人音色定制平臺。該平臺是思必馳提供的一項進行音色定制訓練的平臺服務,旨在賦能用戶自主完成語音合成音色模型定制,降低語音合成定制門檻。使用者只需要根據(jù)自身場景需要,上傳一定量符合規(guī)定標準的音頻,即可一站式完成自動標注、模型定制、質(zhì)量評測。

目前,該平臺支持定制中英文、成人男女、兒童等類別,以及幽默、嚴肅、甜美、中性等各種情感風格的音色,可以滿足客戶在消費電子產(chǎn)品、明星動漫熱門IP、數(shù)字人客服、有聲讀物、新聞播報等多個領(lǐng)域的應用需求。
DUI標注訓練一體化平臺2.0
為幫助企業(yè)在智能化轉(zhuǎn)型中,擁有更高的技術(shù)自主性,思必馳曾推出DUI標注訓練一體化平臺,通過平臺化的方式開放智能語音算法能力,賦能不同類行業(yè)/企業(yè)在使用語音服務中,擁有數(shù)據(jù)標注、模型訓練能力,持續(xù)提升場景識別效果。目前平臺提供語音技術(shù)定制化服務,在會議、航空通訊、醫(yī)療、城市交通、門店質(zhì)檢等垂直場景里運用。用以提升企業(yè)服務、管理效率。

而經(jīng)過一年的使用實踐,目前平臺也迎來了2.0的版本升級。升級后,公有云版正式開放,同時推出便攜一體機版本,擁有更強的擴展性,隨用隨調(diào),使用更便捷。更低的平臺使用門檻,減輕研發(fā)人員投入。升級后的平臺支持公有云、私有云、便攜一體機等多種靈活的接入形式,服務均可定制化。
直面喚醒 處處皆是“C位”
針對在全屋智能一體化家居場景或賣場場景下多設備的情況,思必馳新推出“直面喚醒”方案,人站在不同位置,設備可以通過模擬人耳的算法模型可以幫助用戶優(yōu)先喚醒其中某一個設備,避免幾個設備同時被喚醒,判斷更精準、更符合用戶的交互習慣。該方案也入選了長三角2021年度人工智能產(chǎn)業(yè)“十大科技事件”。
DUI平臺上線“單人千音”
12月份,思必馳DUI平臺上線“單人千音”功能。“單人千音”通過深度神經(jīng)網(wǎng)絡對發(fā)音人音色進行建模,實現(xiàn)單個音色就能生成同時覆蓋多種語言、多種風格的語音合成聲音,極大豐富了合成語音的表現(xiàn)力。

目前,單人千音可滿足智能車載、AI客服、視頻配音、智能家居等場景下的使用。
眾多創(chuàng)新技術(shù)的落地轉(zhuǎn)化,需要市場的土壤。7月15日,思必馳正式向科創(chuàng)板發(fā)起沖刺,擬募集資金10.33億元,用于推進產(chǎn)品迭代和技術(shù)創(chuàng)新。招股書顯示,思必馳營收從2019年的1.15億增長至2021年的3.07億,營收逐年提升。
在過去的數(shù)年中,中國AI語音的需求逐漸爆發(fā)。未來,在產(chǎn)品供應商和開發(fā)者共同構(gòu)建產(chǎn)業(yè)生態(tài)圈的過程中,語音識別技術(shù)將更好地與其他語音交互技術(shù)及軟件功能融合,AI語音識別市場將迎來廣闊的發(fā)展空間。依托“終端+AI”“行業(yè)+AI”兩手抓的發(fā)展模式,思必馳將在競爭激烈的市場中披荊斬棘,創(chuàng)新技術(shù)、開拓場景、穩(wěn)中求進,持續(xù)上行發(fā)展。