堅(jiān)持自研投入 思必馳讓情感語音“可定制”
隨著科技的進(jìn)步和創(chuàng)新,AI語音技術(shù)在過去的幾年里有了飛躍式的發(fā)展。如今,從智能家居設(shè)備、汽車語音助手到客服支持等領(lǐng)域,會說話的AI助手不斷滲透到我們生活的各個方面,縮短了人與智能設(shè)備間的距離,提高了人們生活和工作的效率。在這個背景下,語音助手和對話型AI設(shè)備逐漸走向“定制化”的發(fā)展浪潮。
注重研發(fā)投入,始終保持技術(shù)先進(jìn)性
要滿足客戶多樣的定制化需求,AI企業(yè)自身需要保持技術(shù)的先進(jìn)性。作為國內(nèi)專業(yè)的對話式人工智能平臺型企業(yè),思必馳始終堅(jiān)持產(chǎn)學(xué)研一體化道路,自主研發(fā)了全鏈路智能語音及自然語言交互關(guān)鍵技術(shù),已形成涵蓋信號處理、語音識別與合成、自然語言理解、對話管理、問答聊天、知識圖譜等閉環(huán)人機(jī)對話的完整技術(shù)鏈條,并多次在國際評測中奪得冠軍,被中國和英國政府評為高新技術(shù)企業(yè)。
目前,思必馳語音識別技術(shù)的抗噪語音識別精度已達(dá)到了業(yè)界前沿的技術(shù)水平。公司通過神經(jīng)因子感知建模、音素同步解碼等系列技術(shù),大幅提升了語音識別系統(tǒng)的抗噪能力、說話人口音快速適應(yīng)能力和語音識別解碼速度。
此外,思必馳自主研發(fā)的深度學(xué)習(xí)聲紋識別模型,通過神經(jīng)網(wǎng)絡(luò)因子表達(dá)方法,對信道、環(huán)境等干擾因素進(jìn)行建模,實(shí)現(xiàn)聯(lián)合優(yōu)化和聲紋表達(dá)的鑒別性提取,顯著提升了聲紋識別對復(fù)雜環(huán)境的抗干擾性。在口語理解、結(jié)構(gòu)化語義分析、機(jī)器閱讀理解等領(lǐng)域,也均研發(fā)了一系列基礎(chǔ)創(chuàng)新AI算法。
上述自主研發(fā)的語音語言技術(shù),在國際通用的基準(zhǔn)測試集合和一系列國內(nèi)外權(quán)威技術(shù)評測中成績名列前茅并屢獲冠軍,例如在語義解析Spider國內(nèi)外評測、中文醫(yī)學(xué)語言理解評測(CBLUE2.0)與國際口語機(jī)器翻譯評測大賽(IWSLT):同聲傳譯任務(wù)(英到中)等比賽中均摘得桂冠,顯示出技術(shù)的領(lǐng)先性,同時也是思必馳技術(shù)創(chuàng)新能力的有力證明。

推出發(fā)音人音色定制平臺 讓AI語音更具“人情味”
近年來,隨著AI語音設(shè)備的不斷普及,企業(yè)對設(shè)備音色的“差異性”與“定制性”要求越來越高。基于此,思必馳推出發(fā)音人音色定制平臺及一句話復(fù)刻功能,可高度模擬發(fā)音人的音色、韻律和停頓習(xí)慣,定制出高興、抱歉、中性、撒嬌等情感豐富的音色,滿足人機(jī)交互、有聲閱讀、智能客服、語音助手、熱門IP、新聞播報(bào)等場景的音色需求。用戶僅需上傳少量數(shù)據(jù)即可定制,簡單快捷無技術(shù)門檻,普通用戶也可快速定制專屬音色。

可以預(yù)見,隨著技術(shù)的更新迭代,未來的人機(jī)交互不再是和冷冰冰的機(jī)器在對話,更像是與最親密的人在聊天。讓AI語音更具“人情味”,這是眾多用戶的需求,也是思必馳等眾多AI語音開發(fā)者正在努力的方向。