散文網(wǎng) » 科技 »汽車 » 一篇文章看透智能座艙的多模態(tài)交互

一篇文章看透智能座艙的多模態(tài)交互

2023-04-01 01:10 作者:智子實驗室Sophon 0人讀過 | 我要投稿

汽車工業(yè)百年史中，座艙也一直在發(fā)展，從過去的機(jī)械化走到今天的電子化，也正在走向智能化。

機(jī)械化時期，座艙使用機(jī)械和簡易物理裝置進(jìn)行單一功能和基本信息地展示；電子化時期，音響、液晶屏等開始廣泛使用，配備音樂、導(dǎo)航等基本功能；智能化時期，互聯(lián)網(wǎng)+、AI、大數(shù)據(jù)等技術(shù)開始上車，座艙成為駕乘人員可以發(fā)號施令的自主舒適智能移動空間。

?

智能座艙在傳統(tǒng)座艙基礎(chǔ)上，人機(jī)交互更加便利和多元化，自動化和網(wǎng)聯(lián)化水平也大大提高。當(dāng)前人機(jī)交互主要還是語音交互，駕駛員可以通過對話，完成常見非駕駛動作的指令。

不過，當(dāng)前智能座艙的語音交互在情感性、多輪對話、喚醒或打斷等方面仍存在一些問題，特別是不能領(lǐng)會命令實質(zhì)。而多模態(tài)交互技術(shù)能夠使人機(jī)交互整個過程更加立體、高效和低誤差，必將成為未來智能座艙發(fā)展最為核心的技術(shù)之一。

?

1．語音交互

語音交互包括語音識別技術(shù)、自然語言處理技術(shù)、語音合成技術(shù)等，也就是通過聲音識別、處理，生成指令要求。在智能座艙中語音交互最常用的場景，包括設(shè)備控制、導(dǎo)航和媒體娛樂三個方面。

可見即可說、連續(xù)對話、音源定位、免喚醒等技術(shù)已開始廣泛搭載，語音交互也將變得更自然；個性化體驗是座艙的目標(biāo)，蔚小理等新勢力從聲音自定義、形象自定義、功能自定義等方面下了很多功夫。比如蔚來Nomi通過擬人化表情形象，在語音交互時增加了視覺反饋，Nomi可以通過屏幕表情給出聆聽、開心、點贊等反饋，提高了駕駛員對語音交互的陪伴感和信任感。

2．手勢識別

手勢是人類最基本的肢體語言，手勢識別要能夠區(qū)分二維手勢和三維手勢。二維手勢指的是簡單地上下、左右、揮動等，如點贊、用手去比劃數(shù)字。三維手勢識別則要通過3D TOF攝像頭進(jìn)行三維手勢檢測。

?

現(xiàn)階段手勢識別主要應(yīng)用在多媒體切換、音量控制、接電話、燈光控制等方面，功能比較單一，還是作為補充交互模態(tài)。以嵐圖追光手勢控制為例，可以支持左右、上下和前后3種動態(tài)手勢及5種靜態(tài)手勢，包括了確認(rèn)、自拍、接聽/拒接電話和播放/暫停等常用功能，結(jié)合四音區(qū)語音系統(tǒng)實現(xiàn)語音+手勢的交互方式。

?

3．DMS

DMS是利用座艙內(nèi)攝像頭、近紅外線等傳感器，基于面部特征分析、頭部姿態(tài)追蹤、視線追蹤、面部表情和情緒識別、身體姿勢追蹤和物體偵測等關(guān)鍵技術(shù)，實現(xiàn)對駕駛員的身份識別，以及疲勞駕駛、分心駕駛等危險行為的檢測功能。主流DMS方案采用近紅外攝像頭拍攝駕駛員眼球運動、面部表情，進(jìn)行計算和AI識別，分析出駕駛員疲勞、分心、危險駕駛等動作信號，以此來提醒駕駛員。

?

3D-ToF傳感器

最近3D-ToF傳感器的DMS方案也開始上車。3D-ToF可定位駕駛員眼神，協(xié)助AR-HUD實現(xiàn)動態(tài)校正。3D ToF是一種無掃描光探測和測距技術(shù)（調(diào)制光源主動照射物體），基于持續(xù)的光脈沖捕捉深度信息（通常短距離）。3D-ToF傳感器方案圖像處理深度精度比2D攝像頭（視頻方案）更高；鏡頭幀率較高，能夠接收動態(tài)信息。

比如理想L9搭載的3D-ToF傳感器，除了駕駛員眼睛注視和頭部跟蹤監(jiān)控外，還將作為后續(xù)多模態(tài)交互的主要硬件載體。

?

L3級別自動駕駛要求駕駛員隨時準(zhǔn)備接管車輛，而DMS能時刻監(jiān)控駕駛員狀態(tài)，滿足L3決策安全性要求，所以現(xiàn)在法規(guī)也有標(biāo)配DMS的趨勢。比如歐盟要求所有新車都要配置DMS，C-NCAP（中國新車評價規(guī)程） 2025版本也加入了駕駛員分神和疲勞監(jiān)控功能的測評。

?

4．OMS

OMS是DMS系統(tǒng)的延伸，可以通過監(jiān)測座艙內(nèi)乘客的狀態(tài)來進(jìn)一步提升安全性能。比如OMS系統(tǒng)能夠監(jiān)測兒童或?qū)櫸锸欠襁z留在車內(nèi)，還可以檢測人員是否使用安全帶。交互或娛樂方面，也可以利用OMS攝像頭完成手勢識別，情緒識別，視頻聊天等功能。

5．HUD

HUD 通常是對傳統(tǒng)儀表板顯示的補充，并提供與駕駛相關(guān)的補充信息，和高級駕駛員輔助系統(tǒng)（ADAS）功能集成在一起，能使駕駛員更輕松地檢測到威脅或警告，從而更快地采取行動。HUD分為C-HUD、W-HUD及AR-HUD：

?

① C-HUD通過放置于組合儀表上方的一個半透明的樹脂板作為投影介質(zhì)反射出虛像，目前已逐漸被市場淘汰。W- HUD和AR- HUD成為主流方案。

②W-HUD主要通過擋風(fēng)玻璃作為投影介質(zhì)來反射成像，可以支持更大的成像區(qū)域和更遠(yuǎn)的投影距離，不過產(chǎn)品光學(xué)結(jié)構(gòu)相對復(fù)雜，成本相對較高。

③AR-HUD相對于W-HUD而言成像區(qū)域更大、投影距離更遠(yuǎn)、成像也更加地生動直觀。

?

AR，即增強(qiáng)現(xiàn)實，是指透過攝像頭看到影像的位置及角度計算，再加上圖像分析技術(shù)，讓屏幕上的虛擬世界能夠與現(xiàn)實世界場景進(jìn)行結(jié)合與交互的技術(shù)。隨著光學(xué)、AR、圖像識別等技術(shù)不斷突破，AR-HUD以一種更加自然的方式呈現(xiàn)在駕駛員前方，從而可以用來提供更多有用的信息，例如導(dǎo)航、威脅識別等。

?

AR-HUD將信息直接顯示在真實道路上，實現(xiàn)這一特性需要通過前視攝像頭對前方的路況進(jìn)行解析建模，得到對象的位置、距離、大小，再把HUD需要顯示的信息精準(zhǔn)地投影到對應(yīng)的位置。

?

AR-HUD產(chǎn)品一般都包含車速、駕駛輔助和導(dǎo)航等信息。同時，融合DMS的眼神追蹤攝像頭，保障畫面跟著眼睛實時動態(tài)調(diào)節(jié)，保持動態(tài)中的相對靜止，減少產(chǎn)生眩暈感，提升AR-HUD體驗感。

?

從去年開始，一線車企已經(jīng)開始把AR-HUD作為高配及新旗艦車型的亮點功能，如紅旗E-HS9、奔馳S級系列、大眾ID系列、飛凡汽車等，理想L9配置AR-HUD顯示屏，甚至取消了駕駛員面前的儀表盤，不過額外在方向盤上加了一塊小尺寸的交互屏。

?

6．AID全息投影

全息投影技術(shù)是利用光的干涉和衍射原理，記錄并再現(xiàn)物體真實的三維圖像。AID即為全息空中智能顯示系統(tǒng)（Aerial Holo Intelligent Display）”。技術(shù)源自于全息投影技術(shù)，不同于HUD需要投射在特制前擋風(fēng)玻璃作為介質(zhì)，AID借助光學(xué)原理投射在空氣中，不需要任何介質(zhì)；其次，只有駕駛員能夠看到HUD投射在玻璃上的信息。而AID采用全彩裸眼3D影像，用戶能夠從各個角度感受到懸浮在屏幕上的真實效果。

AID全息顯示同儀表、中控屏、視覺感知系統(tǒng)和語音交互系統(tǒng)等多維深度協(xié)同，與DMS的視線追蹤和表情識別）、自動駕駛的環(huán)境感知等融合，感知駕駛員的心情以及車外環(huán)境，通過數(shù)字虛擬人進(jìn)行主動關(guān)懷（如音樂電影播放、氛圍燈開啟）、疲勞提醒、危險預(yù)警、天氣提醒、節(jié)日變裝等，可以建立更深層次的情感交流，擁有更多陪伴和樂趣。

在“移動出行第三空間”概念指引下，融合視覺、聽覺、觸覺、文本等多維感知信息，打破單模態(tài)輸入輸出限制，多模態(tài)交互正深度應(yīng)用于智能座艙，在大屏化、多屏化、AR全息無屏化的加持下，智能座艙將會帶來更貼近人類真實使用習(xí)慣的沉浸式座艙體驗。

標(biāo)簽：

一篇文章看透智能座艙的多模態(tài)交互的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

一篇文章看透智能座艙的多模態(tài)交互

一篇文章看透智能座艙的多模態(tài)交互的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

一篇文章看透智能座艙的多模態(tài)交互

本文作者的其他文章

一篇文章看透智能座艙的多模態(tài)交互的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

一篇文章看透智能座艙的多模態(tài)交互的評論 (共條)