Meta為全天候AR眼鏡設(shè)計(jì)了AI系統(tǒng)的八大指導(dǎo)方針
眾所周知,Meta不僅局限在Quest這類(lèi)VR頭顯上,同時(shí)還在打造更輕量化的AR眼鏡,目標(biāo)就是讓產(chǎn)品更好的融入到人們的日常生活中去。除了硬件上輕量化以外,在功能和交互體驗(yàn)上也至關(guān)重要,例如自然交互方式,比如手勢(shì)輸入,以及AI視覺(jué)助手等,這其中和計(jì)算機(jī)視覺(jué)和AI技術(shù)密不可分。
AI技術(shù)將會(huì)是AR眼鏡的重要組成部分,通過(guò)實(shí)時(shí)給用戶(hù)提供回答和建議等幫助(例如推薦導(dǎo)航路線(xiàn)、甚至日程、根據(jù)喜好推薦菜品等)來(lái)提升AR眼鏡的實(shí)用性,將會(huì)成為Meta AR眼鏡的賣(mài)點(diǎn)之一。尤其是,考慮到Meta近年來(lái)在AI技術(shù)上的投入,我們完全有理由相信這一點(diǎn)。

Reality Labs公布了一項(xiàng)研究:XAIR,從中我們可以了解到AR眼鏡中AI系統(tǒng)的設(shè)計(jì)準(zhǔn)則。該框架基于可解釋人工智能框架(XAI)和人機(jī)交互(HCI)等研究,其中內(nèi)含8大設(shè)計(jì)準(zhǔn)則,可為AR眼鏡的AI設(shè)計(jì)提供有價(jià)值的參考。

實(shí)驗(yàn)中使用了HoloLens頭顯
什么是XAI?
據(jù)青亭網(wǎng)了解,XAI(Explainable AI)又稱(chēng)透明AI(Transparent AI),特點(diǎn)是行為容易被人所理解。大多數(shù)基于機(jī)器學(xué)習(xí)的AI都是在所謂的黑盒中運(yùn)行,由于無(wú)法提供決策背后的原因和見(jiàn)解,此類(lèi)AI具有一定風(fēng)險(xiǎn)性,因?yàn)椴淮_定它是否可信、可靠,是否存在偏見(jiàn)。
XAI的概念可以追溯到四十多年前,后來(lái)隨著黑盒AI/ML模型的成功,XAI技術(shù)開(kāi)始受到學(xué)術(shù)業(yè)、監(jiān)管機(jī)構(gòu)等各行各業(yè)關(guān)注。研究表明,XAI將有望為用戶(hù)提供清晰的決策,并建立信任。因此在工業(yè)領(lǐng)域,已經(jīng)開(kāi)始將XAI應(yīng)用于日常場(chǎng)景,改善用戶(hù)體驗(yàn)。
XAI可以服務(wù)于不同的目標(biāo)受眾,有各種不同的用途。早期的XAI研究?jī)H關(guān)注算法開(kāi)發(fā)者、數(shù)據(jù)科學(xué)家,以及臨床醫(yī)療等領(lǐng)域的專(zhuān)家,而近年來(lái)越來(lái)越多的XAI開(kāi)始面向普通用戶(hù),與消費(fèi)級(jí)產(chǎn)品集成,比如在購(gòu)物網(wǎng)站上顯示推薦某產(chǎn)品的原因等等。不過(guò),這目前還在早期階段。
XAI的重要性
想要讓AI被人類(lèi)廣泛理解,將涉及多學(xué)科研究工作。比如,ML研究人員開(kāi)發(fā)了生成透明模型的算法(例如,決策樹(shù)、貝葉斯模型),或使用事后解釋技術(shù)(例如,特征重要性、視覺(jué)解釋?zhuān)﹣?lái)生成解釋。而HCI研究人員,則專(zhuān)注于提高用戶(hù)信任度,以及對(duì)機(jī)器生成解釋的理解。另一方面,心理學(xué)研究人員從更基本的角度研究XAI,研究人們?nèi)绾紊?、交流和理解?/p>
公開(kāi)透明的AI也很重要,它符合未來(lái)其在AR/VR領(lǐng)域的發(fā)展策略。在XAIR研究中,XAI的目的是通過(guò)生成細(xì)節(jié)或理由,來(lái)幫助用戶(hù)清楚、容易理解AI的決策和功能。Meta指出,XAI是AI驅(qū)動(dòng)的交互系統(tǒng)的重要組成部分,未來(lái)也會(huì)在日常AR應(yīng)用中起重要作用,輔助用戶(hù)與可視化的智能服務(wù)互動(dòng)。XAI可以讓AR智能系統(tǒng)的行為更好理解,避免意外的AI決策,并培養(yǎng)隱私意識(shí),獲得用戶(hù)的信任。
不過(guò),目前Meta面臨的一個(gè)難題,是為日常AR應(yīng)用創(chuàng)建有效的XAI體驗(yàn)。大多數(shù)現(xiàn)有的XAI研究側(cè)重于將解釋類(lèi)型和生成技術(shù)分類(lèi),而沒(méi)有考慮到日常AR場(chǎng)景的特點(diǎn),比如用戶(hù)和上下文產(chǎn)生的感知信息,全天候運(yùn)行,適應(yīng)能力好等因素。這些因素不僅可以形成更人性化的解釋?zhuān)€會(huì)影響解釋接口的設(shè)計(jì)。

因此,Meta提出了XAIR設(shè)計(jì)框架,該框架描述了何時(shí)、如何解釋AR中AI的決策。為了構(gòu)建XAIR框架,還進(jìn)行了一場(chǎng)500人實(shí)驗(yàn),目的是收集他們對(duì)于AR體驗(yàn)設(shè)計(jì)的偏好。此外,還參考了12位專(zhuān)家對(duì)于AR交互的見(jiàn)解。
本次研究的重點(diǎn),是確定三點(diǎn)問(wèn)題:
AI該何時(shí)做出解釋?zhuān)?/p>
可以解釋什么;
如何解釋。
先前的研究已經(jīng)探討了前兩個(gè)問(wèn)題,盡管非針對(duì)AR,但還是為XAIR的設(shè)計(jì)提供了一些有用的信息。



XAI設(shè)計(jì)指南
Meta認(rèn)為,如果AR眼鏡具備智能服務(wù),那么AI將起到重要作用,比如根據(jù)AR眼鏡傳感器捕捉到的信息,為用戶(hù)提供基于上下文的建議。除此之外,AI與用戶(hù)交互需要基于有效的XAI設(shè)計(jì),以確保AI決策可靠、值得信賴(lài),從而改善用戶(hù)體驗(yàn)。

與針對(duì)電腦、手機(jī)上的現(xiàn)有XAI框架不同,AR的XAI設(shè)計(jì)需要結(jié)合更深層、更豐富的上下文信息(甚至還要考慮用戶(hù)的狀態(tài)),因此需要為AR專(zhuān)門(mén)重新設(shè)計(jì)。而且,AR的XAI還需要具有3D感知能力、實(shí)時(shí)在線(xiàn),才能應(yīng)用于日常AR場(chǎng)景,將解釋內(nèi)容與物理空間融合。比如,在推薦食譜時(shí),同時(shí)突出用戶(hù)冰箱中的食材,即根據(jù)場(chǎng)景上下文來(lái)解釋決策。而相比之下,市面上已有的XAI框架并不能滿(mǎn)足這些需求。

于是,Meta通過(guò)用戶(hù)調(diào)查總結(jié)了8大設(shè)計(jì)指南:
1)始終生成AI結(jié)果,確保用戶(hù)在需要時(shí)可便捷的訪(fǎng)問(wèn);
2)不自動(dòng)觸發(fā)解釋?zhuān)菨M(mǎn)足2個(gè)條件——識(shí)別到用戶(hù)高認(rèn)知負(fù)荷、緊迫感等情況,或是識(shí)別到用戶(hù)驚訝、困惑、不熟悉、不確定等狀態(tài);
3)個(gè)性化解釋內(nèi)容需考慮三個(gè)因素:系統(tǒng)目標(biāo)、用戶(hù)目標(biāo)和用戶(hù)畫(huà)像;
4)在默認(rèn)狀態(tài),優(yōu)先考慮為什么解釋?zhuān)⑦x擇簡(jiǎn)明的解釋?zhuān)?/p>
5)始終提供更詳細(xì)的解釋?zhuān)梢酝ㄟ^(guò)小的提示窗口等,讓用戶(hù)根據(jù)需求展開(kāi);
6)默認(rèn)情況下,采用與AI輸出相同的解釋方式(除了觸覺(jué)、音頻),一種模態(tài)負(fù)載高時(shí),選擇另外一種;
7)視覺(jué)相關(guān):內(nèi)容以文字為主,如果是圖片也應(yīng)盡可能簡(jiǎn)化、讓用戶(hù)易于理解;
8)視覺(jué)相關(guān):如主題場(chǎng)景相關(guān)可使用隱式提示,例如當(dāng)你看書(shū)時(shí)提供推薦和浮動(dòng)窗口;不相關(guān)則則使用顯示提示,例如兌換框等。
Meta結(jié)合設(shè)計(jì)指南,開(kāi)發(fā)了一些應(yīng)用案例并在10名設(shè)計(jì)師中進(jìn)行驗(yàn)證,結(jié)果設(shè)計(jì)師認(rèn)為XAIR可為AR的XAI框架設(shè)計(jì)提供可用的綜合參考或幫助,有助于激發(fā)設(shè)計(jì)師的思維和想象力。參與實(shí)驗(yàn)的12名最終用戶(hù)也反饋,XAIR有出色的可用性。
應(yīng)用案例
在這項(xiàng)研究中,Meta設(shè)計(jì)了兩個(gè)演示案例,感興趣可以來(lái)了解一下:
1)當(dāng)用戶(hù)在小路上慢跑時(shí),AR眼鏡考慮到當(dāng)下的季節(jié)和風(fēng)景,便為用戶(hù)顯示出附近的地圖,建議繞道去附近的路賞櫻花。AI可提供的解釋包括:風(fēng)景更好、路線(xiàn)長(zhǎng)度合適、適合用戶(hù)日程安排。解釋形式包括文字、櫻花圖片等等。

2)AR用戶(hù)在與鄰居討論園藝后回到家,這時(shí)AR眼鏡會(huì)在周?chē)闹参锷巷@示一個(gè)“養(yǎng)護(hù)”提示,并為用戶(hù)提供關(guān)于植物施肥的說(shuō)明。這個(gè)建議需要用戶(hù)手動(dòng)觸發(fā),避免其認(rèn)為AI侵犯隱私,手動(dòng)觸發(fā)可以較好的建立信任。此外,AI還可以提示:經(jīng)過(guò)系統(tǒng)掃描,植物的葉子上有異常斑點(diǎn),表明可能遭受真菌或細(xì)菌感染。解釋形式除了文字外,也可以在葉子上用AR來(lái)標(biāo)記異常點(diǎn)(文本為明顯提示,AR提示則為隱秘式,與場(chǎng)景融合)。參考:Meta