桐鄉(xiāng)UI設(shè)計(jì)培訓(xùn)-會(huì)話式UI
今天從四個(gè)方面討論一下會(huì)話式 UI,我們先講一下它是什么。第二個(gè),它可以有哪些應(yīng)用的商業(yè)場(chǎng)景,有些公司已經(jīng)使用它了,怎么使用它的。第三個(gè),看一下技術(shù)雷達(dá)里跟它相關(guān)的技術(shù)。最后,作為企業(yè)人員怎么運(yùn)用它,來幫助你實(shí)現(xiàn)企業(yè)的目標(biāo)。
什么是會(huì)話式 UI?
什么是會(huì)話式 UI?首先 UI 是用戶界面,所以會(huì)話式 UI 是人機(jī)交互方式。說到會(huì)話就包括了語言,所以它其實(shí)是支持語言的人機(jī)交互。語言交互分兩種:一個(gè)是語音上的交互,一種是文字消息上的交互。那為什么叫會(huì)話呢,為什么不叫語言 UI?因?yàn)榫拖駝倓傂礻徽劦秸f,它跟 Siri 的常用模式不一樣,不是我們命令它,要這個(gè)怎么樣,它幫你回答。而是一來一往,有一段上下文的交互形式。很多媒體在形容它的時(shí)候,說,會(huì)話式 UI 是人機(jī)交互的一種新范式。
為什么說是一種新范式呢?我們可以先來看一看人機(jī)交互的演進(jìn)。我們都知道第一次人機(jī)交互是 1832 年,當(dāng)時(shí)是用一個(gè)打孔卡,計(jì)算機(jī)科學(xué)家用它在機(jī)器上記錄下一些信息。然后出現(xiàn)了鍵盤、鼠標(biāo)等等,其中有一大段時(shí)間我們都在跟命令行交互,計(jì)算機(jī)有一套特定的指令和習(xí)慣,根據(jù)這個(gè)來告訴它做什么。接著是 GUI,這個(gè)時(shí)候仍然需要根據(jù)頁面的架構(gòu)來找到你想要找到的東西。后來又出現(xiàn)了觸摸屏等??匆幌逻@個(gè)演進(jìn),幾乎提到的全部是人適應(yīng)機(jī)器的交流方式。然而現(xiàn)在會(huì)話式 UI 是機(jī)器適應(yīng)人類的交流方式。 就是和你跟我講話一樣的自然溝通的方式,機(jī)器通過學(xué)習(xí)人類說話方式來適應(yīng)我們的交互方式。
適應(yīng)這樣的方式需要哪幾個(gè)特性呢?除了大家都比較熟悉的語音識(shí)別的技術(shù),語音合成的技術(shù),和一句話講出來,能理解這句話的技術(shù),它還需要一些新的特性。
首先,會(huì)話場(chǎng)景的認(rèn)知。剛剛也說了它不僅僅是命令回答式。比如我說我要吃三明治,它可以知道你想要一個(gè)三明治,Ok,接下來它得會(huì)問你,你想點(diǎn)餐嗎?然后點(diǎn)餐的時(shí)候它已經(jīng)知道,我想吃三明治(就可以去找提供三明治的餐廳)。
第二個(gè),認(rèn)知會(huì)話的起始。剛剛說了有上下文,有這個(gè)還不夠,我得知道上下文什么時(shí)候開始,什么時(shí)候結(jié)束。
最后一個(gè),就是會(huì)話的動(dòng)機(jī)。大多數(shù)時(shí)候人跟機(jī)器交流還是有一個(gè)目的的,像剛剛說的要點(diǎn)餐還是怎么樣,或者開車的時(shí)候知道什么路是安全的。它要推理用戶的意圖是什么,然后根據(jù)意圖來提供后端的服務(wù)。
會(huì)話式 UI 有哪些好處?
它給我們帶來了哪些好處呢?
首先從用戶的角度來說,它可以給我們提供即時(shí)性。像我開車的時(shí)候需要一種服務(wù)可以立刻跟我交互,立刻給我一個(gè)答案,那會(huì)話式 UI 就可以在后端做一些 cross referenece 的信息查詢,然后整合過來告訴我。
接著是普適性,這個(gè)是說并不選擇它的設(shè)備或者環(huán)境,這個(gè)會(huì)話式 UI 可以使用在 Web 上,移動(dòng)上,或者任何的設(shè)備上。
三個(gè),真實(shí)性。這個(gè)回到剛剛所說的,它是來適應(yīng)人類交流的方式,產(chǎn)生一種自然的交互體驗(yàn)。
最后,個(gè)性化。既然說跟它一直交流,就像你跟你朋友很熟,他知道你想吃什么,下次點(diǎn)餐的時(shí)候就會(huì)給你說是不是還想吃三明治。這個(gè)給商家?guī)硎裁春锰幠兀渴紫瓤梢詭眍櫩偷臐M意度,如果用戶體驗(yàn)做的好的話。還可以給商家?guī)碇覍?shí)度,以及提高服務(wù)效率。
會(huì)話式 UI 有哪些商用場(chǎng)景?
我們?cè)賮砜匆豢磳?duì)商業(yè)來說有什么樣的場(chǎng)景來使用它?
第一個(gè),商家本身就有一種服務(wù)。比如你本身是某個(gè)服務(wù)提供商,會(huì)話式 UI 可以提升用戶的體驗(yàn)和你的服務(wù)質(zhì)量。我們看一個(gè)例子,快餐點(diǎn)餐機(jī)器人。這個(gè)是一個(gè)跟臉書集成的聊天機(jī)器人。用戶說我想吃東西,這個(gè)機(jī)器人說,你想吃什么?用戶接著說自己想吃什么。然后當(dāng)時(shí)是這個(gè)聊天機(jī)器人是屬于一個(gè)漢堡包的連鎖餐廳,機(jī)器人說你想去哪家,然后用戶選離家里最近的,然后通過線上支付,最后就線下送到他家了。這還有一個(gè)最近新聞報(bào)道比較多的,就是美國的運(yùn)通卡,它在 Alexa 的平臺(tái)上提供了支付服務(wù)。你現(xiàn)在已經(jīng)可以用 Alexa 支付美國運(yùn)通卡的賬單或者查詢賬單,根據(jù)用戶使用越來越多,越來越多的銀行服務(wù)會(huì)通過 Alexa 提供。
第二個(gè)場(chǎng)景,提供平臺(tái)上的一站式服務(wù)。我這里的平臺(tái)指的是商業(yè)平臺(tái),所以比如說微信平臺(tái),或者亞馬遜平臺(tái),或者其他提供很多商業(yè)服務(wù)功能的平臺(tái)。會(huì)話式 UI 可以作為這個(gè)平臺(tái)和用戶的交互方式來給用戶推薦更好的服務(wù)和功能。我們看一下 VIV 的例子,現(xiàn)在這個(gè)應(yīng)該被三星收購了,它可以為三星提供集成所有 APP 的會(huì)話式 UI。在 demo 的時(shí)候他們舉幾個(gè)例子,像明天是母親節(jié),用戶說要給媽媽訂花,VIV 就能上淘寶幫你把花訂好。用戶要用車,說我要 6 個(gè)人的車去球場(chǎng),它就知道 6 個(gè)人的車要叫 SUV,然后用 UBER 把車訂好。
第三個(gè),我們提到會(huì)話式 UI 不能不提 IOT,因?yàn)闀?huì)話式 UI 可以作為 IOT 非常實(shí)用的一種用戶界面。不知道大家有沒有聽說,最近在 ACM CHI 上展示了一個(gè)非??岬目萍迹且粋€(gè)非常小的集成片的模板,這個(gè)模板現(xiàn)在已經(jīng)可以通過機(jī)器學(xué)習(xí)感知到到室內(nèi)所有設(shè)備和活動(dòng)。這給會(huì)話式 UI 帶來什么機(jī)會(huì)呢?我們想一下如果把這個(gè)模板和 Alexa 或者 Google Home 結(jié)合在一起的話,它可以把室內(nèi)所有的設(shè)備聯(lián)系起來,然后和用戶產(chǎn)生交互。這個(gè)地方我們來看一下智能廚房的案例。這是 ThoughtWorks 做的一個(gè)項(xiàng)目。在智能廚房里比如說電冰箱、微波爐等等全部跟智能服務(wù)集成在一起,然后提供一個(gè)會(huì)話式 UI。用戶跑到冰箱說周末有一群朋友過來聚會(huì),我想給他們做一頓聚會(huì)上吃的。它會(huì)根據(jù)冰箱里有的和你本身有的調(diào)料,以及廚房的條件,給你推薦說,你可以做這幾道菜,這是幾道菜的菜譜,還缺幾個(gè)調(diào)料,你可以去這些商店訂這些調(diào)料。所以說這就是會(huì)話式 UI 在 IOT 里比較好的應(yīng)用。
第四個(gè),基于會(huì)話式 UI 的服務(wù)。既然它是用戶的新交互形式,不可避免會(huì)出現(xiàn)一些新的產(chǎn)品和服務(wù)。這里舉一個(gè) Poncho 的例子,Poncho 本身是一個(gè)天氣 APP,它會(huì)告訴你今天天氣很好,可以出行,等等。但是它還會(huì)加上其他的東西,像查天氣的時(shí)候會(huì)在手機(jī)上無聊的看,它可以取悅用戶,給你講笑話,陪你玩游戲,等等。這個(gè)時(shí)候可以把它當(dāng)做智能的朋友在一起交互
會(huì)話式 UI 涉及到哪些技術(shù)?
剛剛講完了這幾個(gè)場(chǎng)景,我們看看有哪些技術(shù)可以幫助我們實(shí)現(xiàn)這樣的商業(yè)場(chǎng)景?這次技術(shù)雷達(dá)里提到了四種跟會(huì)話式 UI 相關(guān)的技術(shù):會(huì)話感知 API,Nuance Mix,Wit.ai 和API.ai。注意
我們首先看一下會(huì)話感知 API 是什么?
技術(shù)雷達(dá)上說:“諸如 Amazon Alexa, Google 語音服務(wù)和 Siri 這樣的技術(shù)已經(jīng)大大降低了基于語音的軟件交互的門檻。然而, 想要在許多現(xiàn)有的 API 之上構(gòu)建更多的會(huì)話式輸入(語音或文本)還很困難。 ”
那為什么說還很困難呢?剛才說到會(huì)話式 UI 需要上下文,回到一開始點(diǎn)餐的例子中,聊天機(jī)器人知道說我想吃 pizza,下面就問你去哪個(gè)商店,然后它知道這個(gè)訂單是多少錢,你家離它多遠(yuǎn),這些都是基于上下文的會(huì)話交互,涉及到交互場(chǎng)景,每次后續(xù)交互需要知道前面交互的上下文。然而現(xiàn)在我們常用的 HTTP 請(qǐng)求和 Restful 式樣的 API 是沒有狀態(tài)的。服務(wù)端需要知道上下文的話就需要客戶端提供額外的信息。會(huì)話式 UI 就是一種解決這個(gè)問題的方法。它可以管理會(huì)話的上下文和狀態(tài),代表前端的語言輸入呼叫底層的服務(wù),它是后端為前端服務(wù)的范式。
Nuance Mix 不但可以識(shí)別用戶的意圖和實(shí)現(xiàn)交互,它還提供支持不同編程語言的 SDK。它的定位也更多的為 IoT 設(shè)備和機(jī)器人等等提供自然語言的處理平臺(tái)。
如何利用會(huì)話式 UI 獲取商業(yè)價(jià)值?
聽了場(chǎng)景和技術(shù),如何結(jié)合它們來獲得商業(yè)價(jià)值呢?首先明確你要解決的問題。很多時(shí)候有一種新的時(shí)髦的技術(shù)或者體驗(yàn)方式出現(xiàn),企業(yè)就非常急切的希望使用它,怕被競(jìng)爭(zhēng)對(duì)手搶先。但是不管你用什么技術(shù)和做什么樣的產(chǎn)品,要先定位你本身希望給用戶解決的問題和痛點(diǎn)。根據(jù)這個(gè)問題和痛點(diǎn)來考慮如何使用會(huì)話式 UI,而不是為了使用它而使用它。所以要先有一個(gè)問題,才能把解決問題的方式對(duì)應(yīng)上去。第二個(gè),使用演進(jìn)化的架構(gòu)。我們現(xiàn)在知道技術(shù)演進(jìn)非???,你都不知道下一步會(huì)怎么樣。今天需要會(huì)話式 UI,明天可能需要另外一種體驗(yàn)方式,這樣就需要能演進(jìn)的架構(gòu)來支撐。我們推薦 BFF 模式,也就是根據(jù)不同的用戶體驗(yàn),為用戶體驗(yàn)建造不同的后端服務(wù),來支持跟核心底層服務(wù)的交互。這也就決定了我們需要一個(gè)領(lǐng)域?qū)觼硖峁┑讓拥暮诵姆?wù)。
接下來講一下數(shù)據(jù)策略,前面講到說會(huì)話式 UI 可以帶來一大好處,就是個(gè)性化。怎么樣可以讓它給用戶提供個(gè)性化需要,通過大數(shù)據(jù)來學(xué)習(xí)顧客的愛好。前面徐昊提到說你有什么樣的數(shù)據(jù)最終你會(huì)產(chǎn)生什么樣的學(xué)習(xí)的結(jié)果。這個(gè)話說的一點(diǎn)都沒錯(cuò)兒。不知道在座的有沒有來自微軟的,我這里要舉一個(gè)微軟去年的反例。
微軟去年在推特上搞了一個(gè) TayTweets,就是聊天機(jī)器人,可以隨時(shí)跟用戶交互。它希望通過跟用戶的聊天訓(xùn)練變成非常有趣,casual,能陪人聊天的對(duì)象。實(shí)際上發(fā)生了事情呢?很多用戶調(diào)戲它,講了很多反人類,反女性,反種族等等的言論。 24 小時(shí)后微軟不得不立刻把它撤下推特,因?yàn)樗_始說希特勒沒有做過任何錯(cuò)誤的事情,講很多誹謗女性的惡毒言論。所以這個(gè)例子告訴我們要正確的教育你的會(huì)話式 UI,就像小孩上學(xué)一樣要給他一些基本的原則,不讓后期地用戶數(shù)據(jù)把整個(gè)的 UI 交互形式和話語帶偏。
那然后說,我們用會(huì)話式 UI 是為了良好的用戶體驗(yàn)。關(guān)于用戶體驗(yàn)我們要注意下面幾個(gè)方面:
第一,剛剛我們說到它是機(jī)器來適應(yīng)人類,你就要真正跟人類一樣講話。比如剛開始講話的時(shí)候你會(huì)說 Hello,跟真人一樣的交流方式來交流,而不僅僅是像一個(gè)命令式或者任務(wù)式的完成一樣的形式來應(yīng)對(duì)用戶。
第二個(gè),有自己的個(gè)性化。這個(gè)涉及到任何 UI 的宗旨,比如說我現(xiàn)在是為了樂高設(shè)計(jì)的,那么這個(gè)語言是適合兒童的,它不會(huì)很復(fù)雜,而且更加有趣。如果是為一個(gè)銀行或者醫(yī)療機(jī)構(gòu)設(shè)計(jì)的,那這個(gè)語言會(huì)不會(huì)更加的嚴(yán)肅。
第三個(gè),提供 escape hatch,這就是說即使提供了會(huì)話式 UI,但是這個(gè)服務(wù)最后是有界限的,它并不能做到所有的事情,尤其在現(xiàn)在的技術(shù)條件下面,可能跟它溝通到某個(gè)情況下,它就不知道下一步該怎么辦了,這個(gè)時(shí)候要給客戶提供 escape hatch。比如說會(huì)話式 UI 不知道怎么辦的時(shí)候就接入人工服務(wù),或者這個(gè)時(shí)候讓你退出去,說你想用的 APP 等等。
最后一點(diǎn)是提供可靠的服務(wù)和信息。我們都知道一個(gè)不可靠、不受人信賴的交互,不管是人與人的交互也好,還是人與機(jī)器的交互,你都會(huì)減少跟這個(gè)東西交流。如果你的會(huì)話經(jīng)常提供虛假信息或者信息不準(zhǔn)確的話,會(huì)降低用戶對(duì)它的信任,最終會(huì)導(dǎo)致用戶更少使用你的服務(wù)。
應(yīng)對(duì)會(huì)話式 UI 的最后一方面是會(huì)話式 UI 既然出現(xiàn)了,它可能會(huì)代替很多我們本身跟一線服務(wù)人員的交流,那么一線服務(wù)人員會(huì)不會(huì)被會(huì)話式 UI 代替呢?我們認(rèn)為暫時(shí)還不會(huì),但是從人員的結(jié)構(gòu)上可能還是需要一些調(diào)整。企業(yè)可能會(huì)需要更多的數(shù)據(jù)科學(xué)家,更多的工程師,而更少的前臺(tái)人員。還有智能服務(wù)和人工服務(wù)如何劃分。比如說年紀(jì)大的或者特別有身份的人可能還是希望有一個(gè)專門為他服務(wù)的人員,這個(gè)時(shí)候就要?jiǎng)澐智宄?huì)話式 UI 到底覆蓋哪些服務(wù)和人群。
講了那么多,那么會(huì)話式 UI 的未來到底是什么?我們剛剛聊了它有什么樣的商業(yè)場(chǎng)景,它的技術(shù)是怎么樣的,怎么樣去用它。那么說到未來,我們可能第一個(gè)想到 2013 年有一個(gè)電影叫 《HER》,說的是一個(gè)科學(xué)家用了一個(gè)會(huì)話式 UI 平臺(tái)叫 Samantha,他們?cè)诟鞣N各樣的交流中間,產(chǎn)生了精神上的共鳴,而這個(gè)人甚至愛上了他的會(huì)話式 UI。那這個(gè)會(huì)不會(huì)成為會(huì)話式 UI的未來呢?這個(gè)不好說,至少在短時(shí)間內(nèi)我們看不到這樣的未來。但是我們從剛剛看到的各種場(chǎng)景和應(yīng)用中間,知道說它已經(jīng)可以給你提供實(shí)實(shí)在在的非常便捷的服務(wù)、更好的用戶體驗(yàn)等等。所以我們會(huì)繼續(xù)關(guān)注它的發(fā)展和會(huì)話式 UI 相關(guān)的技術(shù)發(fā)展。也希望大家能夠跟著我們一起來探索和應(yīng)用會(huì)話式 UI 這樣的人機(jī)交互方式。