淺談信息熵在數(shù)字體驗監(jiān)控領(lǐng)域的應(yīng)用
什么是信息熵?
熱力學(xué)第二定律也可以表述為熵增原理:不可逆熱力過程中熵的微增量總是大于零。在自然過程中,一個孤立系統(tǒng)的總混亂度(即“熵”)不會減小。
熵,在物理學(xué)意義上成為了表征體系混亂程度的度量。

1948年,美國數(shù)學(xué)家、信息論之父,克勞德·艾爾伍德·香農(nóng)在《貝爾系統(tǒng)技術(shù)》雜志上發(fā)表了題為《通信的數(shù)學(xué)理論》的論文,提出了對信息的經(jīng)典定義——“信息是用來消除隨機不定性的東西”,并進一步提出信息熵的概念,解決了對信息的度量問題——使用熵值表示隨機變量不確定性的度量,用于定量衡量信息的大小。這也給人類社會帶來了一個新的單詞——bit(比特),成為衡量信息多少的單位。

數(shù)學(xué)家、信息論之父,克勞德·艾爾伍德·香農(nóng)(Claude Elwood Shannon )
1916年4月30日—2001年2月24日
信息熵是如何度量信息大小的?
距離的度量是米,時間的度量是秒,同樣的,信息的度量就是信息量。
人們在日常生活中對信息量有著直觀的感受:比如,“太陽東升西落”,這句話沒有任何的信息,因為這是肯定會發(fā)生的,這句話消除不了任何的不確定性;“A地區(qū)發(fā)生了8.0級地震”,這句話蘊含著很大的信息量,因為這是很小概率發(fā)生的,這句話消除了很大的不確定性。
因此,一個具體事件的信息量應(yīng)該是隨著其發(fā)生的概率而遞減,隨著其不確定性而遞增,且不能為負。越小概率的事件發(fā)生了,人們接收到的信息量越大,越大概率的事件發(fā)生了,人們接收到的信息量越小。如果將信息視為消除隨機事件不確定性過程中引入的變化的話,那么信息的量就與隨機事件的概率的對數(shù)有關(guān),設(shè)函數(shù)F表示觀測到隨機事件x具體發(fā)生時所帶來的信息量,具體計算公式為,

p是隨機事件x的發(fā)生概率,如果log以2為底,則信息量單位即為bit。
比如,拋擲一次硬幣,“正面朝上”這個隨機事件的發(fā)生概率是50%,那么,當人們觀測到“正面朝上”發(fā)生時,就消除了“正面朝上”這個隨機事件的不確定性,此時接收到的信息量就是1bit。
接下來,還是以拋擲一次硬幣為例,這個過程其實是包含了“正面朝上”和“反面朝上”兩個隨機事件,而且這兩個隨機事件的發(fā)生概率均為50%,此時,將“拋擲一次硬幣”這個過程看做是一個隨機系統(tǒng)的話,這個隨機系統(tǒng)的信息量是多少呢?
一個隨機事件等價于從隨機系統(tǒng)的輸出中觀測到某一特定取值的事件,度量這個隨機系統(tǒng)的總體信息量,就可以使用該系統(tǒng)中所有隨機事件發(fā)生時的信息量的數(shù)學(xué)期望代表該隨機系統(tǒng)的總體信息量,即信息熵,并且,隨機系統(tǒng)的信息熵越高,其信息量也就越大,具體計算公式為,

p是事件x的發(fā)生概率。
回到上述的例子中,這個“拋擲一次硬幣”的隨機系統(tǒng)的總體信息量,即為“正面朝上”和“反面朝上”這兩個隨機事件的信息熵。如果加入條件a,硬幣質(zhì)量均勻,在“正面朝上”和“反面朝上”這兩個隨機事件的發(fā)生概率均為50%的情況下,可計算得出這個隨機系統(tǒng)的信息熵為1;如果加入條件b,硬幣質(zhì)量不均勻,“正面朝上”的發(fā)生概率為20%,“反面朝上”的發(fā)生概率為80%,可計算得出這個隨機系統(tǒng)的信息熵小于1。由此可以得出,“拋擲一次質(zhì)量不均勻的硬幣”的信息量小于“拋擲一次質(zhì)量均勻的硬幣”的信息量。
理論照進現(xiàn)實,利用信息熵監(jiān)測終端應(yīng)用的數(shù)字體驗
既然可以計算“拋擲一次硬幣”這個隨機系統(tǒng)的信息量,那么,手機屏幕的“畫面呈現(xiàn)”是不是也可以被視為是一個像素渲染的隨機系統(tǒng),從而可以度量終端應(yīng)用運行時“畫面呈現(xiàn)”出的信息量,進而評價出終端應(yīng)用的每一幀畫面帶給最終用戶的信息價值?
答案顯而易見是肯定的,博睿數(shù)據(jù)秉持著“理論指導(dǎo)實踐,實踐驗證理論”的科學(xué)態(tài)度,充分理解香農(nóng)-信息熵理論原理,深入挖掘?qū)嶋H應(yīng)用場景,在行業(yè)內(nèi)普遍薄弱的視覺體驗度量上,在新一代的主動式移動應(yīng)用數(shù)字體驗監(jiān)控平臺Bonree app 3.0上,創(chuàng)造性的將信息熵運用于度量終端應(yīng)用所呈現(xiàn)畫面的信息價值:
信息量:獲取終端應(yīng)用運行時每一幀畫面中的每一個像素的出現(xiàn)概率,運用香農(nóng)-信息熵算法,計算出每一幀畫面的信息量。基于“熵值越高,信息量越大”的特性,信息量的數(shù)值范圍由低到高為0-100。
憑借Bonree app 3.0結(jié)構(gòu)化的問題見解式數(shù)據(jù)分析算法,信息量不僅是用于衡量app運行時的每一幀畫面可以為終端用戶帶來多少信息價值的視覺體驗指標,而且如果存在接近于白屏、黑屏等信息量較低的畫面,且持續(xù)時間超過1秒以上,該畫面存在的時間區(qū)域?qū)慌卸榘l(fā)生了視覺體驗問題-頁面內(nèi)容不足,并轉(zhuǎn)化為相應(yīng)的可優(yōu)化延時,直接量化問題的修復(fù)收益。
例如,某app在運行過程中,某界面白屏持續(xù)了2.62秒,則意味著其該界面的信息量為0持續(xù)了2.62秒,并觸發(fā)頁面內(nèi)容不足問題判定和可優(yōu)化延時計算,如果修復(fù)該問題,將至少可降低終端用戶使用app時停留在該白屏的時間1.62秒,會極大提高用戶體驗水平。

白屏、黑屏、藍屏等純色屏?xí)r,信息量為0

圖中手機屏幕的內(nèi)容豐富,此時信息量為82
頁面內(nèi)容不足:界面上的用戶可見內(nèi)容太少,而且持續(xù)時間已經(jīng)超過了1秒,發(fā)生此問題意味著存在白屏、黑屏等而導(dǎo)致用戶不能看到有效內(nèi)容。在受這個問題影響的時間區(qū)域里的任何指標異常,都可能導(dǎo)致本問題。
可優(yōu)化延時:由應(yīng)用執(zhí)行腳本時所有的優(yōu)化問題(即”慢“問題)轉(zhuǎn)化而來,用于衡量修復(fù)“慢”問題后,對于終端用戶來說可減少的業(yè)務(wù)等待時間,優(yōu)化問題包含卡頓、頁面內(nèi)容不足等體驗問題和DNS緩慢、請求響應(yīng)緩慢等根因問題。
不同信息量時的應(yīng)用畫面對比如下:

A.某金融app信息量為7時的畫面,可以看出除了下方的logo與名稱外,基本為白屏。

B.某金融app信息量為72時的畫面,頁面內(nèi)容較多,可以提供給用戶豐富的信息。
信息熵在數(shù)字體驗監(jiān)控領(lǐng)域的應(yīng)用價值
博睿數(shù)據(jù)將信息熵應(yīng)用于視覺體驗評價的探索實踐,不僅契合“看似主觀的用戶體驗本質(zhì)上仍然是由事物的客觀表現(xiàn)所決定的”這一理念,而且也成功解決了一直以來整個行業(yè)面臨的一個難題——在對終端應(yīng)用的數(shù)字體驗評價上,主要以性能和穩(wěn)定性數(shù)據(jù)為主,而針對視覺體驗評價的方式多采用間接或主觀數(shù)據(jù),無法直接使用客觀數(shù)據(jù)度量應(yīng)用的視覺體驗水平。
博睿數(shù)據(jù)新一代的主動式移動應(yīng)用數(shù)字體驗監(jiān)控平臺Bonree app 3.0,憑借強大的圖像采集和數(shù)據(jù)處理技術(shù),全國獨家將信息熵應(yīng)用于對終端應(yīng)用的數(shù)字體驗監(jiān)控,把終端應(yīng)用運行時每一幀畫面的信息量作為評價視覺體驗的關(guān)鍵指標,并且,結(jié)合自主研發(fā)的自動化測試框架、強大可靠的RPA技術(shù)、行業(yè)領(lǐng)先的數(shù)據(jù)采集能力和遍布全球的真實手機設(shè)備云,無需對目標應(yīng)用嵌入SDK等探針,只需通過點擊、滑動等遠程操作,即可從真實用戶視角快速捕獲移動應(yīng)用運行過程中的視覺體驗、交互體驗、網(wǎng)絡(luò)請求、應(yīng)用狀態(tài)等數(shù)字體驗水平和應(yīng)用性能瓶頸,從而幫助企業(yè)預(yù)先感知終端應(yīng)用數(shù)字體驗,對比分析競品優(yōu)劣,提前預(yù)警應(yīng)用性能故障,快速復(fù)現(xiàn)定位問題根因,建立起可觀測、可度量的數(shù)字體驗管理體系。