數(shù)字智能時(shí)代1:數(shù)據(jù)為什么能夠產(chǎn)生智能?(數(shù)字智能的原理)
今天,我們來聊一聊現(xiàn)在非?;鸬囊粋€(gè)概念,某某“數(shù)字化”。
本篇文章會(huì) 用 最 通俗的語言,最簡單的模型, 講清楚:
1.數(shù)字化 是什么意思?
2.數(shù)字化 的 原理是什么?為什么數(shù)據(jù)能夠?qū)崿F(xiàn)智能化,自動(dòng)化?
3.數(shù)字化 和 某個(gè)行業(yè)領(lǐng)域 結(jié)合,促進(jìn)其發(fā)展, 到底是怎么一回事?
放眼看一下四周:
企業(yè),都喊著要數(shù)字化轉(zhuǎn)型,
國家,也天天說?實(shí)現(xiàn) xx數(shù)字化,幫助xx數(shù)字化,加速實(shí)現(xiàn)數(shù)字化。
網(wǎng)絡(luò)上,各種文章鋪天蓋地 的 寫著?數(shù)字化驅(qū)動(dòng)xx發(fā)展,未來是數(shù)字化的時(shí)代,未來每個(gè)行業(yè)每個(gè)領(lǐng)域都要數(shù)字化。
還有,頭幾天 陸奇 在年度分享時(shí) 提到的 "第五范式"時(shí)代 和 各種數(shù)字化。
陸奇:曾任 雅虎、微軟、百度總裁職位,現(xiàn)任 YC (Y Combinator:美國最牛x的創(chuàng)業(yè)孵化器機(jī)構(gòu)) 中國區(qū) 創(chuàng)始人 以及 CEO。
(備注:創(chuàng)業(yè)孵化器 是 幫助創(chuàng)業(yè)者 提高創(chuàng)業(yè)成功率 的一種機(jī)構(gòu),會(huì)提供人脈資源,傳授創(chuàng)業(yè)經(jīng)驗(yàn),幫創(chuàng)業(yè)者避雷,拉投資之類的。)
這么多人討論數(shù)字化,那么一個(gè)問題就來了:
數(shù)字化 xx 到底是 什么意思?
數(shù)字化 xx 到底 是怎么玩的?
數(shù)字化為什么 就能 和各種 xx 結(jié)合,并促進(jìn)其發(fā)展呢?
要想弄明白 數(shù)字化 為什么能夠促進(jìn)各行業(yè)領(lǐng)域的發(fā)展,
就必須得 理解 數(shù)字化 產(chǎn)生智能,實(shí)現(xiàn)智能 的原理,
只有弄明白了 原理, 才能 讓我們 輕松地理解 數(shù)字化 如何應(yīng)用?
下面我用一個(gè)最簡單的模型來講一下其中的原理,
并會(huì)舉一些 實(shí)操的案例,這些案例的模型都是簡化過的,能幫助我們理解就足夠了。
這一切 要 從 一項(xiàng)技術(shù)的突破講起,這個(gè)技術(shù)是:
機(jī)器學(xué)習(xí) 技術(shù)領(lǐng)域中 的 深度學(xué)習(xí)技術(shù)。
不論是任何的數(shù)字化 , 只要是數(shù)字化智能,底層用的都是 這個(gè)技術(shù)(深度學(xué)習(xí))。
那么 接下來 讓我們講一下 深度學(xué)習(xí)技術(shù) 到底是干什么的?
深度學(xué)習(xí)技術(shù) 是如何 通過 數(shù)據(jù)的收集 和分析 實(shí)現(xiàn) 智能化的?
深度學(xué)習(xí) 技術(shù) 的本質(zhì) 就是 實(shí)現(xiàn) 預(yù)測功能。
而我們能看見的 數(shù)字化 實(shí)現(xiàn)的各種效果 ,都是基于 預(yù)測功能實(shí)現(xiàn)的。
怎么理解預(yù)測功能呢?
舉例:用自動(dòng)駕駛 技術(shù) 來解釋,我們的汽車 是如何實(shí)現(xiàn)自動(dòng)駕駛功能的呢?
(以下用最簡單的模型來說明)
比如說,汽車 前方 有一個(gè)障礙物,汽車是如何實(shí)現(xiàn)的自動(dòng)轉(zhuǎn)彎 避開障礙的呢?
首先,汽車 得 識別 出來,前面是有一個(gè)障礙物的,比如它用攝像頭 拍到了 前面障礙物的圖片。
此時(shí),深度學(xué)習(xí)系統(tǒng) 會(huì) 通過接收的 圖像數(shù)據(jù)(比如像素,顏色,像素排列) 來做個(gè)預(yù)測。
預(yù)測 擋在車前面 這個(gè)東西 是 個(gè)什么玩意?
當(dāng)它 預(yù)測 到前方是一個(gè)障礙物的時(shí)候,它就會(huì)執(zhí)行之前就綁定好的規(guī)則:拐彎。
深度學(xué)習(xí) 本質(zhì)是 實(shí)現(xiàn)預(yù)測功能,而我們看到的自動(dòng)化實(shí)際上是基于預(yù)測的結(jié)果綁定了一些行為規(guī)則。
這中間有一個(gè) 規(guī)則匹配 的過程。
那么,問題來了,深度學(xué)習(xí)技術(shù)是用什么方法實(shí)現(xiàn)的預(yù)測呢?
弄明白這個(gè)問題,我們就可以很好地理解 深度學(xué)習(xí)技術(shù) 是如何和各個(gè)領(lǐng)域進(jìn)行結(jié)合的。
(下面會(huì)舉一個(gè) 用在生物醫(yī)學(xué) 如何研發(fā)新藥 的例子)。
我們 把 深度學(xué)習(xí) 比作一個(gè) 加工盒,
也可以理解為一個(gè)加工函數(shù):輸入變化的參數(shù)產(chǎn)生對應(yīng)的預(yù)測結(jié)果 -->輸入數(shù)據(jù)到加工盒產(chǎn)生結(jié)果。
比如下面這個(gè)函數(shù) :?預(yù)測結(jié)果 = 2x + 3y
( 其中 x 和 y 均為 實(shí)際收集到的數(shù)據(jù)參數(shù),比如像素的顏色數(shù)值和大小數(shù)值)
深度學(xué)習(xí) 本質(zhì) 就是 通過 大量的數(shù)據(jù) 來 打磨 這個(gè) 加工盒(加工函數(shù))。
直到 把 這個(gè)加工盒 (加工函數(shù)) 打磨 到 預(yù)測準(zhǔn)確率最高。
輸入一條數(shù)據(jù),深度學(xué)習(xí) 技術(shù) 會(huì) 微調(diào)一下 加工函數(shù), 比如微調(diào)x的系數(shù) :從2->2.5。
函數(shù)如下:?預(yù)測結(jié)果 = 2.5x + 3y
你輸入的每條數(shù)據(jù)都 包括兩部分, 一個(gè)是數(shù)據(jù), 一個(gè)是你標(biāo)明的這個(gè)數(shù)據(jù)的正確預(yù)測結(jié)果。
深度學(xué)習(xí)技術(shù) 會(huì) 根據(jù) 你新輸入的數(shù)據(jù)正確結(jié)果 來微調(diào) 加工函數(shù)。
那么他是如何算出這個(gè)加工函數(shù)的呢?
他是按照什么規(guī)則微調(diào)的呢?
有時(shí)候我們會(huì)聽到一個(gè)說法 : 深度學(xué)習(xí) 是一個(gè) 黑盒,意思是他能實(shí)現(xiàn)預(yù)測功能,但是不知道他里面是如何實(shí)現(xiàn)的。
這里換個(gè)說法就是: 我們能通過 深度學(xué)習(xí) 得到一個(gè) 做出很好預(yù)測 的 加工函數(shù),但是我們不知道這個(gè)加工函數(shù) 是怎么算出來的。
(具體為不知道函數(shù)有幾個(gè)變量,變量的系數(shù)是什么是怎么算出的)。
實(shí)際上 要用最簡單的模型 來解釋 他的運(yùn)算過程,非常簡潔:
就是:瞎蒙( 具體是窮舉,有點(diǎn)像暴力破解密碼)。
我們暴力破解密碼 是怎么做的:
先試試:1, 錯(cuò)誤, 再試試2 ,錯(cuò)誤,再試試3,。。。 再試試123,。。。再試試123456。
挨個(gè)試,試到對為止,用窮舉來說就是列出所有可能的排列組合,然后挨個(gè)試。
那么 深度學(xué)習(xí) 挨個(gè)試的是什么呢?
就是挨個(gè)所有函數(shù),用窮舉的方式一個(gè)一個(gè)試,
比如 : 2x+3y 試一把, 2.5x+3y試一把 , 3x+3y再試一把
每輸入一個(gè)數(shù)據(jù),深度學(xué)習(xí)技術(shù) 會(huì)根據(jù) 你給的正確預(yù)測結(jié)果微微的調(diào)整一下 函數(shù)公式。
具體 然后 通過不斷地調(diào)整來窮舉各種可能的 函數(shù)公式。
最終你輸入了1000條數(shù)據(jù),調(diào)整了1000次,結(jié)果你一看:
函數(shù)為: 預(yù)測結(jié)果 = 999x + 888y 。
把 像素顏色 代入 x 參數(shù), 把像素大小 代入 y參數(shù),得出的結(jié)果預(yù)測準(zhǔn)確率最高。
但是,你是不知道 為什么x的系數(shù) 是999,y的系數(shù)是888,
具體到技術(shù)細(xì)節(jié),卷積神經(jīng)網(wǎng)絡(luò)(一種深度學(xué)習(xí)算法) 里面 可能有 n個(gè) 參數(shù),n個(gè)函數(shù)組合 。
你把實(shí)際上數(shù)據(jù)代入進(jìn)去,就能算出預(yù)測結(jié)果,但是這個(gè)函數(shù)是窮舉得來得,
加工函數(shù)有幾個(gè)參數(shù),參數(shù)的系數(shù)又是什么,完全是隨機(jī)蒙出來的,沒有任何可解釋性。
這就是為什么大家都說 深度學(xué)習(xí) 技術(shù)是個(gè) 黑盒, 不知道怎么算出來的,
窮舉蒙出來的,那當(dāng)然不知道了,
那么到這里,我們再提出一個(gè)問題,什么因素 決定 這個(gè)加工函數(shù) 準(zhǔn)不準(zhǔn)呢?
其中最重要的就是 :算力,說白了就是計(jì)算機(jī),
因?yàn)樵硎歉F舉,所以你1臺計(jì)算機(jī) 1個(gè)小時(shí)要是能窮舉1000次的話,
那么10臺計(jì)算機(jī) 1個(gè)小時(shí)就能窮舉 10000次,那么當(dāng)然是次數(shù)多的預(yù)測更準(zhǔn)了。
谷歌就搞了個(gè)超級計(jì)算機(jī),天天在嘗試算亂七八糟的。
接下來 我來舉一個(gè) 生物醫(yī)學(xué) 研發(fā)新藥的例子:
我們用最簡化的模型來講,肯定不準(zhǔn)確,但是好理解。
比如說:我們在研發(fā)新藥 是 什么流程呢?
藥 本質(zhì)上 由 不同的分子按照不同的結(jié)構(gòu)組合而成的。
某些特定的分子組合結(jié)構(gòu) 就 能和人的某種病(某種細(xì)胞受體) 產(chǎn)生關(guān)聯(lián),達(dá)到治療的作用。
所以要想研制新藥,就得 通過 嘗試 各種分子組合 來實(shí)現(xiàn)。
而原來 ,沒有深度學(xué)習(xí)技術(shù)的時(shí)候,我們大多數(shù)都是通過推測,實(shí)驗(yàn)來測試各種分子組合。
直到出現(xiàn)了深度學(xué)習(xí)技術(shù),可以做預(yù)測了,就出現(xiàn)了一種新的玩法,
先把各種分子 作為數(shù)據(jù) 輸入 到 計(jì)算機(jī)內(nèi),然后把各種分子 之間的化合反應(yīng),各種不同結(jié)構(gòu)上的組合效果 輸入進(jìn)去,再把人的(某個(gè)細(xì)胞受體)信息輸入進(jìn)去。
然后我們就可以窮舉各種組合方式,并且通過分子結(jié)合規(guī)則,能直接試出各種分子組合的效果。
結(jié)果就是用 計(jì)算機(jī)的深度學(xué)習(xí)技術(shù) 窮舉 了 各種分子組合情況,得出了測試結(jié)果。
這樣大大地提高了效率,因?yàn)橛?jì)算器窮舉的速度是比人挨個(gè)實(shí)驗(yàn)試要快很多的。
因?yàn)橛辛藬?shù)量上和速度上的優(yōu)勢,試著試著就試出個(gè)有用的東西。
本篇文章先講到此。。。