82 博士之后的學(xué)習(xí)方法-從知識到模型
實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn),既然冷冰冰的機(jī)器都有了學(xué)習(xí)能力,那么經(jīng)過機(jī)器驗(yàn)證的學(xué)習(xí)方法一定值得人類學(xué)習(xí)。人工智能領(lǐng)域的發(fā)展改變了我們的傳統(tǒng)認(rèn)知,我不是人工智能領(lǐng)域?qū)I(yè)出身,但我想談?wù)勅斯ぶ悄艿哪P蛯ξ覀內(nèi)祟悓W(xué)習(xí)方法的啟發(fā),這種啟發(fā)不限于學(xué)校中的學(xué)習(xí)方法改進(jìn),也可用于工作和人生中的自我學(xué)習(xí)。
首先機(jī)器學(xué)習(xí)的目的是構(gòu)建可以預(yù)測的模型,明確輸入輸出是構(gòu)建模型的第一步。學(xué)校的輸入是書本和課堂知識,輸出反饋是各種考試,基礎(chǔ)教育的目的是普及文化,而應(yīng)試教育的目的是應(yīng)付考試,高考的輸入輸出對應(yīng)關(guān)系是篩選人才的目的,所以我們之前學(xué)習(xí)了那么多年英語,仍然是啞巴英語。輸入和輸出就像兩條邊界線,只有明確了問題的邊界,我們才能構(gòu)建解決問題的系統(tǒng)。

其次,人類的學(xué)習(xí)方法類似于大模型的訓(xùn)練方法,通過書本或老師訓(xùn)練建立模型屬于監(jiān)督學(xué)習(xí)的方法,歷史的知識和經(jīng)驗(yàn)是訓(xùn)練集,學(xué)校學(xué)習(xí)建立的模型大多是針對考試或者某些專業(yè)知識領(lǐng)域,監(jiān)督學(xué)習(xí)訓(xùn)練出的模型通常容易過擬合,陷入紙上談兵或者教條主義的陷阱變成象牙塔里的學(xué)院派兩腳大書柜。
現(xiàn)代科學(xué)的知識越來越繁雜,即使念完博士,也只能對研究方向的細(xì)分領(lǐng)域有深入的研究,而系統(tǒng)的思考方法,不僅要深度,也要廣度。
如何形成系統(tǒng)的思考方法、建立知行合一的思維模型?
第一步是多讀書,通過書本或互聯(lián)網(wǎng)篩選有用的數(shù)據(jù),建立訓(xùn)練集。類似于監(jiān)督學(xué)習(xí)的方法,站在巨人的肩膀上,利用他人的知識和經(jīng)驗(yàn)構(gòu)建已知的數(shù)據(jù)庫,數(shù)據(jù)的來源要具有多樣性和穩(wěn)定性,比如要研究投資,就需要先了解投資投機(jī)的各種流派,把能夠找到的相關(guān)的書籍和理論都大概看一遍,相當(dāng)于機(jī)器學(xué)習(xí)的從數(shù)據(jù)輸入。

第二步是收集整理筆記,類似于機(jī)器學(xué)習(xí)中的基礎(chǔ)特征提取,平時把有用的知識點(diǎn)摘抄下來,利用oneNote或者有道云筆記等軟件收集看到的有用信息,這一步的主要目的是通過泛讀把數(shù)據(jù)轉(zhuǎn)化成信息。

第三步簡化,將平常收集到的筆記分門別類,提取中心思想,將同一類思想的信息簡化成幾句話,最后總結(jié)成幾個字,相當(dāng)于機(jī)器學(xué)習(xí)中的復(fù)雜特征提取。67 決策樹與監(jiān)督學(xué)習(xí),復(fù)雜特征提取的是靠近根節(jié)點(diǎn)的特征,是比較抽象和接近本質(zhì)的特征,這些特征或者知識就像核心學(xué)科的核心理論和核心概念,比如生物學(xué)中的DNA遺傳進(jìn)化理論,工程學(xué)中的控制理論,經(jīng)濟(jì)學(xué)中的價值理論。簡化的目的是變成類似神經(jīng)網(wǎng)絡(luò)中的隱藏層節(jié)點(diǎn)64 神經(jīng)網(wǎng)絡(luò)與特征識別,通過簡化和個節(jié)點(diǎn)的關(guān)系組合,就能構(gòu)建類似深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。
第四步是轉(zhuǎn)換,類似于ChatGPT的transformer模型,把之前收集和簡化的知識轉(zhuǎn)化成自己的體系,轉(zhuǎn)換的目的是打通輸入輸出,轉(zhuǎn)換最簡單方法就是多寫作。如果能夠成功轉(zhuǎn)換這一步,就代表利用書本知識構(gòu)建監(jiān)督學(xué)習(xí)的模型框架已經(jīng)完成。轉(zhuǎn)換的方法就是多寫作,多輸出,把自己學(xué)到的知識教授給別人,這也是著名物理學(xué)家費(fèi)曼發(fā)明的“費(fèi)曼學(xué)習(xí)法。”
監(jiān)督學(xué)習(xí)更多的是擬合而非泛化,就是通過歷史數(shù)據(jù)訓(xùn)練模型,訓(xùn)練出的模型能夠很好的處理見過的歷史情況,然后加上強(qiáng)化學(xué)習(xí)的反饋就可以處理實(shí)時變化的狀態(tài)。
第五步是從監(jiān)督學(xué)習(xí)進(jìn)化成無監(jiān)督學(xué)習(xí)模型,類似于從AlphaGo進(jìn)化成Alpha zero,(68 AlphaGo和蒙特卡洛樹搜索)擺脫訓(xùn)練集模型的依賴,獲得了完全獨(dú)立自由的智能。
從監(jiān)督學(xué)習(xí)進(jìn)入非監(jiān)督學(xué)習(xí)要經(jīng)過突然開竅的“頓悟”體驗(yàn),(74 我的頓悟體驗(yàn))頓悟體驗(yàn)是個人思想智慧的一次質(zhì)變,在頓悟之前一定會有大量的學(xué)習(xí)和訓(xùn)練,在偶然的環(huán)境下,就像小時候?qū)W會騎自行車一樣,有個從量變到質(zhì)變的過程,就像突然學(xué)會掌握自行車的喜悅。

頓悟前是向外求的“有導(dǎo)師學(xué)習(xí),頓悟后是以我為主的“無導(dǎo)師學(xué)習(xí)。你會認(rèn)識到你是自由的,自由的思想意味著你的模型已經(jīng)能夠脫離訓(xùn)練集的依賴,能夠處理實(shí)時的環(huán)境狀態(tài)變化,你的輸入信息來源于實(shí)際環(huán)境狀態(tài),你的輸出動作也能直接作用于環(huán)境,最終實(shí)現(xiàn)“知行合一”理想境界。