能力水平鑒定的數(shù)學模型
比如我們有一張數(shù)學考卷,總共10個題,難度分別為1-10。
假如我的能力水平為7,大于7的題我都不會做,小于7的題目我都會做。
然后V代表對,X代表錯,我的答題狀況是VVVVVVVXXX,V代表對,X代表錯,所以我的能力水平被鑒定為7。
-----------
實際考試中,我的能力水平為7,并不意味著大于7的題我都不會做,小于7的題目我都會做,有可能有10%的難度6的題我不會做,10%的難度為8的題我會做。我的做題對錯是一個概率分布,按照難度,這個概率值遞減。為了概率分布計算,我們假設題目的難度也不是離散的,是0-無窮的實數(shù),難度可以無窮大,但是能力水平最高依然只能判定為10。
那么我的能力水平到底對應哪個數(shù)學變量呢?
-----------
為了好理解,我這里換一個例子。
用英語單詞舉例。我的能力水平就是我所掌握的單詞總數(shù)。
但很顯然能力水平也可以有其它的數(shù)學量,我們按照單詞的實際出現(xiàn)頻率百分比給所有單詞排序。然后把我所掌握的單詞的頻率百分比加起來,然后得到一個百分比值,也可以作為能力水平指標。
但是,百分比值并沒有單詞總數(shù)有參考價值,這是因為99%和99.9%中間可能差了幾千個單詞。
能力水平鑒定結(jié)果需要符合人類的直覺認知,所以我們還是使用單詞總數(shù)這個指標。
-----------
如何得到能力水平鑒定結(jié)果?
我們回到最前面最簡化的模型上來。
前面說我的答題狀況是VVVVVVVXXX。前面7個V的期望是4,中位數(shù)也是4。后面3個X的期望是9,中位數(shù)也是9。這里我們假定期望并不適合作為能力水平鑒定結(jié)果掛鉤,所以后面不考慮期望的問題,只考慮中位數(shù)。我們能不能使用4得到7這個數(shù)字呢?
我們會做的題目難度的中位數(shù)已知,求我們的能力水平。
在這個數(shù)學模型下很簡單,4+(4-1),中位數(shù)加上一半的區(qū)間寬度。
同理,也可以通過“不”會做的題目難度的中位數(shù)已知,求我們的能力水平。
(題外話:9-(9-1)-1。再減1 是因為其實我們的能力水平應該取7和8的中間值,但是這里取了7,假如我們的題目難度視作連續(xù)的,也就不存在再減1的問題。)
-----------
為了容易理解,回到英語單詞的模型上來。
我們知道,所有單詞書都不是嚴格卡著單詞詞頻取詞的。
比如一本單詞書是3500詞,意味著有些詞在詞頻表中超越了3500,有些則正好相反。
我們也可以把自己看作一本單詞書。
這里有三個變量,分別對應7,4,9。
一個是我所掌握的單詞的個數(shù),一個是我所掌握的單詞的中位數(shù),一個是我所未掌握單詞的中位數(shù)。
7是需要窮舉獲得的,獲得的成本很高,假如模型是連續(xù)的或者數(shù)學題目是無窮多的,窮舉甚至不可能實現(xiàn)。
文章到這里,你應該就明白本文要做什么。
我們可以通過少量統(tǒng)計樣本,近似獲得4或9,我們要通過4或9得到7!
-----------
題外話:
單詞書中的單詞在詞頻表中的分布是離散的,也是有規(guī)律的。詞頻高的詞我們掌握的可能性很高一點,低頻低的詞則正好相反。
我們畫一個概率分布圖,橫軸為詞頻表上第幾個單詞,縱軸為我們掌握該單詞的概率。
對于我們?nèi)藖碚f,這個曲線應該是一個單調(diào)遞減曲線,假設這個分布服從類似于指數(shù)分布的分布吧。
單詞書有的是從a開始的初階單詞書,也類似于指數(shù)分布;有的是從abandon開始的中階單詞書,類似于對數(shù)正態(tài)分布;我還有一本高階單詞書是從adalone開始的,更接近于正態(tài)分布。
-----------
回歸到479的問題。
從4到7的過程中,引入了一個值,4加半個區(qū)間寬度等于7,這個區(qū)間寬度是什么?
首先VVVVVVVXXX是一個階躍函數(shù),階躍函數(shù)有一個值不為0的區(qū)間,從而有區(qū)間寬度。
剛才提到三個分布,指數(shù)分布,對數(shù)正態(tài)分布,正態(tài)分布,它們并不同于階躍函數(shù)。
于是產(chǎn)生一個問題,對于指數(shù)分布,對數(shù)正態(tài)分布,正態(tài)分布,它們的7是個什么東西?
單詞書中往往都會提一個東西,叫你背會我這個單詞書,你的單詞量能達到多少多少,這個值就是7。中高階單詞書默認你已經(jīng)了解了一定的單詞量,如果補上這些單詞,我會假設它更像偏移了Y軸的指數(shù)分布。所以主要還是要考慮指數(shù)分布。
初中高階單詞書你也可以用數(shù)學類比看作,加減乘除,解方程組,抽象代數(shù)。
剛才寫到一句話,“這里我們假定期望并不適合作為能力水平鑒定結(jié)果掛鉤,所以后面不考慮期望的問題,只考慮中位數(shù)”,為什么?
指數(shù)分布的期望和中位數(shù)是不同的,中位數(shù)大概是0.693倍的期望值(0.693是ln2的近似)。期望值計算過程中極端樣本值會對結(jié)果影響很大,中位數(shù)處于樣本50%的位置,直覺上也更加合理。
這里強調(diào)一下,前面兩次提到了“直覺”,所以能力水平鑒定是一個帶有感性的數(shù)值,在一件感性的事情上過度追求小數(shù)點后幾位的精確是沒有意義的。
-----------
7是指數(shù)分布的中位數(shù),那4是什么?9又是什么?
首先VVVVVVVXXX是一個階躍函數(shù),并非指數(shù)函數(shù)。其次剛才提到一句話“如果補上這些單詞,我會假設它更像偏移了Y軸的指數(shù)分布”。什么叫“偏移了Y軸的指數(shù)分布”。意思是把它看成指數(shù)分布,你的橫軸起點并不是難度1,而是你默認前面難度已經(jīng)完全掌握了,你從這個難度開始看作指數(shù)分布。4是階躍模型下的概念,在指數(shù)分布的概念下,4就是7。
-----------
留一個思考題:9是不是7呢?
-----------
上面這個題目翻譯一下。
就是你在你不會的單詞中隨機抽取一個樣本,然后按詞頻表順序,獲得一個中位數(shù),這個中位數(shù)能不能代表你的單詞量呢?
假設你選取一本初級單詞書,從其中你在你不會的單詞中隨機抽取一個樣本,這個樣本的中位數(shù)會不會和你選取一本中級單詞書、和你選取一本高級單詞書的中位數(shù)相等呢?