爾云生信代碼|Milk—基于python語言簡單實(shí)用的機(jī)器學(xué)習(xí)包
Milk是Python的一個(gè)機(jī)器學(xué)習(xí)工具箱,其重點(diǎn)是提供監(jiān)督分類法與幾種有效的分類分析:SVMs (基于libsvm),K-NN,隨機(jī)森林經(jīng)濟(jì)和決策樹,還可以進(jìn)行特征選擇。
科研有捷徑,輸入代碼,一鍵獲取科研成果!就是這么省事,來具體看下有多方便!
搜索http://985.so/a9kb查看全部代碼(目前共計(jì)50+持續(xù)新增中),也可以點(diǎn)擊右側(cè)【目錄】,可以看到更多有趣的代碼;真香提示:文末可以知道如何獲取代碼~
Milk ( Machine Learning Toolkit for Python)剛接觸就首先被他的名字所吸引,“Milk”,正如他的名字一樣,結(jié)構(gòu)小巧,語句簡潔,適用性強(qiáng)。
雖沒有sklearn那樣靈活多變,也沒有orange那樣用戶友善,但是Milk能在強(qiáng)大的python中占有一席之位,還是有它自己獨(dú)到的優(yōu)勢的。
Milk是Python的一個(gè)機(jī)器學(xué)習(xí)工具箱,其重點(diǎn)是提供監(jiān)督分類法與幾種有效的分類分析:SVMs (基于libsvm),K-NN,隨機(jī)森林經(jīng)濟(jì)和決策樹。
它還可以進(jìn)行特征選擇。這些分類可以在許多方面相結(jié)合,形成不同的分類系統(tǒng)。對于無監(jiān)督學(xué)習(xí),它提供K-means和affinity propagation聚類算法。今天我們就來簡單介紹一下這個(gè)簡單實(shí)用的機(jī)器學(xué)習(xí)包Milk。
第一步安裝:
如果你已經(jīng)配置好了python環(huán)境,那么就可以通過如下方法進(jìn)行easy install。當(dāng)然前提是配置了環(huán)境變量。下載地址http://luispedro.org/software/milk
1.?Easy_install milk
2.?Python setup.py install
3.?Pip install milk
第二步訓(xùn)練模型:

圖中我們創(chuàng)建了一個(gè)100*10的矩陣,代表100個(gè)樣本點(diǎn)和10個(gè)特征值。前50個(gè)類別為0,后50個(gè)類別為1。我們利用features和labels來訓(xùn)練模型,輸出一個(gè)精度

可見精度為96%,模型的精度還是很令人滿意的。那么我們?nèi)绾卫媚P瓦M(jìn)行預(yù)測呢?

我們通過隨機(jī)創(chuàng)建一組newfeatures用于預(yù)測,同樣是100個(gè)數(shù)據(jù)點(diǎn),用train這個(gè)類來進(jìn)行建模,通過apply這個(gè)類來進(jìn)行預(yù)測。預(yù)測結(jié)果如下

可見100個(gè)數(shù)據(jù)點(diǎn)中有3個(gè)點(diǎn)預(yù)測錯(cuò)誤,精度為97%,和訓(xùn)練模型時(shí)的估計(jì)精度吻合,說明了我們這個(gè)預(yù)測模型的穩(wěn)健性。
Milk中還提供了其他分類模型,如SVM,Kmeans,nfoldcrossvalidation等模型。從靈活度上來看并不如其他機(jī)器學(xué)習(xí)包,但是就實(shí)用性和復(fù)雜度來說,Milk是一個(gè)十分適合初學(xué)者使用的機(jī)器學(xué)習(xí)包。
