GitHub星標11.9k!超 3 萬行代碼機器學習開源項目分享!
今天給大家分享一個超剽悍的開源項目,目前在github上已獲11.9k星標。
項目作者是普林斯頓博士后David Bourgin,他用 NumPy 手推了一大波 ML 模型,基本上把主流模型都實現(xiàn)了一遍,這個工作量學姐直呼牛X。
雖然現(xiàn)在手寫模型已經(jīng)不是主流了,但在理解底層架構(gòu)和深度學習原理方面還是非常有效的,當你想了解模型 API 背后的實現(xiàn),又不想看復雜的框架代碼時,這就是最好的參考。
項目內(nèi)容
這個令人震撼的項目有超過 3 萬行代碼、30 多個主流機器學習和深度學習模型,此外還有 15 個用于預處理和計算的小工具,全部.py 文件數(shù)量有 62 個。平均每個模型的代碼行數(shù)在 500 行以上,在神經(jīng)網(wǎng)絡模型的 layer.py 文件中,代碼行數(shù)接近 4000。

在每一個代碼集下,作者還會提供不同實現(xiàn)的參考資料,例如模型的效果示例圖、參考論文和參考鏈接等。

學姐愿稱之為目前用NumPy手寫機器學習模型的“最高境界”。
該項目最大的特點就是把主流的算法模型都用 NumPy 手寫了一遍。機器學習涵蓋隱馬爾可夫模型、線性回歸、最近鄰等經(jīng)典方法,而深度模型則主要從各種模塊、層級、最優(yōu)化器等角度搭建代碼架構(gòu),從而能快速構(gòu)建各種神經(jīng)網(wǎng)絡??梢哉f它就是一個機器學習框架了,而且代碼可讀性會強很多。
除了模型之外,該項目還提供了一些輔助模塊,學姐也都幫大家整理打包好了!
掃碼添加小享,回復“ML模型”??
免費獲取項目完整源碼和配套資料庫
