Datawhale八月組隊學(xué)習(xí)
開源貢獻(xiàn):Datawhale團(tuán)隊
本月組隊學(xué)習(xí),是目前學(xué)習(xí)系列最多的一次。不僅包含吃瓜教程(西瓜書+南瓜書)、李宏毅深度學(xué)習(xí)、動手學(xué)數(shù)據(jù)分析、NLP入門、還包括數(shù)據(jù)采集、數(shù)據(jù)化運(yùn)營、SQL、R語言等多個模塊。

關(guān)于開源
Datawhale作為開源組織,更多是希望營造互促的學(xué)習(xí)氛圍和純粹的學(xué)習(xí)環(huán)境,所有學(xué)習(xí)內(nèi)容和學(xué)習(xí)規(guī)劃都將開源在Datawhale Github上,方便大家有監(jiān)督和無監(jiān)督學(xué)習(xí),從而幫助到更多學(xué)習(xí)者成長。
開源內(nèi)容
截止今日,Datawhale已經(jīng)近開源50多門學(xué)習(xí)內(nèi)容,涉及編程、數(shù)據(jù)科學(xué)、cv、nlp、強(qiáng)化學(xué)習(xí)和推薦系統(tǒng)6大模塊,這來自每一個開源貢獻(xiàn)者的參與。
開源地址
https://github.com/datawhalechina/team-learning
什么是組隊學(xué)習(xí)?
顧名思義,就是一群志同道合的小伙伴,一起學(xué)習(xí)討論,一起克服拖延癥,一起組隊打boss。沒有老師,沒有教學(xué),有的是一群熱愛學(xué)習(xí)和渴望改變的人,交流學(xué)習(xí),互促共進(jìn)。或許你可以從這些文章進(jìn)一步了解:《聞韶:我的組隊學(xué)習(xí)經(jīng)歷》、《紅星:組隊學(xué)習(xí)那些事兒》、《黃元帥:組隊學(xué)習(xí)的大航海模型》
開源學(xué)習(xí)
機(jī)器學(xué)習(xí)
開源貢獻(xiàn):謝文睿、秦州、薛皖中
內(nèi)容說明:周志華老師的“西瓜書”是機(jī)器學(xué)習(xí)經(jīng)典入門教材,值得反復(fù)閱讀,配合“南瓜書”從本科數(shù)學(xué)基礎(chǔ)的視角進(jìn)行講解,一起打好基礎(chǔ)!
任務(wù)路線:以《機(jī)器學(xué)習(xí)》西瓜書為主線,配合南瓜書攻克疑難點(diǎn)。
學(xué)習(xí)周期:18天
定位人群:有本科數(shù)學(xué)基礎(chǔ)(高等數(shù)學(xué)、線性代數(shù)、概率論與數(shù)理統(tǒng)計)的同學(xué)
任務(wù)預(yù)覽
Task02:概覽西瓜書、南瓜書第3章(6天)
《機(jī)器學(xué)習(xí)》第3章
涉及的線性回歸等數(shù)學(xué)難點(diǎn)
開源貢獻(xiàn):李祖賢、薛傳雨、六一、楊毅遠(yuǎn)、陳琰鈺、陳玉立、解婷婷內(nèi)容說明:詳細(xì)介紹了機(jī)器學(xué)習(xí)領(lǐng)域中最經(jīng)典的算法并給出了相應(yīng)的數(shù)學(xué)推導(dǎo)和代碼,對于每個算法都進(jìn)行了細(xì)致的分析以及必要的代碼的演示,便于學(xué)習(xí)者深刻理解本質(zhì)。在案例的代碼中也給出了詳細(xì)的代碼注釋。任務(wù)路線:掌握基本的回歸模型、偏差與方差理論、回歸模型的評估及超參數(shù)調(diào)優(yōu)等學(xué)習(xí)周期:20天定位人群:具備本科數(shù)學(xué)基礎(chǔ),會使用常見的數(shù)據(jù)分析工具,既想系統(tǒng)學(xué)習(xí)sklearn工具庫解決機(jī)器學(xué)習(xí)問題,又想系統(tǒng)學(xué)習(xí)機(jī)器學(xué)習(xí)算法理論的數(shù)學(xué)推導(dǎo)的學(xué)習(xí)者。
任務(wù)預(yù)覽
Task02:回歸問題(2天)
數(shù)據(jù)科學(xué)永恒不變的主題也許就是調(diào)參吧,從偏差與方差理論中得到啟發(fā),從數(shù)學(xué)理論和代碼上掌握回歸模型的評估及超參數(shù)調(diào)優(yōu)
數(shù)據(jù)科學(xué)
3.數(shù)據(jù)采集從入門到精通
開源貢獻(xiàn):牧小熊、姜萌、葉前坤
內(nèi)容說明:學(xué)會使用八爪魚進(jìn)行數(shù)據(jù)采集,核心亮點(diǎn)是數(shù)據(jù)采集的簡單化、可視化以及無代碼化。提示:不過多講解爬蟲的相關(guān)知識
任務(wù)路線:掌握數(shù)據(jù)采集工具八爪魚的學(xué)習(xí)方法,能夠采集相關(guān)數(shù)據(jù)
組隊學(xué)習(xí)周期:14天
定位人群:不用敲代碼,對數(shù)據(jù)采集有興趣的同學(xué)都可
任務(wù)預(yù)覽
Task02 自動識別初體驗(yàn) (3天)
微博數(shù)據(jù)抓取
豆瓣圖書輸出抓取
采集邏輯與流程*
4.SQL編程語言
開源貢獻(xiàn):王復(fù)振、楊煜、閆鐘峰、楊夢迪、蘇鵬、紅星、張晉、汪健麟、勇躍、王嘉鵬、陳鍇、牧小熊、葛爽
內(nèi)容說明:Follow me,從 0 到 1 掌握 SQL,決勝秋招。
任務(wù)路線:完成SQL使用環(huán)境搭建,了解關(guān)系型數(shù)據(jù)庫的基本特點(diǎn),熟悉SQL增刪改查基本操作,進(jìn)一步掌握視圖、子查詢、函數(shù)、窗口函數(shù)等高階用法,最后試一試秋招秘籍,檢驗(yàn)下自己學(xué)習(xí)的效果。
組隊學(xué)習(xí)周期:15天
定位人群:0基礎(chǔ)學(xué)員,希望掌握SQL基礎(chǔ)查詢的同學(xué)
任務(wù)預(yù)覽
Task04 集合運(yùn)算(3天)
?表的加減法
?連結(jié)(JOIN)
5.R語言數(shù)據(jù)科學(xué)
開源貢獻(xiàn):張晉、楊佳達(dá)、牧小熊、楊楊卓然、姚昱君、劉娜
內(nèi)容說明:學(xué)會使用R語言,并應(yīng)用其完成統(tǒng)計分析、可視化、建模等操作。說明:本課程適用于R語言入門,不會過多講解統(tǒng)計、模型方面底層原理。
任務(wù)路線:掌握R語言基本操作,利用R語言進(jìn)行數(shù)據(jù)清洗,了解R語言中的統(tǒng)計分析、可視化分析、模型分析。
組隊學(xué)習(xí)周期:16天
定位人群:對數(shù)據(jù)科學(xué)有基本了解,希望學(xué)習(xí)R語言的同學(xué)
任務(wù)預(yù)覽
Task02 數(shù)據(jù)清洗與準(zhǔn)備 (3天)
重復(fù)值處理
缺失值識別與處理
異常值識別與處理
特征處理
規(guī)范化與偏態(tài)數(shù)據(jù)
6.動手學(xué)數(shù)據(jù)分析
開源貢獻(xiàn):陳安東、金娟娟、楊佳達(dá)、老表、李玲、張文濤、高立業(yè)、李婉樺、范佳慧、July、葉前坤
內(nèi)容說明:以項目為主線,通過邊學(xué),邊做以及邊被引導(dǎo)的方式,既掌握知識點(diǎn)又能掌握數(shù)據(jù)分析的大致思路和流程。
任務(wù)路線:了解數(shù)據(jù)分析中基本庫的操作;熟悉數(shù)據(jù)分析的操作流程,建立數(shù)據(jù)分析思維,入門數(shù)據(jù)建模。
組隊學(xué)習(xí)周期:11天
定位人群:懂一些python,希望入門數(shù)據(jù)分析的學(xué)習(xí)者。
任務(wù)預(yù)覽
Task01:數(shù)據(jù)加載及探索性數(shù)據(jù)分析(2天)
了解數(shù)據(jù)加載以及數(shù)據(jù)觀察
掌握pandas基礎(chǔ)
完成探索性數(shù)據(jù)分析
7.基于Python的會員數(shù)據(jù)化運(yùn)營
開源貢獻(xiàn):紅星、曹志賓、孫健坤、劉雯靜、李晴晴
內(nèi)容說明:了解企業(yè)數(shù)據(jù)化運(yùn)營中,運(yùn)用數(shù)據(jù)工具對會員進(jìn)行運(yùn)營的思路和方法,了解RFM模型的運(yùn)用,掌握Python處理數(shù)據(jù)的技巧,掌握Excel表的可視化圖表及透視工具。
任務(wù)路線:第一周學(xué)習(xí)和體會業(yè)務(wù)場景中數(shù)據(jù)化運(yùn)營的重要性和方法論,第二周對數(shù)據(jù)化運(yùn)營中用戶分析模型RFM模型進(jìn)行實(shí)操和練習(xí)
組隊學(xué)習(xí)周期:14天
定位人群:對業(yè)務(wù)類數(shù)據(jù)分析感興趣者、希望深入了解業(yè)務(wù)知識的應(yīng)屆生或在校生等
任務(wù)預(yù)覽
Task01:數(shù)據(jù)化運(yùn)營知識板塊的學(xué)習(xí)(7天)
數(shù)據(jù)化運(yùn)營概述
會員運(yùn)營與用戶運(yùn)營概述
會員數(shù)據(jù)指標(biāo)及分析模型介紹
深度學(xué)習(xí)
開源貢獻(xiàn):王茂霖、陳安東、劉崢嶸、李玲、牛志康
內(nèi)容說明:輔助大家更好學(xué)習(xí)李宏毅老師機(jī)器學(xué)習(xí)視頻,并加入相關(guān)補(bǔ)充資料,相信你會對機(jī)器學(xué)習(xí)有更加深刻的理解。
任務(wù)路線:李宏毅視頻+解讀輔助
學(xué)習(xí)周期:14天
定位人群:深度學(xué)習(xí)初學(xué)者,有微積分,線性代數(shù)基礎(chǔ)
任務(wù)預(yù)覽
Task:深度學(xué)習(xí)介紹
整體介紹深度學(xué)習(xí)的發(fā)展,現(xiàn)狀和分類
了解深度學(xué)習(xí)的基礎(chǔ)知識
9.基于transformers的自然語言處理(NLP)入門
開源貢獻(xiàn):多多、erenup、張帆、張賢、李濼秋、蔡杰、hlzhang、段秋陽
內(nèi)容說明:希望結(jié)合形象生動的原理講解和多個動手實(shí)踐項目,幫助初學(xué)者快速入門深度學(xué)習(xí)時代的NLP
任務(wù)路線:以NLP經(jīng)典任務(wù)和Transformer為主線,配合經(jīng)典模型講解和7個經(jīng)典人物的代碼實(shí)踐
組隊學(xué)習(xí)周期:16天
定位人群:NLP初學(xué)者,有一定的python、pytorch編程基礎(chǔ),了解和知道簡單的深度學(xué)習(xí)模型
任務(wù)預(yù)覽
Task03:編寫一個Transformer模型:BERT(2天)
3.1-如何實(shí)現(xiàn)一個BERT
3.2-如何應(yīng)用一個BERT
3.3-篇章小測
?數(shù)理基礎(chǔ)
10.考研數(shù)學(xué)(一二三通用)【第一期】
開源貢獻(xiàn):李祖賢、張智涵、戴治旭、黃浩霖、邱廣坤
內(nèi)容說明:本課程主要針對考研的同學(xué),另外如果想系統(tǒng)學(xué)習(xí)大學(xué)數(shù)學(xué),或者是想為深造機(jī)器學(xué)習(xí)補(bǔ)充數(shù)學(xué)基礎(chǔ)的的同學(xué)也是可以進(jìn)來的,前提是必須要跟上節(jié)奏,不能掉隊。
任務(wù)路線:以張宇考研數(shù)學(xué)為主線,進(jìn)行講解。第一期為從極限理論到一元函數(shù)積分學(xué)的計算
學(xué)習(xí)周期:8月份第一期24天,截至12月共5期
定位人群:2022考研學(xué)生???特別提示:本課程跟隨組隊學(xué)習(xí)進(jìn)度開展,可在當(dāng)月組隊學(xué)習(xí)開始時加入正在進(jìn)行的學(xué)習(xí)內(nèi)容
任務(wù)預(yù)覽
Task01:函數(shù)極限與連續(xù)性(3天)
青少年編程
11.Scratch 一級
開源貢獻(xiàn):王思齊、馬燕鵬
內(nèi)容說明:抽取電子學(xué)會青少年編程能力等級測試圖形化一級的真題來組成試卷,在做題目的過程中掌握圖形化編程的基本知識。
任務(wù)路線:由于測試題目為往年電子學(xué)會Scratch一級考試的真題,所以通過做題來掌握Scratch一級考試的知識點(diǎn),為通過考試做準(zhǔn)備。
組隊學(xué)習(xí)周期:12天
定位人群:對圖形化編程感興趣的小朋友(小學(xué)3年級及以上)
任務(wù)預(yù)覽
Task04:測試四(2天)
判斷題、選擇題測試
編程題測試

參與學(xué)習(xí)
快速通道
1. ?機(jī)器學(xué)習(xí):吃瓜教程?
開源內(nèi)容:https://github.com/datawhalechina/pumpkin-book
2.?集成學(xué)習(xí)???開源內(nèi)容:https://github.com/datawhalechina/ensemble-learning
3. 數(shù)據(jù)采集從入門到精通?開源內(nèi)容:https://github.com/datawhalechina/team-learning-program/tree/master/CollectData
4. SQL編程語言?開源內(nèi)容:https://github.com/datawhalechina/wonderful-sql
5. R語言 數(shù)據(jù)科學(xué)?開源內(nèi)容:https://github.com/datawhalechina/team-learning-program/tree/master/RLanguage
6. 動手學(xué)數(shù)據(jù)分析??開源內(nèi)容:https://github.com/datawhalechina/hands-on-data-analysis
7. 基于Python的會員數(shù)據(jù)化運(yùn)營??開源內(nèi)容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/MemberOperations
8. 李宏毅深度學(xué)習(xí)??
開源內(nèi)容:https://github.com/datawhalechina/leeml-notes
9. 基于transformers的NLP入門??開源內(nèi)容:https://github.com/datawhalechina/Learn-NLP-with-Transformers
10. 考研高等數(shù)學(xué)??開源內(nèi)容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/Mathematics
11.?青少年編程(Turtle)?開源內(nèi)容:https://github.com/datawhalechina/team-learning-program/tree/master/Scratch
學(xué)習(xí)規(guī)則
為了我們更好的學(xué)習(xí)效果,請關(guān)注以下規(guī)則:
1. 需交督促金3塊(1塊學(xué)習(xí),1塊分享,1塊成長),按時完成所有任務(wù)返還;2. 需要有Github或博客等公共賬號,記錄學(xué)習(xí)筆記打卡;
3. 未按時打卡的同學(xué)會被抱出群
組隊學(xué)習(xí)報名
??時間:8月14日(周六)中午11:30
??方式:在Datawhale高校群/在職群參與報名學(xué)習(xí)。
關(guān)注公眾號,后臺回復(fù)關(guān)鍵詞“在校”或“在職”進(jìn)群;已在則無需重復(fù)加入。
由于組織學(xué)習(xí)非盈利,精力有限,未報名成功可以根據(jù)開源教程自行安排自學(xué)。