這份Trick指南太強(qiáng)了
網(wǎng)上沖浪時(shí)發(fā)現(xiàn)的一份涵蓋機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、數(shù)學(xué)、數(shù)據(jù)分析、Python編程、甚至Jupyter等等,共200+ tips的“Trick Book”
大致瀏覽了內(nèi)容,制作還是相當(dāng)用心的,示例搭配圖解,主打簡(jiǎn)約通俗易懂
無(wú)論是豐富野生技能還是擴(kuò)充面經(jīng)都不錯(cuò)

https://www.blog.dailydoseofds.com/p/free-daily-dose-of-data-science-pdf
出不去的/懶的:公眾號(hào)【啥都會(huì)一點(diǎn)的研究生】后臺(tái)回復(fù)【trickbook】
部分內(nèi)容展示




部分目錄

機(jī)器學(xué)習(xí)算法是否都依賴于梯度下降?(9)
為什么Sklearn的線性回歸沒有超參數(shù)?(11)
使用Jupyter DataTables豐富Pandas DataFrame的默認(rèn)預(yù)覽。(13)?
通過(guò)這個(gè)簡(jiǎn)單的圖形可視化線性回歸的性能。(14)?
通過(guò)這個(gè)簡(jiǎn)單的技巧使熱圖更豐富。(16)?
置信區(qū)間和預(yù)測(cè)區(qū)間不是相同的概念。(17)?
機(jī)器學(xué)習(xí)中性能指標(biāo)的終極分類。(19)?
用最酷的Matplotlib技巧直觀地創(chuàng)建子圖。(23)?
將Python項(xiàng)目目錄作為腳本執(zhí)行。(25)?
單熱編碼中最常被忽視的問題。(26)?
數(shù)據(jù)科學(xué)中最重要的9個(gè)圖表。(28)?
在訓(xùn)練機(jī)器學(xué)習(xí)模型之前,分類特征編碼是否總是必要的?(30)
Scikit-LLM:將Sklearn API與大型語(yǔ)言模型集成。(33)?
訓(xùn)練準(zhǔn)確度和訓(xùn)練損失的反直覺行為。(34)
?Sigmoid函數(shù)實(shí)現(xiàn)中一個(gè)常被忽視的要點(diǎn)。(38)
?聚類算法的終極分類。(41)
?在不改變?nèi)魏未a的情況下改進(jìn)Python運(yùn)行時(shí)間。(43)
?Pandas合并方法中一個(gè)不太為人知的特性。(45)?
最酷的GitHub-Colab集成,你會(huì)驚嘆不已。(47)?
大多數(shù)Sklearn用戶對(duì)其LinearRegression實(shí)現(xiàn)的這個(gè)問題不了解。(48)?
使用Stickyland打破筆記本的線性呈現(xiàn)方式。(50)
?通過(guò)這個(gè)簡(jiǎn)單的圖形可視化任何線性回歸模型的性能。(51)
?瀑布圖:一種更好的替代線條/柱形圖的方式。(53)
?Google樣式指南對(duì)導(dǎo)入的要求是什么?(54)
?如何真正使用訓(xùn)練集、驗(yàn)證集和測(cè)試集?(56)
?在不丟失變量的情況下重新啟動(dòng)Jupyter內(nèi)核。(59)
?在使用PCA之前需要考慮的優(yōu)缺點(diǎn)。(60)?
損失函數(shù):一個(gè)按算法分類的全面總結(jié)。(62)?
在訓(xùn)練機(jī)器學(xué)習(xí)模型之前,數(shù)據(jù)歸一化總是必要的嗎?(64)
?使用Pigeon按鈕注釋數(shù)據(jù)。(67)
?用Sankey圖豐富混淆矩陣。(68)?
隨機(jī)梯度下降、小批量梯度下降和批量梯度下降的可視化指南。(70)?
for循環(huán)和列表推導(dǎo)之間一個(gè)不太為人知的區(qū)別。(73)
?PCA的一個(gè)常被忽視的限制。(75)?
魔術(shù)方法:Python面向?qū)ο缶幊讨幸粋€(gè)被低估的亮點(diǎn)。(78)?
許多人不屑于記住的回歸算法分類。(81)?
分析Pandas DataFrame時(shí)一個(gè)高度被忽視的方法。(83)
?用Bump Charts可視化隨時(shí)間的排名變化。(84)
?使用這個(gè)簡(jiǎn)單的技巧永遠(yuǎn)不必再為TP、TN、FP和FN而努力。(85)
?關(guān)于Pandas中原位操作最常見的誤解。(87)?
用Mercury在Jupyter Notebook中構(gòu)建優(yōu)雅的Web應(yīng)用程序。(89)
?用Pandas轉(zhuǎn)SQL實(shí)現(xiàn)成為雙語(yǔ)數(shù)據(jù)科學(xué)家。(91)?
Sklearn的一個(gè)不太為人知的特性,用于在大型數(shù)據(jù)集上訓(xùn)練模型。(93)
?用一行代碼創(chuàng)建專業(yè)外觀的Matplotlib圖形。(95)?
在索引DataFrame時(shí)避免這個(gè)代價(jià)高昂的錯(cuò)誤。(97)
用更靈活的方式運(yùn)行Python腳本的9個(gè)命令行標(biāo)志。(100)
KMeans呼吸法:比KMeans更好、更快的替代方法(102)?
在使用PCA時(shí),應(yīng)該將數(shù)據(jù)降到多少維?(105)?
Mito剛剛通過(guò)AI加速了?。?08)?
在使用總結(jié)統(tǒng)計(jì)數(shù)據(jù)之前,要謹(jǐn)慎得出任何結(jié)論(110)
?在布爾上下文中使用自定義的Python對(duì)象(112)?
機(jī)器學(xué)習(xí)中抽樣技術(shù)的可視化指南(114)
?你可能對(duì)元組的不可變性得到了不完整的信息(118)
一個(gè)簡(jiǎn)單的技巧,顯著提高M(jìn)atplotlib圖的質(zhì)量(120)?
PCA的視覺和過(guò)于簡(jiǎn)化的指南(122)?
用ipyflow強(qiáng)化你的Jupyter內(nèi)核(125)
?使用Plotly創(chuàng)建圖形的一個(gè)鮮為人知的特性(127)?
歐氏距離的局限性,許多人經(jīng)常忽視(129)
?可視化正則化參數(shù)的影響(132)
?AutoProfiler:在你工作時(shí)自動(dòng)分析你的DataFrame(134)
?一點(diǎn)額外的努力可以極大地改變你的講故事技巧(136)?
Python中一個(gè)讓許多程序員不知道的隱含功能(138)
?通過(guò)Sankey圖交互地可視化決策樹(141)?
小心使用直方圖。它們是非常誤導(dǎo)性的?。?43)
?三種簡(jiǎn)單的方法(即時(shí))讓你的散點(diǎn)圖整潔無(wú)雜亂(145)
?在下次使用KMeans之前需要考慮的(非常)重要的一點(diǎn)(148)
?為什么你應(yīng)該避免向DataFrame添加行(151)
?Matplotlib有許多隱藏的寶石。這是其中之一(153)?
關(guān)于Python字典的一個(gè)違反直覺的事情(155)
?執(zhí)行Python代碼的可能是最快的方法(158)?
你確定你正在使用正確的Pandas術(shù)語(yǔ)嗎?(160)
類不平衡問題總是一個(gè)大問題需要解決嗎?(163)
?一個(gè)簡(jiǎn)單的技巧,使熱圖更加優(yōu)雅(165)
?局部聚類和密度聚類的可視化對(duì)比(167)?
為什么我們不稱之為邏輯分類而不是邏輯回歸?(168)
?關(guān)于決策樹的一個(gè)典型問題,許多人經(jīng)常忽視(170)
?在使用線性回歸之前始終驗(yàn)證輸出變量(171)
?關(guān)于Python函數(shù)的一個(gè)違反直覺的事實(shí)(172)
?為什么在訓(xùn)練機(jī)器學(xué)習(xí)模型之前對(duì)數(shù)據(jù)集進(jìn)行洗牌很重要?(173)
?熱圖的限制正在拖慢你的數(shù)據(jù)分析(174)
?皮爾遜相關(guān)性的限制,許多人經(jīng)常忽視(175)
?為什么我們通常建議設(shè)置隨機(jī)生成器的種子?(176)?
一個(gè)被低估的提高數(shù)據(jù)可視化的技巧(177)
?在Jupyter Notebook中創(chuàng)建圖表和透視表的無(wú)代碼工具(178)?
如果你無(wú)法編寫矢量化的方法,可以嘗試這個(gè)(179)?
為什么我們通常建議不要迭代DataFrame?(181)?
在Python中操縱可變對(duì)象有時(shí)會(huì)讓人困惑(182)
?這個(gè)小調(diào)整可以顯著提升KMeans的運(yùn)行時(shí)間(184)?
大多數(shù)Python程序員不知道關(guān)于Python面向?qū)ο缶幊痰倪@個(gè)問題(186)
?誰(shuí)說(shuō)Matplotlib不能創(chuàng)建交互式圖形?(188)
?不要?jiǎng)?chuàng)建混亂的條形圖,而是嘗試氣泡圖?。?89)?
你可以將列表添加為字典的鍵(技術(shù)上可以)!(190)?
許多人在使用線性回歸時(shí)經(jīng)常忽視這一點(diǎn)(191)
?35個(gè)隱藏的Python庫(kù),它們是絕對(duì)的寶藏(192)?
小心使用箱形圖!它們可能會(huì)誤導(dǎo)你(193)?
創(chuàng)建更好的數(shù)據(jù)圖的一個(gè)被低估的技巧(194)?
每個(gè)數(shù)據(jù)科學(xué)家一直在等待的Pandas DataFrame擴(kuò)展(195)
?使用Xonsh用Python增強(qiáng)Shell(196)?
大多數(shù)命令行用戶不知道關(guān)于使用終端的這個(gè)酷技巧(197)?
一個(gè)簡(jiǎn)單的技巧,充分利用Pandas中的透視表(198)?
為什么Python不提供真正的面向?qū)ο蠓庋b?(199)?
在使用Pandas讀取CSV時(shí),再也不必?fù)?dān)心解析錯(cuò)誤(200)
使用Pandas創(chuàng)建圖表的有趣而鮮為人知的方法(201)
?大多數(shù)Python程序員對(duì)Python for循環(huán)不知情(202)
?如何在Python中啟用函數(shù)重載(203)
?編寫Pandas代碼時(shí)生成有用的提示(204)
?使用Bottleneck將NumPy方法加速25倍(205)
可視化神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)轉(zhuǎn)換(206)?
不再手動(dòng)重構(gòu)代碼,而是使用Sourcery!(207)
?在幾秒鐘內(nèi)繪制你正在尋找的數(shù)據(jù)(208)?
為了使Matplotlib圖更具吸引力而進(jìn)行樣式設(shè)置(209)?
將Pandas的Parquet I/O加速5倍(210)?
40個(gè)開源工具,為你的Pandas工作流提速(211)
?停止使用Pandas的describe方法。改用Skimpy(212)?
以正確的方式升級(jí)Python庫(kù)(213)?
使用Sklearn一行代碼預(yù)覽決策樹(214)?
停止使用Pandas的describe方法。改用Summarytools(215)?
再也不用手動(dòng)搜索Jupyter筆記本以找到你的代碼了(216)?
f-strings比你想象的更加多功能(217)
?這是有史以來(lái)最好的KMeans動(dòng)畫指南嗎?(218)?
改善模型性能的有效但被低估的技術(shù)(219)?
直接從終端創(chuàng)建數(shù)據(jù)圖(220)?
使你的Matplotlib圖更專業(yè)(221)?
37個(gè)隱藏的Python庫(kù),它們是絕對(duì)的寶藏(222)?