最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

我從高效數(shù)據(jù)科學(xué)家那里偷走的15個(gè)習(xí)慣

2021-03-30 17:58 作者:愛數(shù)據(jù)分析社區(qū)  | 我要投稿

來源:雪球

當(dāng)涉及到數(shù)據(jù)科學(xué)領(lǐng)域時(shí),你需要使用一些書中的所有技巧,以使自己獲得一個(gè)使你超越終點(diǎn)的優(yōu)勢。

那么為什么不嘗試一下行業(yè)的良好習(xí)慣呢?

本文并不是成為高效數(shù)據(jù)科學(xué)家的“快速致富”方法。相反,它分享了幫助好的數(shù)據(jù)科學(xué)家達(dá)到他們現(xiàn)在的位置的習(xí)慣。

人們常說,數(shù)據(jù)科學(xué)家的價(jià)值取決于他們對組織的影響。這種影響起始于通過養(yǎng)成良好習(xí)慣成為一名有效的數(shù)據(jù)科學(xué)家。

與時(shí)俱進(jìn)僅在過去十年左右的時(shí)間里出現(xiàn)了多少當(dāng)前的數(shù)據(jù)科學(xué)技術(shù)?他們中的大多數(shù)帶著想要在數(shù)據(jù)科學(xué)領(lǐng)域做出巨大成就的動機(jī),你已成為終身學(xué)習(xí)的一員。不用擔(dān)心,它聽起來并不那么可怕。

但是,你任何時(shí)候都應(yīng)該記住的是,你需要與時(shí)俱進(jìn)。因此,如果你一生都在使用MATLAB進(jìn)行數(shù)據(jù)分析,請嘗試學(xué)習(xí)使用Python來編程。如果你一直在使用Matplotlib來可視化數(shù)據(jù),請嘗試使用Plotly進(jìn)行一些創(chuàng)新。

如何養(yǎng)成這種習(xí)慣:每周花一個(gè)小時(shí)(或盡可能多的時(shí)間),然后嘗試新技術(shù)。閱讀博客文章,找出哪些技術(shù)是相關(guān)的,然后選擇幾個(gè)你想添加到堆棧中的技術(shù)。然,創(chuàng)建一些個(gè)人項(xiàng)目,來學(xué)習(xí)如何充分利用新技術(shù)。

適當(dāng)維護(hù)文檔我似乎總是很幸運(yùn)能夠閱讀和處理具有糟糕文檔的代碼,而沒有支持注釋來幫助我了解到底發(fā)生了什么。

直到一天,我意識到這只是一個(gè)糟糕的程序員的標(biāo)志
我所遇到的的所有優(yōu)秀程序員都提供清晰、簡潔的文檔,并通過提供有用的注釋來描述某些代碼行的用途。對于使用復(fù)雜算法和機(jī)器學(xué)習(xí)模型來解決問題的數(shù)據(jù)科學(xué)家而言,這一點(diǎn)尤為重要。

如何養(yǎng)成這種習(xí)慣:花一些時(shí)間閱讀有良好的代碼文檔,或有關(guān)如何編寫良好的代碼文檔、文章。要練習(xí),為舊的個(gè)人項(xiàng)目寫文檔,或者花一些時(shí)間來修改當(dāng)前項(xiàng)目的文檔。

融入到數(shù)據(jù)科學(xué)的社群人們曾經(jīng)認(rèn)為開發(fā)人員是不能融入社會的流浪者,他們束手無策的編寫注定要統(tǒng)治世界的代碼。這是一種過時(shí)的概括,它無法反映整個(gè)技術(shù)行業(yè)的現(xiàn)代復(fù)雜性。
“沒有人是一個(gè)小島”?——最受數(shù)據(jù)科學(xué)家喜愛的名言。

數(shù)據(jù)科學(xué)的復(fù)雜性要求在數(shù)據(jù)科學(xué)界內(nèi)外建立一個(gè)龐大的專業(yè)人員支持網(wǎng)絡(luò)來解決數(shù)據(jù)科學(xué)家必不可少的各種問題 ,但是,社區(qū)的重要性不僅限于專業(yè)層面。隨著數(shù)據(jù)科學(xué)領(lǐng)域的不斷擴(kuò)大,我們有必要為未來的分析師和工程師鋪平道路,以便他們也可以發(fā)揮影響,并進(jìn)一步支持其他數(shù)據(jù)科學(xué)家。

隨著數(shù)據(jù)科學(xué)領(lǐng)域的“性別”逐漸減少,進(jìn)行必要更改的唯一方法是發(fā)起整個(gè)社區(qū)的運(yùn)動,以激勵行業(yè)進(jìn)行更好的變革。

如何養(yǎng)成這種習(xí)慣:成為一名導(dǎo)師撰寫內(nèi)容豐富的博客文章,加入數(shù)據(jù)科學(xué)論壇并幫助回答問題,建立一個(gè)YouTube頻道來分享你的經(jīng)驗(yàn),參加Kaggle競賽和黑客馬拉松,或創(chuàng)建課程來幫助未來的數(shù)據(jù)科學(xué)家學(xué)習(xí)他們需要進(jìn)入這個(gè)行業(yè)的技能。

定期重構(gòu)你的代碼重構(gòu)是清理代碼而不更改其原始功能的過程,雖然重構(gòu)是軟件開發(fā)環(huán)境中必然產(chǎn)生的過程,但是重構(gòu)對于數(shù)據(jù)科學(xué)家來說可能是一個(gè)有用的習(xí)慣。
重構(gòu)時(shí)我的口頭禪是“少即是多”。

我發(fā)現(xiàn),當(dāng)我最初編寫解決數(shù)據(jù)科學(xué)問題的代碼時(shí),我通常會拋棄良好的編碼習(xí)慣,而編寫在需要時(shí)可用的代碼。換句話說我寫了很多沒有結(jié)構(gòu)的代碼,然后在獲得解決方案后我重新清理代碼。

如何養(yǎng)成這種習(xí)慣:看一下舊代碼,想一想是否可以更高效地編寫相同的代碼,如果是這樣,請花一些時(shí)間來學(xué)習(xí)最佳編碼實(shí)踐,找出可以縮短優(yōu)化和闡明代碼的方法。


優(yōu)化你的工作區(qū)工具和工作流程現(xiàn)在有許多用可提高IDE效率的擴(kuò)展,吃驚的是,有些人還沒有選擇優(yōu)化其工作流程。

這種習(xí)慣對于每個(gè)人來說都是如此獨(dú)特,以至于真正要確定哪些工具、工作空間和工作流程,可能使你成為最有效和最高效的數(shù)據(jù)科學(xué)家、

如何養(yǎng)成這種習(xí)慣:每年一次(如果更適合你,則每年一次),評估你的整體有效性和效率,并確定可以改進(jìn)的地方。也許這意味著早上要首先研究機(jī)器學(xué)習(xí)算法或者坐在健身球上,而不是椅子上。或者在IDE中添加一個(gè)新擴(kuò)展名,從而為你的代碼添色。嘗試使用不同的工作空間工具和工作流程,直到輸入最佳表單為止。

專注于理解商業(yè)問題據(jù)我所知,在數(shù)據(jù)科學(xué)界,75%的工作是理解商業(yè)問題,25%的工作是編寫模型來解決問題。

編程、算法和數(shù)學(xué)是簡單的部分。了解如何實(shí)施它們來解決特定的商業(yè)問題,卻不是那么容易?;ㄙM(fèi)更多的時(shí)間來理解業(yè)務(wù)問題和你要解決的目標(biāo)過程,其他部分將更容易。

要了解你所從事的行業(yè)所面臨的問題,你需要進(jìn)行一些調(diào)查,來收集一些背景信息,去充實(shí)你在這個(gè)方面的知識。例如,你需要了解是什么使特定業(yè)務(wù)的客戶產(chǎn)生興趣,或者一個(gè)工程公司試圖達(dá)到什么目標(biāo)。

如何養(yǎng)成這種習(xí)慣:花一些時(shí)間研究你正在工作的公司及其所從事的行業(yè)。編寫一份可以參考的備忘單,包括公司的主要目標(biāo)和在這個(gè)特定行業(yè)的問題。別忘了寫下你可能要用來解決業(yè)務(wù)問題的算法或有關(guān)機(jī)器學(xué)習(xí)模型的,這些算法將來可能會有用。每當(dāng)你發(fā)現(xiàn)有用的內(nèi)容時(shí),請將其添加到這個(gè)備忘單中。

采用簡約風(fēng)格

不,不是生活。是在在你的代碼和工作流程中。

經(jīng)常有人爭辯說,最好的數(shù)據(jù)科學(xué)家使用最少的代碼,最少的數(shù)據(jù)和最簡單的算法來完成工作。

盡管提倡極簡主義,我不希望你認(rèn)為是不充足的。通常,當(dāng)人們討論代碼中的極簡主義的重要性時(shí),會有人嘗試開發(fā)僅使用幾行代碼的離譜解決方案。不要那么做。是的,這種代碼可以給人留下深刻的印象。但這真的是你最好地利用時(shí)間的方式嗎?

相反,一旦你熟悉了數(shù)據(jù)科學(xué)的概念,就可以開始尋找可以優(yōu)化的代碼來將其變得簡單,簡潔和簡短。使用簡單的算法來完成工作,并且別忘了編寫可重用的函數(shù)來消除冗余。

如何養(yǎng)成這種習(xí)慣:當(dāng)你逐漸在數(shù)據(jù)科學(xué)領(lǐng)域獲得進(jìn)步時(shí),開始敦促自己編寫更有效的解決方案,寫更少的代碼,并使用更簡單的算法和模型來完成工作。學(xué)習(xí)如何在不降低代碼有效性的情況下縮短代碼,并留下大量注釋來解釋合同約定版本的代碼。


使用功能消除復(fù)雜性和冗余

我首先要承認(rèn)在我第一次寫數(shù)據(jù)分析代碼時(shí)嚴(yán)重忽略了函數(shù)的方法。當(dāng)我難以通過各種分析來推理自己的方式時(shí),Spaghetti代碼充滿了我的IDE。如果你查看我的代碼,你會認(rèn)為我寫的太差了,你會想刪除它。

—旦我湊合得到了一個(gè)不錯(cuò)的結(jié)果,我會回去嘗試修復(fù)這個(gè)相當(dāng)于嚴(yán)重事故的代碼。通過將代碼做成函數(shù),我可以快速消除不必要的代碼的復(fù)雜性和冗余。如果我只對代碼重新編譯,我已經(jīng)將其簡化到當(dāng)我重新閱讀它時(shí)我理解我是如何做到的。

如何養(yǎng)成這種習(xí)慣:在寫代碼時(shí)請不要忘記函數(shù)的重要性。人們經(jīng)常說,最好的開發(fā)人員是懶惰的開發(fā)人員,因?yàn)樗麄儠页鋈绾蝿?chuàng)建不需要很多工作的解決方案。在你寫出解決方案后,請重新將多余或復(fù)雜的代碼寫成函數(shù),以幫助組織和簡化代碼。


應(yīng)用測試驅(qū)動的開發(fā)方法

測試驅(qū)動開發(fā)(TDD)是一種軟件開發(fā)原理,專注于編寫具有不斷測試的增量改進(jìn)的代碼。TDD在“紅色,綠色,重構(gòu)”系統(tǒng)上運(yùn)行,該系統(tǒng)鼓勵開發(fā)人員構(gòu)建測試套件,編寫實(shí)現(xiàn)代碼,然后優(yōu)化代碼庫。

數(shù)據(jù)科學(xué)家可以成功使用TDD,來構(gòu)建分析pipeline,進(jìn)行概念證明,使用數(shù)據(jù)子集并確保在開發(fā)過程中不會破壞功能代碼。

如何養(yǎng)成這種習(xí)慣:學(xué)習(xí)TDD的知識,并考慮是否可以在你的工作流中使用這個(gè)原理,TDD并不是針對每個(gè)問題的完美答案,但如果嚴(yán)謹(jǐn)?shù)氖褂?,TDD可能會很有用。


進(jìn)行少量頻繁的提交

你是否經(jīng)歷過提出pull request,計(jì)算機(jī)上出現(xiàn)了錯(cuò)誤消息而且使你的計(jì)算機(jī)崩潰了嗎?我有。那感覺糟透了。


在你想痛擊那個(gè)做出這個(gè)提交的人時(shí),喘口氣,并記住,這個(gè)人顯然沒有花時(shí)間去養(yǎng)成良好的習(xí)慣。


團(tuán)隊(duì)合作的軟件開發(fā)的黃金法則是什么?進(jìn)行少量頻繁的提交。


如何養(yǎng)成這種習(xí)慣:經(jīng)常練習(xí)提交代碼更改,并定期做出請求來獲取最新的代碼。你或他人所做的每項(xiàng)更改都可能破壞整個(gè)項(xiàng)目,因此,進(jìn)行易于恢復(fù)且可能僅影響項(xiàng)目一部分或—部分的小更改很重要。


優(yōu)先發(fā)展自我

取決于你詢問的人,這個(gè)行業(yè)有過多或過少的數(shù)據(jù)科學(xué)家。


無論行業(yè)是處于飽和還是干旱狀態(tài),你都將與大量高素質(zhì)且常常是過高素質(zhì)的求職者競爭。這意味著在申請工作之前,你需要已經(jīng)養(yǎng)成自我提高的習(xí)慣。如今,每個(gè)人都因?yàn)楹侠淼脑蛟谔岣咦陨砑寄?,這—趨勢對數(shù)據(jù)科學(xué)家來說也不例外。


如何養(yǎng)成這種習(xí)慣:列出技能清單,看看你如何滿足雇主在工作崗位上的要求。你是否能有效使用相關(guān)庫(例如Keras,NumPy,Pandas,PyTorch,TensorFlow,Matplotlib,Seaborn和Plotly)的Pythonista嗎?你能否寫一份備忘錄來詳細(xì)說明你的最新發(fā)現(xiàn)以及它們?nèi)绾螌⒛愕墓镜男侍岣?5%?你是否愿意作為團(tuán)隊(duì)的一部分來完成一個(gè)項(xiàng)目?你要試圖找出你的不足之處,而且找到一些好的的在線課程或資源來增強(qiáng)你的技能。


在開始一個(gè)項(xiàng)目時(shí)你要知道項(xiàng)目的期望結(jié)果是什么

Stephen Covey在高效能人才的7個(gè)習(xí)慣中討論了“從始至終”的原則。


為了有效地將其與數(shù)據(jù)科學(xué)項(xiàng)目聯(lián)系起來,您需要在項(xiàng)目的規(guī)劃階段問自己,這個(gè)項(xiàng)目的期望結(jié)果是什么。這將有助于你了解項(xiàng)目的整體結(jié)構(gòu),并提供實(shí)現(xiàn)目標(biāo)所需的成果的路線圖。不僅如此,確定項(xiàng)目的結(jié)果將使您對整個(gè)項(xiàng)目的可行性和可持續(xù)性有所了解。


如何養(yǎng)成這種習(xí)慣:在每個(gè)項(xiàng)目開始時(shí)都要進(jìn)行一個(gè)計(jì)劃會議來準(zhǔn)確地列出了你希望在項(xiàng)目結(jié)束時(shí)實(shí)現(xiàn)的目標(biāo)。確定要嘗試解決的問題,或要收集的證據(jù)。然后,你可以開始回答可行性和可持續(xù)性問題。這些問題將影響項(xiàng)目的里程碑和結(jié)果。之后,你可以使用制定清晰的計(jì)劃,來輔助你編寫代碼和機(jī)器學(xué)習(xí)模型來完成項(xiàng)目。


理解,然后你能被理解

當(dāng)理查德·費(fèi)曼不能夠成功的解釋給大學(xué)新生新生自旋V2粒子服從的原理時(shí),他說道:“我想我可以有把握地說,沒有人真正理解量子力學(xué)。”費(fèi)曼被稱為“偉大的解釋者”,他留下了數(shù)據(jù)科學(xué)家只能希望效仿的遺產(chǎn)。


數(shù)據(jù)科學(xué)是一種使用數(shù)據(jù)講述一個(gè)引人入勝的故事的藝術(shù),只有當(dāng)講故事的人理解了他們試圖講的故事后,它才能成功。換句話說,理解你的任務(wù)才能使你能夠被理解。在了解你要完成的任務(wù)時(shí)盡早養(yǎng)成這種習(xí)慣,這樣你就可以與其他人以相當(dāng)?shù)睦斫馑椒窒硭?,這將使你成為會議室中最有效的數(shù)據(jù)科學(xué)家。


如何養(yǎng)成這種習(xí)慣:使用費(fèi)曼技術(shù)來加深對要嘗試發(fā)現(xiàn)的概念以及要解決的問題的理解。此方法非常適合于分析數(shù)據(jù)然后向一般非數(shù)據(jù)科學(xué)利益相關(guān)者解釋結(jié)果的數(shù)據(jù)科學(xué)過程。簡而言之,你可以將對主題的解釋精簡到可以用任何人都可以理解的簡單,非專業(yè)術(shù)語解釋的程度。


閱讀研究文獻(xiàn)

在這個(gè)由研究生和博士主導(dǎo)的領(lǐng)域,行業(yè)的新聞和見解通常由發(fā)表的文獻(xiàn)分享。


研究文獻(xiàn)是了解他人如何解決問題,擴(kuò)大我們的視野以及了解最新趨勢的有效方法。


如何養(yǎng)成這種習(xí)慣:每周選擇一篇或兩篇與你當(dāng)前的工作或?qū)ψ非蠡蜓芯扛信d趣的技術(shù)有關(guān)的文獻(xiàn)。盡量為每周的文獻(xiàn)閱讀留出時(shí)間,并將其作為優(yōu)先事項(xiàng)。熟悉閱讀論文的ThreePass方法來幫助你快速收集相關(guān)信息。要真正鞏固你對論文的理解,請嘗試將你從閱讀中學(xué)到的東西應(yīng)用到你的項(xiàng)目中或者與同事分享你學(xué)到的東西。


樂于改變


從使用的技術(shù)到實(shí)現(xiàn)的目標(biāo),數(shù)據(jù)科學(xué)的世界正在迅速變化。不要成為那些束手無策,不愿改變的數(shù)據(jù)科學(xué)家。
樂于接受變革,這不僅會迫使你不斷提高專業(yè)水平,而且還使你在瞬息萬變的行業(yè)中保持重要地位,—旦你落后,該行業(yè)將使你脫穎而出。
如何養(yǎng)成這種習(xí)慣:每當(dāng)有新技術(shù)或新方法發(fā)布新聞時(shí),你可以嘗試一下,看看新技術(shù)或新方法帶來了什么。即使你只是閱讀文檔,也可以隨時(shí)了解該行業(yè)不斷變化的趨勢。此外,你可以將有關(guān)技術(shù)的觀點(diǎn)帶入你的公司,并幫助他們應(yīng)對技術(shù)變化和進(jìn)步。作為一個(gè)對實(shí)時(shí)新技術(shù)敏感的人,你將會一直處于領(lǐng)先位置,也可以指導(dǎo)你的團(tuán)隊(duì)和公司尋求更好,更有效的解決方案。
在數(shù)據(jù)科學(xué)職業(yè)的任何階段,養(yǎng)成良好的習(xí)慣可以發(fā)展你成為團(tuán)隊(duì)高效成員的潛力,你將會對任何需要解決的問題做出重大影響。沒有比現(xiàn)在更好的時(shí)間為未來的成功做好準(zhǔn)備。


更多數(shù)據(jù)分析內(nèi)容

掃描二維碼即可了解




我從高效數(shù)據(jù)科學(xué)家那里偷走的15個(gè)習(xí)慣的評論 (共 條)

分享到微博請遵守國家法律
德阳市| 东阳市| 青阳县| 安吉县| 白朗县| 阿城市| 翁源县| 长汀县| 洪湖市| 建阳市| 中方县| 河南省| 绥芬河市| 桐柏县| 霞浦县| 思南县| 鱼台县| 阳山县| 高密市| 上栗县| 大余县| 丽水市| 岳西县| 望奎县| 集贤县| 扎鲁特旗| 遂昌县| 红安县| 保定市| 犍为县| 天镇县| 建宁县| 松原市| 绥江县| 馆陶县| 南澳县| 辉县市| 措美县| 巴里| 蛟河市| 息烽县|