最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

準(zhǔn)研究生必看!保姆級(jí)科研入門(mén)指南分享

2023-05-17 11:59 作者:深度之眼官方賬號(hào)  | 我要投稿

來(lái)源:投稿 作者:小灰灰

編輯:學(xué)姐

本文主要以如何做科研,日常內(nèi)功修煉,常見(jiàn)科研誤區(qū),整理日常‘好論文’四個(gè)部分做以介紹,方便剛?cè)腴T(mén)的科研者進(jìn)行很好的規(guī)劃。

1.如何做科研

1.1 選方向

當(dāng)我們剛步入科研的第一步時(shí),首選就要選擇課題和方向,那么面對(duì)實(shí)驗(yàn)室很多項(xiàng)目和課題,一般選擇方向需要一定的積累,而且很多題目風(fēng)險(xiǎn)性很高,所以要做的就有兩個(gè)點(diǎn),一個(gè)是多跟老師討論,還有一個(gè)笨方法就是關(guān)注一下目前最頂級(jí)的研究機(jī)構(gòu),關(guān)注目前的主流模型,他們?cè)谧鍪裁矗敲次覀兙涂梢赃x擇這個(gè)方向,并且實(shí)時(shí)監(jiān)控他們的科研進(jìn)展。

那么方向有了,那么就可以關(guān)注一些頂級(jí)會(huì)議的方向:

  • IR(信息檢索):人工智能領(lǐng)域智能信息檢索方向最權(quán)威的頂級(jí)國(guó)際會(huì)議(SIGUIR),國(guó)際計(jì)算機(jī)學(xué)會(huì)信息與知識(shí)管理大會(huì)(CIKM)

  • NLP(自然語(yǔ)言處理):ACL,NAACL,EMNLP,IJCNLP

  • ML&AI:NeurIPS

  • DM(數(shù)據(jù)挖掘):知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘頂級(jí)會(huì)議(SIGKDD)

  • CV(計(jì)算機(jī)視覺(jué)):ICCV、CVPR、 AAAI

  • ……

1.2 查找文獻(xiàn)

知道了頂級(jí)會(huì)議的方向,那么就是如何找參考文獻(xiàn)了,選擇好方向之后,想要更快的知道本領(lǐng)域的研究?jī)?nèi)容:

  1. 可以先從中文綜述入手找到合適的英文論文

  2. 對(duì)知識(shí)點(diǎn)的理解,可以借助知乎,csdn等平臺(tái)鞏固知識(shí)點(diǎn)

  3. 文獻(xiàn)的下載可以使用google scholar,百度學(xué)術(shù)去查找,一般最新的論文一般百度學(xué)術(shù)檢索不到

  4. 從論文找論文

  5. 從被引論文找相關(guān)論文

一般推薦幾個(gè)網(wǎng)站:

https://paperswithcode.com/ ? ---查看論文是否有代碼的網(wǎng)站

https://www.aminer.cn/ ? 由清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系建立,收錄了sci,ccf優(yōu)秀論文

https://www.semanticscholar.org/ 語(yǔ)義學(xué)者(Semantic Scholar)是由微軟聯(lián)合創(chuàng)始人 Paul Allen 做的免費(fèi)學(xué)術(shù)搜索引擎。

當(dāng)然也可以從本校的圖書(shū)館進(jìn)去查找相關(guān)文獻(xiàn)。

1.3 讀文獻(xiàn)

1.那么我們查找了好多文獻(xiàn),下載了很多,讀不懂怎么辦呢,首先可以和師兄,老師整理一下,本領(lǐng)域的單詞,同時(shí)也可以看下b站上,有關(guān)讀論文的一些視頻,比如李沐的視頻:https://www.bilibili.com/video/BV1H44y1t75x/?spm_id_from=333.337.search-card.all.click

2.平時(shí)不斷積累本領(lǐng)域的一些方法,模型

3.從論文中找到本論文中是根據(jù)哪篇論文中的研究點(diǎn),解決了哪些問(wèn)題。

1.4 建立模型

那么論文大概讀懂了,怎么落實(shí)行動(dòng),依靠代碼實(shí)現(xiàn)出來(lái)呢?就要建立模型。初學(xué)者建議從工具使用入手熟悉模型的輸入輸出,逐漸了解模型背后的原理,對(duì)于特定的問(wèn)題進(jìn)行整理代碼。

那么拿到一篇論文,我們要做好復(fù)現(xiàn),對(duì)于初學(xué)者就是找到有代碼的論文,理清從數(shù)據(jù)到模型一系列的輸入輸出數(shù)據(jù)流,選擇自己的工具(pytorch,tensorflow)搭建簡(jiǎn)單的模型框架,這個(gè)過(guò)程一定要親自動(dòng)手,進(jìn)行搭積木,從而了解模型背后的數(shù)學(xué)原理,尤其對(duì)一些常用的模型了解背后的數(shù)學(xué)原理,做到魔改,尤其是本方向的特定任務(wù),要非常熟悉,從而進(jìn)行創(chuàng)新。

1.5 設(shè)計(jì)實(shí)驗(yàn)

一般讀論文開(kāi)始要格外關(guān)注實(shí)驗(yàn)的設(shè)計(jì),評(píng)測(cè)指標(biāo)是否選擇合理,在跑實(shí)驗(yàn)的時(shí)候,發(fā)現(xiàn)效果不好,要思考,為什么不好,是什么原因?qū)е逻@種效果,你選擇的模型的假設(shè)是否和數(shù)據(jù)有什么沖突,特別是面對(duì)效果很好的時(shí)候要稍加注意。

不要放棄,如果做不下去,說(shuō)不定可以找到一些衍生的點(diǎn)。一定要總結(jié),發(fā)現(xiàn)問(wèn)題。

1.6 如何寫(xiě)論文

那么實(shí)驗(yàn)有了,要整理實(shí)驗(yàn),準(zhǔn)備寫(xiě)論文,寫(xiě)好論文

  1. 首先要邏輯過(guò)關(guān),保證基本的語(yǔ)法,找出研究領(lǐng)域內(nèi)的高頻詞,常用詞和通用詞,可以做一次系統(tǒng)性的語(yǔ)法學(xué)習(xí)

  2. 大量閱讀論文,摘抄經(jīng)典句子,通用句子,優(yōu)美句子,可以先不要看摘要,練習(xí)復(fù)寫(xiě)摘要

  3. 可以先給老師講清楚創(chuàng)新點(diǎn),防止出現(xiàn)邏輯的一些突然轉(zhuǎn)折,不清楚的問(wèn)題。

2.日常內(nèi)功修煉

2.1 讀論文

從大量的論文中,分析出粗讀論文和精讀論文,一般每周精讀3-5篇相關(guān)論文。那么要讀到什么地步呢,就要從一篇論文回答以下的內(nèi)容:

  1. 記住作者的名字,進(jìn)而follow

  2. 記住題目,主要是為了防止可以盡快找到

  3. 要非常容易的說(shuō)出本篇論文有什么缺點(diǎn),毛病

  4. 很容易用一句話說(shuō)出本篇論文為什么新,很容易發(fā)表,他的貢獻(xiàn)點(diǎn)是什么。

  5. 可以很容易說(shuō)出和這篇論文有類(lèi)似的若干篇論文

  6. 很容易說(shuō)出本篇論文的技術(shù)細(xì)節(jié)

  7. 很容易說(shuō)出本篇論文的實(shí)驗(yàn)細(xì)節(jié)

  8. 最難的是怎么想著把本篇論文的創(chuàng)新點(diǎn)應(yīng)用到本方向。

2.2 學(xué)機(jī)器學(xué)習(xí)

  1. 沒(méi)事可以學(xué)習(xí)機(jī)器學(xué)習(xí)的東西,決策樹(shù),SVM,了解其中的背后的數(shù)學(xué)原理,

  2. 經(jīng)常參加學(xué)術(shù)報(bào)告

  3. 系統(tǒng)上過(guò)一門(mén)機(jī)器學(xué)習(xí)公開(kāi)課

  4. 數(shù)學(xué)推導(dǎo)寫(xiě)出簡(jiǎn)單的筆記當(dāng)作是最終的理解,可以用白板推導(dǎo)。

  5. 以代碼實(shí)現(xiàn)為最終掌握

2.3 寫(xiě)代碼

  1. 必須掌握一門(mén)語(yǔ)言,一般難度的模型應(yīng)該三天左右可以復(fù)現(xiàn)

  2. 找一個(gè)成熟的工具包或者代碼庫(kù)入手進(jìn)行拓展,而且練習(xí)時(shí)要做到良好的代碼風(fēng)格。

  3. 做到復(fù)用

  4. 一定要做到代碼開(kāi)源,結(jié)果能夠復(fù)現(xiàn)就好,平時(shí)多做積累

2.4 ?觀察數(shù)據(jù),收集數(shù)據(jù)

  1. 可以清晰準(zhǔn)確快速的了解一個(gè)數(shù)據(jù)集合和自己當(dāng)前任務(wù)的關(guān)系,比如有100個(gè)實(shí)驗(yàn),那么就要做100次實(shí)驗(yàn)嗎,如果能夠做到對(duì)數(shù)據(jù)了解,那么里面有的方法可以推翻,不需要做實(shí)驗(yàn),或者做實(shí)驗(yàn)的過(guò)程中,就可以判斷這個(gè)方法的好壞,清晰預(yù)判一個(gè)方法在一個(gè)數(shù)據(jù)上的正確結(jié)果,哪些方法可以適用,哪些不適應(yīng),自己一定要清楚。

  2. 能夠發(fā)現(xiàn)實(shí)驗(yàn)結(jié)果中的一些問(wèn)題,進(jìn)而總結(jié)實(shí)驗(yàn)中的一些規(guī)律,多看一些bad case,總結(jié)規(guī)律??偨Y(jié)一下,在三年或者四年的學(xué)習(xí)中,你是否具備了以下條件:

  • 掌握一門(mén)編程語(yǔ)言,可以自己動(dòng)手完成一個(gè)模型的主干框架的開(kāi)發(fā)。

  • 熟悉基本的機(jī)器學(xué)習(xí)基礎(chǔ),要做到能夠白板推導(dǎo)出來(lái)。

  • 掌握自己本方向自己之前從未做過(guò)的任務(wù)

  • 能夠獨(dú)立發(fā)表一篇本方向的相關(guān)論文,做到獨(dú)立科研

  • 能夠帶領(lǐng)低年級(jí)同學(xué)做科研。

3.常見(jiàn)科研誤區(qū)

  1. 不要認(rèn)為ccf-a,一區(qū)的論文就是最好的,要辯證的看法,不要在于來(lái)源,學(xué)會(huì)找準(zhǔn)創(chuàng)新點(diǎn)

  2. 不要認(rèn)為調(diào)參能找到好結(jié)果,如果是好的方法,調(diào)參不應(yīng)該很艱難

  3. 如果有一組參數(shù)效果很好,但是其他組參數(shù)都不太好,需要高度注意

  4. 不要把模型弄的過(guò)于復(fù)雜,要想辦法提取核心的創(chuàng)新點(diǎn)。

  5. 不要搭積木,一個(gè)好的創(chuàng)新點(diǎn)要好于三個(gè)分散的創(chuàng)新點(diǎn)。

  6. 在投稿前都應(yīng)該問(wèn)一下,本文在這個(gè)工作中解決了什么問(wèn)題,技術(shù)創(chuàng)新是什么,別人讀了會(huì)有什么收獲。

  7. 學(xué)會(huì)講故事,營(yíng)造問(wèn)題。

4.賞析好論文

可以以Language Models are Unsupervised Multitask Learners 和 Language Models are Few-Shot Learners 這兩篇論文自己賞析一下,找到好的句子,溫故知新。

論文資料也幫你們準(zhǔn)備了!

關(guān)注“學(xué)姐帶你玩AI"公眾號(hào),回復(fù)“500”直接領(lǐng)取

還有40+本AI必讀書(shū)籍PDF資料,回復(fù)“電子書(shū)”或者點(diǎn)菜單欄都能領(lǐng)

準(zhǔn)研究生必看!保姆級(jí)科研入門(mén)指南分享的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
台安县| 兴国县| 麻城市| 博湖县| 桓仁| 芮城县| 故城县| 晋宁县| 枣阳市| 锡林浩特市| 平潭县| 延边| 鄢陵县| 车险| 大厂| 繁峙县| 呼玛县| 龙门县| 博罗县| 拜城县| 合肥市| 花垣县| 扶风县| 饶河县| 铜陵市| 天水市| 苍南县| 环江| 通辽市| 紫云| 高州市| 开封县| 志丹县| 庐江县| 樟树市| 赫章县| 凤城市| 鄱阳县| 额济纳旗| 芜湖市| 胶州市|