如何寫一篇合格的NLP論文?
NLP 是一門重視實踐和應(yīng)用的領(lǐng)域,創(chuàng)新成果可以是新的算法、任務(wù)、應(yīng)用、數(shù)據(jù)、發(fā)現(xiàn)等,它的影響力則取決于它對該領(lǐng)域發(fā)展的推動作用。而學(xué)術(shù)論文的作用是,向?qū)W術(shù)界同行清晰準(zhǔn)確地描述成果的創(chuàng)新點、技術(shù)思路、算法細(xì)節(jié)和驗證結(jié)果。
那么一篇合格的NLP論文到底長啥樣?每個部分具體應(yīng)該怎么寫呢?
看這一篇文章就夠了。
01一篇 NLP 論文的典型結(jié)構(gòu)
NLP 學(xué)術(shù)會議(甚至包括期刊)論文已經(jīng)形成比較固定的結(jié)構(gòu)。絕大部分論文由以下六大部分構(gòu)成:摘要(Abstract)、介紹(Introduction)、相關(guān)工作(Related Work)、方法(Method)、實驗(Experiment)、結(jié)論(Conclusion)。少數(shù)論文會根據(jù)創(chuàng)新成果形式不同而略有不同,例如提出新數(shù)據(jù)集的論文,可能會把 Method 部分調(diào)整為 Dataset 的標(biāo)注與分析,但不影響論文整體構(gòu)成。每個部分作用不同:
摘要:用 100-200 詞簡介研究任務(wù)與挑戰(zhàn)、解決思路與方法、實驗效果與結(jié)論。
介紹:用 1 頁左右篇幅,比摘要更詳細(xì)地介紹研究任務(wù)、已有方法、主要挑戰(zhàn)、解決思路、具體方法、實驗結(jié)果。
相關(guān)工作:用 0.5-1 頁左右篇幅介紹研究任務(wù)的相關(guān)工作,說明本文工作與已有工作的異同。
方法:用 2-3 頁篇幅介紹本文提出的方法模型細(xì)節(jié)。
實驗:用 2-3 頁篇幅介紹驗證本文方法有效性的實驗設(shè)置、數(shù)據(jù)集合、實驗結(jié)果、分析討論等。
結(jié)論:簡單總結(jié)本文主要工作,展望未來研究方向。
乍看這樣每篇論文顯得死板,實際上這正凸顯了學(xué)術(shù)論文的真正意義,不追求在形式上給讀者帶來意外,而將讀者注意力集中在論文介紹的研究成果上。
此外,在寫學(xué)術(shù)論文的時候,很多同學(xué)總會走入一些誤區(qū)。因此下面這兩點務(wù)必要注意。否則很容易遭到退稿。
02論文作者要關(guān)注的點
一、學(xué)會換位思考。要始終站在審稿人或讀者的角度審視論文,思考如何更清晰地表達(dá)。
二、注意邏輯嚴(yán)謹(jǐn)。嚴(yán)謹(jǐn)是學(xué)術(shù)論文的底色,從引用格式、公式符號到謀章造句,都力求風(fēng)格統(tǒng)一,行文嚴(yán)謹(jǐn)。
章節(jié)層面,Introduciton 提到已有方法面臨的幾個挑戰(zhàn),就要對應(yīng)本文提出的幾個創(chuàng)新思路,對應(yīng) Method 中的幾個具體算法,對應(yīng) Experiment 中的幾個實驗驗證。
段落和句子層面,段間要注意照應(yīng),是并列、遞進(jìn)、轉(zhuǎn)折還是總分關(guān)系,需要前期規(guī)劃好,要有相應(yīng)句子或副詞銜接。段內(nèi)各句,有總有分,中心思想句和圍繞論述句分工協(xié)作。
03Abstract 和 Introduction 怎么寫
Abstract和?Introduction?作為論文開篇的兩部分,是讀者對你這篇論文的第一印象,同時,很多審稿人也會先通過論文摘要和簡介來先對論文做一個初步的評判。
Abstract 可以看做對 Introduction 的提要,Introduction 是對整個工作的全面介紹,是決定一篇論文能否被錄用的關(guān)鍵。一般 Introduction 這么寫:起手介紹研究任務(wù)和意義;隨后簡介面向這個任務(wù)的已有方法;接著說明已有方法面臨的關(guān)鍵挑戰(zhàn);針對這些挑戰(zhàn),本文提出什么創(chuàng)新思路和具體方法;最后介紹實驗結(jié)果證明本文提出方法的有效性。這幾個部分各擋一面,同時又有嚴(yán)密的內(nèi)在邏輯。每個部分也各有章法,下面分別介紹對各部分的建議:
(1)研究任務(wù)。介紹本文的研究任務(wù)及其在該研究領(lǐng)域的重要價值和意義。如果是領(lǐng)域公認(rèn)的重要任務(wù)的話,則可以不用詳細(xì)論述其研究價值/意義;如果是新提出的研究任務(wù),則需要花費比較多篇幅說明該任務(wù)的價值。
(2)已有方法。從研究任務(wù)遞進(jìn)一步,介紹這個任務(wù)的已有代表方法。需要注意,這個已有方法需要是目前最好、最具代表性的,也是本文工作準(zhǔn)備改進(jìn)的。所謂站在巨人的肩膀上,一篇值得發(fā)表的論文需要找到那個最高的巨人。?
(3)面臨挑戰(zhàn)。已有方法一定仍然存在某些不足或挑戰(zhàn),才需要進(jìn)一步研究改進(jìn)。因此,需要總結(jié)已有方法面臨的挑戰(zhàn)。這是 Introduction 的關(guān)鍵部分,起著承上啟下的作用。
(4)創(chuàng)新思路。既然已有方法有這些不足和挑戰(zhàn),就需要有新的創(chuàng)新思路和方法。這部分需要注意與上面的挑戰(zhàn)部分相互呼應(yīng),讓讀者清楚領(lǐng)會到這些創(chuàng)新思路與方法的確能夠解決或緩解這些挑戰(zhàn)問題。
(5)實驗結(jié)論。除了在創(chuàng)新思路部分圖文兩開花地說明本文創(chuàng)新工作外,還要通過合理的實驗驗證方法的有效性。
對于 Abstract,可以看做對 Introduction 的簡介,最簡單的做法是,以上每部分都精簡為 1-2 句話組成 Abstract 皆可。
04Method 怎么寫
這部分要詳細(xì)介紹本文創(chuàng)新方法的具體細(xì)節(jié),由于涉及非常艱澀的細(xì)節(jié),要采用總-分結(jié)構(gòu)來介紹。
這部分起手“總”的部分要介紹本文任務(wù)的符號定義,以及本文方法的框架組成,或者按步驟來介紹或者按模塊來寫,讓讀者對本文方法有全景式的理解。
然后進(jìn)入“分”的部分,則需對應(yīng)「總」中的框架,分別介紹各關(guān)鍵模塊/步驟。讀者在“總”的部分已經(jīng)對方法有全景式的了解,有的放矢,就比較容易理解每個模塊的具體細(xì)節(jié)。而每個“分”的部分中,又可以進(jìn)一步采用“總-分”結(jié)構(gòu)進(jìn)行介紹。為了更清晰地體現(xiàn)“總-分”結(jié)構(gòu),可以將各“分”的部分命名并加粗。
05Experiment 怎么寫
這部分要詳細(xì)介紹與實驗相關(guān)的具體細(xì)節(jié)。一般先介紹實驗數(shù)據(jù)、評測標(biāo)準(zhǔn)和比較方法等基本信息。
在介紹完實驗基本信息后,主要開展兩種實驗:
(1)主實驗。目的是證明本文方法與已有方法相比的有效性。一般需要選取業(yè)界公認(rèn)的數(shù)據(jù)集合或已有工作采用的實驗驗證方式,提升實驗的可信性。對于學(xué)術(shù)論文而言,并不需要比該任務(wù)上最好的方法相比,只要證明采用本文創(chuàng)新方法與不采用本文方法相比更有效即可。
(2)輔助實驗。目的是展示本文創(chuàng)新方法的優(yōu)勢和特點。例如,不同超參數(shù)對本文方法的影響(Hyper-Parameter Effect),不同模塊對本文方法效果的貢獻(xiàn)(Ablation Test),不同數(shù)據(jù)劃分對本文方法的影響(如 Few-shot Learning 相關(guān)工作比較常見),本文方法的主要錯誤類型(Error Analysis),本文方法能夠改進(jìn)效果的典型樣例(Case Study)等。
Experiment 部分的特點是要圖文并茂,注重通過多個表格和圖示來呈現(xiàn)本文方法的優(yōu)勢和特點,需要注意圖表風(fēng)格統(tǒng)一。初學(xué)者特別注意,要做到僅憑圖表下方的說明文字就可以理解每張圖表內(nèi)容,不要讓讀者還要到跑到正文尋找相關(guān)說明。因為,很多有經(jīng)驗的審稿人在看完 Introduction 后,會直接跳到 Experiment 圖表中尋找對比效果。
06Related Work 怎么寫
這部分主要是介紹本文任務(wù)和方法的相關(guān)工作,目標(biāo)是通過對已有工作的梳理,凸顯本文工作的創(chuàng)新價值。對已有工作的梳理,不應(yīng)是對每個工作的簡單介紹,而應(yīng)當(dāng)注意匯總、分類、分析,或者按照時間發(fā)展順序,或者按照技術(shù)路線劃分。
在對相關(guān)工作的介紹中,要注意暗合本文創(chuàng)新思路要解決的挑戰(zhàn),不應(yīng)是單純的介紹,而是夾敘夾議,時刻注意與本文工作的照應(yīng)。在 Related Work 的最后,應(yīng)該落腳到本文工作與已有工作相比,有什么新的思路,解決了什么挑戰(zhàn)問題。
Related Work 一般放在 Introduction 之后,或者 Conclusion 之前,這一般取決于論文工作的特點,一般建議 Related Work 放在 Method、Experiment 之后即可。這點并無成法,完全根據(jù)行文方便來定。?
07Conclusion 怎么寫
在論文最后會有總結(jié)展望,一般用一段來再次總結(jié)和強(qiáng)調(diào)本文的創(chuàng)新思路和實驗結(jié)果,然后說明未來建議的研究方向和開放問題。這部分相對來講比較固定。稍微留意的是,在準(zhǔn)備論文最后階段,如果發(fā)現(xiàn)論文有哪些應(yīng)當(dāng)做還沒來得及做的,可以寫作本文的未來工作。至少可以向?qū)徃迦吮砻髂阋蚕氲竭@個問題了,贏得一點同情分。?
——————分割線——————
一篇好的論文到底長啥樣?
會有無數(shù)的人告訴你一二三四五點,但是一定都離不開論文的價值。
最近也也咨詢了一位KDD、ACL頂會的PC委員、審稿人,他的意見是,
發(fā)文最核心的一點,就是你的研究有沒有做出貢獻(xiàn)。
下周8月24、25日,
沃恩智慧特邀請NLP領(lǐng)域頂會PC委員、審稿人親自帶讀最新論文,
詳解一篇NLP論文的idea從何而來?
私信獲取聽課鏈接
免費進(jìn)公開課群交流