机器之心经授权转载

作者:刘知远

刚刚,清华大学副教授、博士生导师刘知远教师在知乎上宣布了一些文章,为学习 NLP 的同学供给了论文写作辅导。机器之心经授权转载此文章。

前几天刚过完 ACL 2019 投稿季,给不少同学的论文供给了修正主张。其间许多论文,特别是初学者的论文的问题都很相似。一想到未来还要给更多新同学重复这些话,决议干脆把这些主张朱志芬总结出来,不只今后能少费一番口舌,说不定还能协助更多同学。所以就有了这篇短文。

本文标题取「合网游之兔子的报复格」的论文,而不是美丽的论文,或精彩的论文。一个原因是,我自知英文水平特别是词汇有限,从未写过自认精彩或美丽的论文,并无资历供给这方面的主张。另一个原因是,下面会讲到,学术论文的要害方针并非辞藻美丽而是明晰精确,我在这方面还积累了不少经历。凭仗这些经历,信任「辞达已矣」不难,「言之有文」则各凭本事吧。

实际上,同组的刘洋教师对 NLP 学术论文写作做过十分全面而精彩的陈述 [1],强烈推荐全部 NLP 同学都仔细阅览这份陈述,信任会让你少走不少科研的弯路。而本文能够看做对这个陈述的脚注或弥补。

论文在 NLP 学术研讨中的含义

NLP 是一门注重实践和运用的范畴,立异作用能够是新的算法、使命、运用、数据、发现等,必定一个「新」字,其影响力则取决于它对该范畴展开的推进作用。如下图所示,学术研讨是一项系统工程,包含多个环节,共同完成对「立异」的寻求:问题必定应战,模型必定立异,完成必定精确,试验必定深化。

究极合体怪兽吉咖奇美拉

学术研讨是一项系统工程

在这个系统工程中,论文的作用则是,向学术界同行明晰精确地描绘作用的立异点、技能思路、算法细节和验证作用。了解这一点,才干正确的对待论文写作:一项乏善可陈的作业,很难经过写作变得众星捧月;一项充溢立异的作用,却有或许由于糟糕的写作而无法向审稿人精确传递重要价值地点,延误作用宣布。

一篇 NLP 论文的典型结构

NLP 学术会议(乃至包含期刊)论文现已构成比较固定的结构。绝大部分论文由以下六大部分构成:摘要(Abstract)、介绍(Introduction)、相关作业(Related Work)、方法(Method)、试验(Experiment)、定论(Conclusion)。少量论文会依据立异作用方法不同而略有不同,例如提出新数据集的论文,或许会把 Method 部分调整为 Dataset 的标示与剖析,但不影响论文全体构成。每个部分作用不同:

乍看这样每篇论文显得呆板,实际上这正凸显了学术论文的真实含义,不寻求在方法上给读者带来意外,而将读者留心力会集在论文介绍的研讨作用上。

如前所说,论文的作用是向学术界同行明晰精确地描绘作用的立异点、技能思路、算法细节和验证作用。由于学术界的同行评定准则,贯穿全文的头绪和方针便是要证明这份作业的立异价值,每个部分都要各司其职为这个方针而效劳。为了完成这个方针,需求作者特别留心fantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟以下几点:

(1)学会换位考虑。要一直站在审稿人或读者的视点审视论文,考虑怎样更明晰地表达。这是初学者最简略忽视的问题:作为研讨作用的亲历者,论文作者把握全部细节,假如不多加留心,写作中就会出现新概念没有被明晰界说就被运用等状况,许多描绘和剖析短少逻辑联接。对作者而言,这些省去的东西并不影响他对这些文字的了解;但对并不了解这份作业的读者而言,这无疑是一场噩丈母娘吧梦,由于他们并没有作者脑中的那套布景信息。因而,写作时要不时留心,读者读这句时能否了解,所需求的布景常识前文是否现已介绍。

(2)留心逻辑谨慎。谨慎是学术论文的底色,从引证格局、公式符号到谋章造句,虽不至于美国法学期刊的 Bluebook 那么反常,都力求风格一致,行文谨慎。引证、公式、拼写等方面都简略学,初学者更需求留心行文谨慎,力求全文从章节、阶段、语句等不同等级都逻辑严密,争夺做到没有一句话没来由,没有一句话没照顾:

除了全体结构上的主张外,每个部分也各有定式,下面按各部分供给一些写作主张,一起用咱们最近宣布的一篇 ACL 2018 论文 [2人形恶屌] 作为比如。

Abstract 和 Introduction 怎样写

Abstract 能够看做对 Introduction 的概要,所以大与小神会咱们先介绍 Introduction 的写法,然后再说怎样写 Abstract。Introduction 是对整个作业的全面介绍,是决议一篇论文能否被选用的要害。一般 Introduction 这么写:起手介绍研讨使命和含义;随后简介面向这个使命的已有方法;接着阐明已有方法面对的要害应战;针对这些应战,本文提出什么立异思路和详细方法;最终介绍试验作用证明本文提出方法的有用性。这几个部分各挡一面,一起又有严密的内涵逻辑。每个部分也各有规矩,下面别离介绍对各部分的主张:

(1)研讨使命。介绍本文的研讨使命及其在该研讨范畴的重要价值和含义。假如是范畴公认的重要使命的话,则能够不用详细论说其研讨价值/含义;假如是新提出的研讨使命,则需求花费比较多篇幅证明该使命的价值。如下所示论文 [2] 的第 1 段会集阐明阅览了解研讨使命。

(2)已有方法。从研讨使命递进一步,介绍这个使命的已有代表方法。如下所示论文 [2] 的第 2 段,开端介绍 DS-QA。需求留心,这个已有方法需求是现在最好、最具代表性的,也是本文作业预备改善的。所谓站在伟人的膀子上,一篇值得宣布的论文需求找到那个最高的伟人。

(3)面对应战。已有方法必定依然存在某些缺乏或应战,才需求进一步研讨改善。因而,需求总结已有方法面对的应战。这是 Introduction 的要害部分,起着承上启下的作用。初学fantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟者特别留心,这部分触及对已有作业的点评江雪何升,必须确保精准客观。要知道,当论文投稿至 NLP 国际会议后,是经过同行评定决议是否选用宣布,评定人一般是小同行,有很大概率是已有作业的作者。所以这部分论说必定要做到客观公平,让这些作业作者自己也能服气。

如下所示论文 [2] 的第 3、4 段,先介绍 DS-QA 的 noisy labeling 应战,而且经过举例直观出现。面对这个应战,已有一些相关作业,还需阐明他们各自有什么缺乏和应战,为引出本文立异思路做好衬托。

(4)立异思路。水来土掩,兵来将挡,已然已有方法有这些缺乏和应战,就需求有新的立异思路和方法。这部分需求留心与上面的」应战「部分严丝合缝,亲近照顾,让读者清楚领会到这些立异思路与方法确实能够处理或缓解这些应战问题。

如下所示论文 [2] 的第 5 段,便是介绍立异思路和方法。能够看到,一般」面对应战乡韵李东「和」立异思路「部分还配图示,更直观地展现本文要处理的应战问题和立异思路。例如论文 [2] 这张丑丑的图,比较直观地展现了立异方法包含 Selector 和 Reader 两个模块和作用。也能够随意看咱们的其他论文 [3],大部分论文都会在 Introduction 中供给图示。

(5)试验定论。除了在」立异思路「部分图文两开花地阐明本文立异作业外,还要经过合理的试验验证方法的有用性。一般要得到」our method achieves significant and consistent improvement as compared to other baselines「的定论,然后验证本文作业的立异性。

有些论文最终还会关心的总结本文的首要奉献,一般说」In summarfantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟y, 涉传672the key contributions are x-fold: (1)...(2)..泓宣尹南风.(3)...「。这样做的优点是,能够协助审稿人总结本文的立异点放在审稿定见中,节约不少作业量。但需求留心,这些立异点要简洁明晰,不能是前文的简略重复,也不能 overclaim。假如要说」初次「提出或发现,一般也要前置」to the best of our knowledge「。此外还有论文最终一段会介绍接下来几个 Section 结构,个人感觉对一篇 8 页论文或许并不需求。

关于 Abstract,能够看做对 Introduction 的简介,最简略的做法是,以上每部分都精简为 1-2 句话组成 Abstract 皆可。如下念君思断肠是论文 [2] 的 Abstract 内容,能够看出与 Introduction 的对应联络。

Method 怎样写

这部分要详细介绍本文立异方法的详细细节,由于触及十分艰涩的细节,要选用「总-分」结构来介绍。

这部分起手「总」的部分要介绍本文使命的符号界说,以及本文方法的结构组成,或许按过程来介绍或许按模块来写,让读者对本文方法有全景式的了解。如下所示论文 [2] 的 Methodology「总」的部分,就先介绍一些符号,然后别离介绍了 Selector 和 Reader 两个模块的首要功能。

然后进入「分」的部分,则需对应「总」中的结构,别离介绍各要害模块/过程。例如,论文 [2] 的 Methodology」分「的部分,就包含 3.1 Paragraph Selector、3.2 Paragraph Reader、3.3 Learning and Prediction。读者在」总「的部分现已对方法有全景式的了解,有的放矢,就比较简略了解每个模块的详细细节。而每个」分「的部分中,又能够进一步选用」总-分「结构进行介绍,例如 3.1 末节做完整体介绍后,又会依照 Paragraph Encoding 和 Question Encoding 别离介绍。为了更明晰地表现」总-分「结构,能够将各「分」的部分命名并加粗。

初学者特别留心,(1)Introduction 中对立异思路与方法的介绍,不要在 Methofantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟d 中简略重复,否则会让仔细通读全文的审稿人颇感厌烦。要做到前后照顾,有所递进,前略后详,不fantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟妨运用「as mentioned in Section 1」来做相关。(2)Method 部分往往包含许多公式,需求确保公式风格和符号运用前后一致,新符号运用均下线车是什么意思需显式解说。

Experiment 怎样写

家庭电梯价格

这部分要详细介绍与试验相关的详细细节。一般先介绍试验数据、评测规范和比较方法等基本信息。以论文 [2] 为例,试验部分首要介绍试验数据与评测规范(4.1 Datasets and Evaluation Metrics)、试验比较的已有代表方法(4.2 Baselines)、试验方法的参数设置(4.3 Experimental Settings)等基本信息。

在介绍完试验基本信息后,首要展开两种试验:

(1)主试验。意图是证明本文方法与已有方法比较的有用性。一般需求选取业界公认的数据调集或已有作业选用的试验验证方法,提高试验的可信性。关于学术论文而言,并不需求比该使命上最好的方法比较,只需证明选用本fantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟文立异方法与不选用本文方法比较更有用即可,也便是说,试验中尽量操控其他变量,只聚集于本文注重的应战问题即可。当然,假如能够由于本文立异思路,得到该使命上的最好作用,会更有吸引力,但不用总是强求。

一般试验作用用图表展现,然后在正文进行调查剖析。例如,论文 [2] 的主试验部分先介绍不同 Selector 和 Reader 对试验作用的影响(4.4 Effect of Different Paragraph Selectors、4.5 Effect of Different Paragraph Readers),接着介绍主试验作用和调查剖析(4.6 Overall Results)。其间表格中会把最好作用加粗显现,一般应大部分坐落fantastic,清华大学刘知远:怎样写一篇合格的NLP论文,日子感悟本文提出的方法;为了愈加明晰明晰,调查剖析定论可用(1)(2)(3)列出,其间第 1 条一般要得出首要定论,即本文方法要明显优于已有方法。

主试验作用

主试验剖析

(2)辅佐试验。意图是展现本文立异方法的优势和特色。例如,不同超参数对本文方法的影响(Hyper-Parameter Effect),不同模块对本文方法作用的奉献(Ablation Test),不同数据区分对本文方法的影响(如 Few-shot Learnin贺卫方最新状况g 相关作业比较常见),本文方法的首要过错类型(Error Analysis),本文方法能够改善作用的典型样例(Case Study)等。这些试验需求依据论文立异作业特色而有针对性的规划,全部要为表现本文的立异价值而效劳。

例如,论文 [2] 的辅佐试验包含 4.7 Para太极球教育视频graph Selector Performance Analysis、4.8 Performance with different numbers of paragraphs、4.9 Potential improvement、4.10 Case study 等,从各方面出现本文提出方法的特色。

Experiment 部分的特色是要图文并茂,注重经过多个表格和图示来出现本文方法的优势和特色,需求留心图表风格一致。初学者特别留心,要做到仅凭图表下方的阐明文字就能够了解每张图表内容,不要让读者还要到跑到正文寻觅相关阐明。由于,许多有经历的审稿人在看完 Introduction 后,会直接女囚吧跳到 Experiment 图表中寻觅比照作用。

Related Work 怎样写

这部分首要是介绍本文使命和方法的相关作业,方针是经过对已有作业的整理,凸显本文作业的立异价值。对已有作业的整理,不应是对每个作业的简略介绍,而应当留心汇总、分类、剖析,或许依照时间展开次序,或许依照技能道路区分,例如论文 [2] 便是依照时间头绪介绍。

在对相关作业的介绍中,要留心暗合本文立异思路要处理的应战,不应是单纯的攀上女介绍,而是夹叙夹议,时间留心与本文作业的照顾。在 Related Work 的最终,应该落脚到本文作业与已有作业比较,有什么新的思路,处理了什么应战问题。

初学者特别留心,Introduction 和 Related Work 部分是特别需求导师或其他有经历学者协助把关的。一是,不能遗失重要相关作业,这点需求论文作者对相关范畴作业坚持盯梢;二是,与 Introduction 要求相似,对已有作业的评述必须精准客观。

Related Work 一般放在 Introduction 之后,或许 Conclusion 之前,这一般取决于论文作业的特色。关于那些与已有作业联络严密、立异精微的作业,一般主张放在 Introduction 之后,便利读者全面了解本文作业与已有作业的联络,然后开端在 Method 介绍本文方法。而关于有些结构性立异作业,假如首要是对已有方法的组合,一般主张 Related Work 放在 Method、Experiment 之后即可。这点并无成法,彻底依据行文便利来定。

Conclusion 怎样写

在论文最终会有总结展望,一般用一段来再次总结和着重本文的立异思路和试验作用,然后阐明未来主张的研讨方向和敞开问题。这部分相对来讲比较固定。略微留心的是,在预备论文最终阶段,假如发现论文有哪些应作为还没来得及做的,能够写作本文的未来作业。至少能够向审稿人标明你也想到这个问题了,赢得一点同情分。

其他主张

要想写出一篇合格的 NLP 论文,首要是情绪问题,只需情绪注重,才有或许诲人不倦地重复修正,才会「不择手段」地寻觅各种方法来极力改善论文(找学长找外教凭借 Grammarly 东西等)。其次是着手问题,只需写下来,才或许不断改,只需改就能不断前进。最终是经历问题,要写得精彩可同仁圣方能需求天分,而要写得合格,只需坚持写,不断依据评阅人和其他人的定见进行考虑和修正,就能够前进。总归,坚持便是胜利。

实际上,我觉得论文写作,是对思想形式的练习。或许未来你并不会从事学术研讨,但经过论文写作训练的凝练作业立异价值的才能、明晰传递杂乱信息的表达才能,对未来作业中无论是作业交流、作用展现等,都有重要协助。所以还期望我们都能注重这个科研道路上可贵的训练时机。加油!

小结

论文写作有许多需求留心的细节和技巧,许多范畴乃至都有专门的厚厚一本指南来介绍写作技巧。这么一篇短文很难八面玲珑,仅仅介绍一下我辅导同学预备论文提的比较多的主张,期望对我们有用。今后想到任何新的主张,随时更新。也欢迎各位反应主张和问题,共同前进。

相关链接

知乎原文链接:https://zhuanlan.zhihu.com/p/5875pornograph2815?utm_source=wechat_session&utm_medium=social&utm_oi=27569910972416&from=timeline&isappinstalled=0&s_r=0

菜鸟建议「2019 菜鸟全球科技应战赛—智能体积丈量」,近百万元奖金等你来拿,点击阅览原文参加报名。

学术 经历 交流
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间效劳。