旷视研究院 · 5月20日

论文要怎么读?研究院院长孙剑的最新体会都在这里了

首发:旷视研究院
作者:旷视研究院

之前给大家分享了很多优秀论文,也收到了小伙伴们纷纷发来的好评。那么,如何能让大家更好的理解这些论文,小编特邀了旷视研究院院长孙剑,分享他的点滴思考——论文要怎么读。

image.png

关于论文要怎么读,孙老师的导师微软公司前执行副总裁沈向洋博士写过一个精彩的文章:《读科研论文的三个层次、四个阶段与十个问题》。 沈向洋博士的文章谈到了读论文的四种境界(消极阅读、主动阅读、批判性阅读、创造性阅读)、三个层次(速度、精度与研读)、和十大问题(例如,论点?意义?局限?如果见到读者,我想问他什么?等)。

基于沈博士的文章,孙老师补充了一些自己的个人体会,如:

  • 读论文可总结成“获取输入”、“产生输出”两个目的;
  • 在获取领域知识方面,要兼顾“深度”和“广度”;
  • 论文的几个核心部分该怎么读;
  • 在产生创新方面,要懂得“论剑”和“欣赏”;
  • 研工作者作为知识分子的一员,应该“过量阅读”。

以下是孙老师思考的全部精华,快来一起学习和分享:

读论文大概可以总结成两个方面的目的:一方面是积累领域知识、了解最新进展,目的是获取输入;另一方面是通过阅读这个过程激活自己的思、刺激自己的创新欲望,目的是产生输出。

在获取领域知识方面

概况地说要兼顾“深度”和“广度”

01

深度

自己研究方向的文献脉络要深入梳理。通过按照方法的本质特性,把已有工作归成几大类(例如:直接法 v.s. 迭代法,一步法 v.s. 两步法,基于 xxx 的方法),会很容易方便以后的阅读和写作。梳理也要尽可能覆盖全面,标准是如果正在写一篇论文,这个方向最近十几年的标杆性工作,最近几年的热点工作,最近几个月的最新工作都不要漏掉。

02

广度

自己研究方向的相关领域文献也要把重点工作读到。创新能力的根基是联想能力,交叉学科最容易出创新。坚持读短期不能受益的论文,长期会有大益处。这个阅读范围可大可小,因人而异,因决心而异。我自己读博士的时候,每年计算机视觉、SIGGRAPH和机器学习论文加起来一共几百篇,基本都要或粗或浅过一下,做到对整个领域的进展心里有数。

论文的几个部分如何读?

Abstract 我一般在自己决定是否要读一篇论文的时候会读。但是如果是已经确定是一篇要读的论文(经典论文或者他人推荐的),我经常跳过。一个好的电影谁想先看故事梗概呢?

Introduction 是我最喜欢读的部分。它可以让你了解作者对论题甚至该领域的真知灼见,加深自己对领域的理解。通常要真的弄懂一个领域,2-3年的积累和沉淀是要的。

一个好的引言是什么样的?Don Geman 给过一个标准:如果读者是论文reviewer,看完引言就可以决定是否accept or reject了。计算机科学很多时候是一层窗户纸,Introduction会点破这层窗户纸,同行一看就明白整个论文在做什么,意义有多大了。一篇好的Introduction,一定会对读者带来或多或少的心里冲击。

* Related Works 可以帮助我们查查漏读了哪些文章。如果你对当前领域已经很熟悉了,也可以跳过。另外在阅读相关文献时,高频出现的名字或单位一般是这个领域的关键贡献者,我们平时就可以多跟踪他们的出品。

Approach 部分阅读的原则是先整体,后部分。一般论文会有一个概况文字描述,或者配有一个系统框图,我们先快速了解全貌,特别是部分之间的关系。然后再具体研读每一个部分。

Experiment 部分如果和我们手头的工作很相关,就要非常仔细的看细节。否则,就重点看看实验结果是否有力地支持了文章的论点。

Conclusion 可以看看作者指出的方法局限性和下一步工作。但是要小心,一般比较明显的下一步工作要么作者已经做了,要么可能是个大坑。

读完论文后找人交流一下读后感会很有益处旷视研究院的 Paper Reading 论坛是个很好的交流方式。大家会每天分享论文解读和进行评论,甚至还经常有人报告复现结果和复现中发现的问题。通过了解别人的观点,就能够更全面的理解一篇文章,同时也增强了自己全面看问题的能力。

在产生创新方面

两点很重要:“论剑”和“欣赏”

01

论剑

毛主席说过“与人斗,其乐无穷”。其实科研领域也有自己的“华山论剑”。每个领域每年都有其“旗舰”会议,例如计算机视觉领域的CVPR,机器学习领域的NIPS,大家都会在上面通过发表论文比试一番,看看谁现在做的最好,谁站在华山之巅。

做研究也需要有些“论剑”精神,尤其是阅读到本领域最新的好工作,会不由地产生“为什么我没有想到?”,“这帮家伙跑到我的前面去了”,会加大紧迫感和焦虑感,从而激发自己的好胜心,迫使自己重新审视对问题的理解,加大思考的时间和强度。只有脑子投入到一定的强度,才会出来更多的想法。

02

欣赏

阅读到一篇好的工作后,能够带给我们更大创新的动力是欣赏:“这真是一个非常棒的想法”,“实验做的真扎实”,“问题分析和理解的真深刻”,“这哥们真牛”等。对好东西的欣赏,会激发自己也做出好东西的愿望;会觉得自己能够为科技历史做出哪怕再小的贡献,也是非常有意义的。所谓愿景就是超越自己的某个东西。这个对于科研这种终身马拉松来说,这是至关重要的能量源泉。

在技术层面,欣赏也对我们以开放心态地接受广泛的观点或方法大有益处。一个常见的现象是能力到达一定程度的研究员,往往看不上这个看不上那个,“这个工作不就是 xxx 吗”。这其实是危害很大的。自我封闭必然降低创新能力。中国40年的改革表明,只有开放才能发展。

“过量阅读”

最后再分享一个观点:很多知识分子在其成长阶段都曾经下苦功、进行了“过量阅读”,那么科研工作者作为知识分子的一员,也应该“过量阅读”。

专栏文章推荐

欢迎关注旷视研究院极术社区专栏,定期更新最新旷视研究院成果
加入旷视:career@megvii.com
2 阅读 489
推荐阅读
0 条评论
关注数
2042
内容数
104
专注旷视研究院学术论文解读推送,涵盖计算机视觉,文字识别等
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
Arm中国学堂公众号
关注Arm中国学堂
实时获取免费 Arm 教学资源信息
Arm中国招聘公众号
关注Arm中国招聘
实时获取 Arm 中国职位信息