如何有效并快速地阅读一篇AI论文？

象飞 2021-12-27

展开全文

您想知道的人工智能干货，第一时间送达

21 世纪，要说哪个技术方向是日产论文最多的领域，人工智能领域绝对有发言权。

这个时候，对于想要跟踪了解 AI 领域进展的人们来说，有一种能力便显得特别重要——快速并有效阅读一篇文献的能力。毕竟，AI 领域的发展确实是太快了，另外，这种能力也构成了高效信息呈现能力的一部分，比如说，一个技术团队的 leader 需要在头脑风暴会议上，为同事和领导汇报有限时间内读到过的技术内容。

对于学术领域从业者来说，读论文可能是一件和吃喝拉撒一样日常的活动。参加会议或课堂，与领域最新进展保持同步，都要求他们必须养成这个习惯。一个“经典”的研究人员每年可能会花费数百小时来阅读论文。

学习有效阅读论文是一项至关重要的技能，但却很少得到充足的教授。尤其对于从本科进入到研究生阶段的学术新人来说，他们可能会经历较长时间的试错和碰壁。

过去一年中，“数据实战派”的作者团队也输出了大量基于论文的科技进展报道，本文根据已有理论和自身实践，总结出个中经验之谈，希望对有这方面困惑的读者们带来帮助：

第一步：上哪发现有趣的 AI 论文？

A、Papers With Code。这个网站提供大量的人工智能论文，并且进行了仔细的分类；

B、Reddit。Reddit 上有一个社交新闻站点，类似于国内的贴吧，大佬频繁出没，想必大家已经不陌生了，很多的新闻都是第一时间从上面爆出。Reddit 在美国可是流量仅次于 Google、YouTube、Facebook、Amazon，排行第五的网站；

C、Medium 等其他垂直社区。

第二步：掌握论文的背景信息

文章不是石头里蹦出来的，可以说，几乎所有的文献都是在其之前已完成的工作上完成的，而理解文献中所涉及的背景信息特别是背景研究，往往会对我们理解一篇文献起到很大的帮助。

比如文献所介绍的方法是解决什么问题，这种方法的优缺点，以及这种方法未来的一些可能和应用。

但问题是，我们通常没有足够的时间去为阅读大量背景资料。可以采用一个思路是，以列表或者清单的方式，清晰地整理出论文试图解决的具体问题，该问题现有的替代解决方案，这些解决方案的优缺点，以及为何论文的作者认为论文中所介绍的方案，能比现有的一些或所有方案都好。

第三步：把握主要观点

从阅读各个章节和小节的标题开始，把它们与论文所描述的模型架构联系起来，如此，你便能在阅读细节之前，提前在脑海中对论文的整体信息有概念，降低读到一半就迷失的可能性。

第四步：客观看待实验结果

所有论文的写作目标，都是将作者团队辛勤工作的结果以一种更易被学术群体接受的形式呈现出来，而这也是为何有的论文里，一些重要的细节会被安排在“不起眼”的地方。

有关实验结果的信息，将能帮我们更客观的看待论文所提出的方法，获得新的见解。一些技巧有：

检查比较基准——是否有其他的方法没有被作者拿进来比较？
检查Ablation——在论文给出的Pipeline的每个组成部分对于结果的贡献上，这些组成部分的贡献大小是否都有被合理检验？
检查数据——是否有那些大家都知道的，适合检验论文所提出的方法的数据集没被提及？如果有的话，甚至好几个的话，那它们可能会揭示论文所提出的方法的弱点。

第五步：整理结果

在理解论文的内容后，将论文结果整理为可被自己使用的信息，更进一步地，可以设想一些自己能用到论文所提出的方法的情景。

当然，以上内容都只是建议而非适用一切场景的万金油，如果有条件，仔细阅读完一篇论文还是首选推荐。

针对这种深度阅读，在这里我们也推荐一种方法——“3 次阅读法”：

“3 次阅读法”的关键思想是，你应该把这篇论文按照一种递进的逻辑读三遍，每一遍都有不同的目标，而不是一次性地从头到尾一字不漏地读完。