分享

如何有效并快速地阅读一篇AI论文?

 象飞 2021-12-27

您想知道的人工智能干货,第一时间送达

                         

图片

图片21 世纪,要说哪个技术方向是日产论文最多的领域,人工智能领域绝对有发言权。

这个时候,对于想要跟踪了解 AI 领域进展的人们来说,有一种能力便显得特别重要——快速并有效阅读一篇文献的能力。毕竟,AI 领域的发展确实是太快了,另外,这种能力也构成了高效信息呈现能力的一部分,比如说,一个技术团队的 leader 需要在头脑风暴会议上,为同事和领导汇报有限时间内读到过的技术内容。

对于学术领域从业者来说,读论文可能是一件和吃喝拉撒一样日常的活动。参加会议或课堂,与领域最新进展保持同步,都要求他们必须养成这个习惯。一个“经典”的研究人员每年可能会花费数百小时来阅读论文。

学习有效阅读论文是一项至关重要的技能,但却很少得到充足的教授。尤其对于从本科进入到研究生阶段的学术新人来说,他们可能会经历较长时间的试错和碰壁。

过去一年中,“数据实战派”的作者团队也输出了大量基于论文的科技进展报道,本文根据已有理论和自身实践,总结出个中经验之谈,希望对有这方面困惑的读者们带来帮助:

第一步:上哪发现有趣的 AI 论文?

A、Papers With Code。这个网站提供大量的人工智能论文,并且进行了仔细的分类;

B、Reddit。Reddit 上有一个社交新闻站点,类似于国内的贴吧,大佬频繁出没,想必大家已经不陌生了,很多的新闻都是第一时间从上面爆出。Reddit 在美国可是流量仅次于 Google、YouTube、Facebook、Amazon,排行第五的网站;

C、Medium 等其他垂直社区。

第二步:掌握论文的背景信息

文章不是石头里蹦出来的,可以说,几乎所有的文献都是在其之前已完成的工作上完成的,而理解文献中所涉及的背景信息特别是背景研究,往往会对我们理解一篇文献起到很大的帮助。

比如文献所介绍的方法是解决什么问题,这种方法的优缺点,以及这种方法未来的一些可能和应用。

但问题是,我们通常没有足够的时间去为阅读大量背景资料。可以采用一个思路是,以列表或者清单的方式,清晰地整理出论文试图解决的具体问题,该问题现有的替代解决方案,这些解决方案的优缺点,以及为何论文的作者认为论文中所介绍的方案,能比现有的一些或所有方案都好。

第三步:把握主要观点

从阅读各个章节和小节的标题开始,把它们与论文所描述的模型架构联系起来,如此,你便能在阅读细节之前,提前在脑海中对论文的整体信息有概念,降低读到一半就迷失的可能性。

第四步:客观看待实验结果

所有论文的写作目标,都是将作者团队辛勤工作的结果以一种更易被学术群体接受的形式呈现出来,而这也是为何有的论文里,一些重要的细节会被安排在“不起眼”的地方。

有关实验结果的信息,将能帮我们更客观的看待论文所提出的方法,获得新的见解。一些技巧有:

检查比较基准——是否有其他的方法没有被作者拿进来比较? 

检查Ablation——在论文给出的Pipeline的每个组成部分对于结果的贡献上,这些组成部分的贡献大小是否都有被合理检验?

检查数据——是否有那些大家都知道的,适合检验论文所提出的方法的数据集没被提及?如果有的话,甚至好几个的话,那它们可能会揭示论文所提出的方法的弱点。


第五步:整理结果

在理解论文的内容后,将论文结果整理为可被自己使用的信息,更进一步地,可以设想一些自己能用到论文所提出的方法的情景。

当然,以上内容都只是建议而非适用一切场景的万金油,如果有条件,仔细阅读完一篇论文还是首选推荐。

针对这种深度阅读,在这里我们也推荐一种方法——“3 次阅读法”:

“3 次阅读法”的关键思想是,你应该把这篇论文按照一种递进的逻辑读三遍,每一遍都有不同的目标,而不是一次性地从头到尾一字不漏地读完。

  • 第一遍:对论文有一个大致的了解。


1. 仔细读标题、摘要和介绍;
2. 读各个章节/小节的标题,不必阅读具体内容;
3. 读结论;
4. 浏览参考文献,在心里标记那些你已经读过的文献。

在第一遍结束时,你掌握的信息应该能够回答一下问题:

1. 分类:这是什么类型的论文?对现有系统的分析?还是一个新方法的描述?
2. 背景:它与哪些其他论文有关?用了哪个理论基础来分析问题?
3. 正确性:论文的假设看起来有效吗?
4. 贡献:论文的主要贡献是什么?
5. 清晰度:论文写得清楚吗?

掌握这些信息,可以帮助你判断这是否是你感兴趣的论文、或者是完全超出你认知范围的论文,或者是你认为作者做出了无效的假设。得出判断之后,你可以选择需不需要作进一步阅读。

  • 第二遍:更仔细地阅读论文,但忽略具体证明等细节。


1. 仔细查看论文中的图形、图表和其他插图。特别注意检查图表。各种轴是否正确标记?结果是否显示有误差标记(以便确认结论具有统计意义)?像这样的细微错误,能帮你快速判断这篇论文是粗制滥造还是用心雕琢。

2. 在记事本中记录下文中列出的你未读过的参考文献。

第二遍最多需要一个小时。完成这一步,你基本掌握这篇论文说了什么,已经可以向他人总结论文的主旨和支持这些主旨的证据。

  • 第三遍:深入理解论文。


要完全理解一篇论文(特别如果你是审稿人),往往需要阅读第三遍。

第三遍的关键是尝试重新实现论文,即做出与作者相同的假设,重新思考怎么展开工作。将这种重新创作与实际论文进行比较,你不仅可以更好地辨别论文的创新之处,还可以发现如果这个假设失败了它可能会因什么失败。

这一步对于刚刚入行的初学者来说,可能会需要大约四五个小时,而对于有经验的读者来说,大约需要一个小时。第三遍阅读结束时,你应该能够重建论文的整个结构,并清楚其优缺点所在,甚至应该能看出来研究隐含的假设、缺失了哪些相关工作的引用、实验或分析技术的潜在问题等。

总而言之,每个人在不同阶段的学术论文的阅读诉求不一样,丰俭由人,最好的方法永远是适合自己的方法。
来源:数据实战派;版权属于原作者,仅用于学术分享

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多