下载的 PDF 文献应该如何命名？

爱吃土豆丝 2012-09-06

展开全文

下载的 PDF 文献应该如何命名？

科技文献的标题大多很长，不适合做文件名，那应该如何命名才能一目了然让自己知道是哪篇文献呢？

你要有意识地形成一个比较高效的工作流程（workflow）
也就是说，从在网上看到一篇paper，到你日后某天要找到一篇paper的PDF，整个的流程要固定，不能一会儿这样一会儿那样；也要高效，不能把太多时间就花在整这个上面。也许这是理工科思维，先花专门的时间去定义，之后就不再考虑按定义来做。即兴的做法是难以长期保证高效。你的workflow越是连个机器人都能完成，就越高效。越是要你用模糊智慧去想去回味去条件判断分支，就越低效。

每个人会有每个人的workflow，没有一个软件或者做法是能适应所有有的workflow的，这也是为什么有的人喜欢Zotera，有的人喜欢Papers，有的人喜欢EndNote。这是我以下摆任何理由的前提，即：摆得出很多理由，但不代表这就是普遍正确的做法。

现在我介绍一下我的做法。我的文件夹里最多有两千多篇paper的PDF。我是使用Windows系统和EndNote。

我先简单评价一下我用过的其他文献管理软件：
我使用过Zotera、Mendeley、NoteExpress等文献管理软件。我不习惯用Firefox所以是终没有长期使用Zotera，Mendeley的数据库引擎太弱，2000多条记录会死机。NoteExpress界面风格太国产太乡土太腾讯酷狗芊芊静听。

此外，Zotera和Mendeley的citation style要用一个通用语言来手动编写，又不提供编写器。

不过，Zotera和Mendeley是免费的软件，因此在国外很多人只在这两者之中选，并且不乏溢美之辞。

关于PDF识别和自动导入：
我觉得这一功能本身就完善不了，因为它的对象缺乏严格定义。假如我的PDF文件是一本书，它能识别导入一条Book或Book Chapter类型的记录吗？用户如果误把一个完全另因的PDF文件交给它去识别，难道它还能弹出提示框说“这不是一篇journal article”并停止导入吗？也就是说，这一功能是要靠用户小心使用去配合的。而且世上也没有严格定义说journal article的PDF文件就该长什么样。在这个没有形成标准之前，PDF识别导入的功能就注完无法摆脱上述的尴尬。因此我到现在从未依赖过这一功能，也不评价。

在网上新看到的paper，我会先决定这是要收藏还是看过就算。凡是要收藏的，我都不光下载PDF，而是连同导出citation一起做。这是固定组合动作。所以我有一个pdf文件，EndNote里必然对应着一个文献记录。当然，假如有不对的，也可以事后发现和补上的，但这种情况不能太多导致你自己都不相信自己。

为什么我不在文献管理软件自带的PDF阅读框（器）中阅读论文？
我认为世界上功能最完善的PDF阅读器就是台式机系统上安装的Adobe Acrobat Professional。有一个功能是我找过的任何其他PDF reader所不具备的（Adobe Reader除外）：把同一文件的一个窗口split成上下两半。这样，我上面一半是看正文，下面一半移到文末参考文献的列表，就不会因为临时要翻bibliography而打自正文的阅读思路。

Mendeley和EndNote都有内嵌PDF原文的功能，Mendeley甚至提倡用户直接就在Mendeley里面看PDF文件了，而且网上发现国外有很多使用者觉得这样很好。但是，它不能：画各种颜色各种线型的框、圈、箭头；不能画各种线型的下划线删除线；不能把影印版的PDF文件OCR成一行行的文字以供我使用下划线；不能添加comment。不能进行给PDF添加页面（为什么要添加页？因为有的paper另外有supporting information，我的习惯是把supporting information加到原paper的PDF末尾，以后就不用麻烦了）。

文献阅读器假如没有Adobe或Microsoft这种做巨无霸的suites的决心和能力的话，我觉得不应该往PDF阅读器方向发展，否则只能做出一个鸡肋。

总之，“文献管理系统”应该是“文献信息管理系统”，而不是“PDF文件管理系统”。认为装个EndNote什么的就把你的PDF文件也解决了，我认为这是一个误区。我反正是不抱期望，所以我老老实实地从EndNote里对信息，然后到文件夹里找。面对成千上万条记录，你需要的是完美的规则。

PDF文件的命名：
虽说这个完全看个人习惯，但我可以为我的习惯硬找出一些理由来。
不管怎么命名，文件名过长是不好的。因为，在Windows Explorer里面，我习惯使用Details视图。我常用的column除了Name之外还有Date Modified、Type和Size。我经常变换以Name排序和以Date Modified排序，偶尔会以Type排序因为有时我的文件夹里会有少量MS Word文件和压缩文件。因此，如果文件名太长，要么Name的宽度就会很长把其他column推到屏幕外边去你得把scroll bar移过去才看到，要么就是Name的宽定不足以显示整个文件名你搞那么长也搞不全。

选择能够唯一标识一篇paper的最少信息组合来做文件名。我的做法是期刊名缩写+卷号+首页。其他信息都是多余的。例如：
J. Appl. Phys. 104 091901.pdf

我不需要看到文件名就大概知道这篇文章讲什么。因为我文件夹里每一个PDF在EndNote里都有记录。我在EndNote里浏览标题，遇到想看全文的，根据记录的期刊名、卷号和首页，就自然能在文件夹里找到相应的pdf文件。就算有两千多个文件，按Name排序，也能很快找到。

有时你上网看到一篇相关的，你都不知道自己是否已经有了。这时通过EndNote就能很快查出来，在EndNote里我有两种排序方式。第一种是按Journal Name、Year、Volume、Page的次序，第二种就是把Journal Name和Year调一下，其他不变。按期刊排有利于检查一篇paper你是否已经有了，因为唯一标识这篇paper的最少信息组合首先就是Journal Name。按年份排则有利于写综述之前的文献阅读，方便你撰写研究历史。

由于我这么做，我一般不会记得一篇文章的年份、标题和作者，因为在以上整套方法中这些信息并不出现。可是我身边很多人习惯通过年份和作者去记忆或跟别人提起一篇文章，不知道是什么原因。