前言
文献检索与阅读对于科研工作者的重要性是不言而喻的。在不同的情境(研究阶段)下,检索与阅读的方式会有不同:一是在涉足陌生领域时,我们主动地,集中地搜集和阅读,目的是快速了解该领域的发展历史与现状;二是正在进行一个研究时,我们已经对领域内的情况有了较为全面的把握,阅读文献更多地呈现被动、分散的特点,即依赖文献推送或不定期地查阅重点期刊,重点研究团队成果,目的是从最新的研究中得到借鉴和启发,并适时优化自己的技术路线。
本文将针对第二种情境,分享我的文献追踪习惯和工具。我是工科背景,观点以及所介绍的方式方法不免有局限性,请读者见谅。
我的学术前沿追踪习惯
Google Scholar,微信公众号和Web of Science。
在开启学术生涯的前期,我习惯使用 Google Scholar 进行文献的订阅,这应该是我们最基础也是最常使用的工具了。 Google Scholar 通过电子邮件的方式进行提醒。在我看来,方式过于老派,我打开邮箱时不一定进入了阅读的状态,加之邮箱的“永久”存储功能,不免产生稍后阅读的惰性。
相比之下,阅读微信公众号更加便捷。而我的老板和师兄弟间也经常分享公众号上的研究速递。我在家庭服务器Home Server实践中提到过,我很讨厌在微信内阅读公众号:一是消息在时间排序上是乱序的;二是在内容上无法按照类别浏览,我无法让大脑做到在科研内容和娱乐内容间迅速切换;三是在浏览时会插播很多推荐内容,但我并不感兴趣;四是没有阅读记录,我无法判断哪些文章读过了,也无法标记稍后阅读,我的“文件传输助手”也就充当了“稍后阅读”的功能。
但不可否认,微信公众号内还是有很多有价值的文章、资讯。也有很多服务提供了微信公众号的内容订阅,比如Feeddd和WeRSS的订阅服务。但这些服务或是实时性不高,比如几天甚至几周才会更新一次;或是价格昂贵。
由一次撰写综述的机会,接触到了Web of Science。在这之前,我嫌弃它的访问IP限制和时效性低,但这次使用,其文献信息的完整度、准确度和严谨的引证数据给了我们很大帮助。 同Google Scholar 一样,Web of Science 通过电子邮件的方式进行订阅。1
三种订阅方式的对比
Google Scholar,微信公众号和Web of Science这三种方式各有优缺点,我简单做了一个对比。
微信 | Google Scholar | Web of Science | |
---|---|---|---|
时效性 | ⭐⭐ | ⭐⭐⭐ | ⭐ |
相关度 | ⭐ | ⭐⭐⭐ | ⭐⭐⭐ |
定制化 | ⭐ | ⭐⭐ | ⭐⭐⭐ |
- 时效性方面。Google Scholar一般在论文Online一周内就会收录,微信公众号的推文受文章质量和是否由作者投稿影响,总体来说不如Google Scholar。Web of Science在时效性方面是最差的,一般从论文见刊到被Web of Science收录要等一段时间,取决于期刊编辑是否勤快,常见的是1~3个月。
- 相关度方面。Google Scholar 和 Web of Science 均提供了作者订阅、引文订阅的过滤工具,相关度是差不多的。而微信由于推送内容完全不由读者决定,消息的相关度是最弱的。
- 定制化方面。在Web of Science上可以对检索式创建跟踪服务,在定制化方面无疑是最强的。Google Scholar主要可以对作者、引文进行跟踪。微信,可以选择订阅不同的公众号,可能也算是一种定制吧,笑。
除此之外,三者都有一些独特的地方。
- Google Scholar 会抓取预印本和专利,这其实是变相加强了其时效性。
- 微信公众号推送的论文与自己的研究相关度低,但对于学科交叉领域的研究者来说,只要选对了公众号,时常会有惊喜。有时,公众号的稿件也会邀请作者进行解读,也会透露出论文之外的细节信息。此外,公众号还会推送会议通知、招聘信息、学术八卦,也算是学术生活中的谈资吧。
- Web of Science的时效性是比较低的,但其缺点也仅限于此,只要维护好检索式,我会有种安心感,领域内的任何论文最终都会推送给我,很难有漏网之鱼。
为什么不订阅期刊RSS
很多学术期刊提供了RSS源,订阅起来很方便,但除了少量的几本小领域期刊外,整体相关度低、查阅费时费力,获取有效文献的效率低。但是,根据老板的建议和课题组的习惯,我们还是会额外关注一下Nature、Science等高影响力的综合期刊,一方面是高质量的论文可能激发我们新的灵感,另一方面是了解一下学术圈的热点研究。
新平台各显身手
在继续之前,聊聊为什么没有选择其他平台进行文献订阅,如Researcher、Researchgate、Semantic Scholar、X-MOL。究其根本是已经习惯了现有的订阅途径,而其可靠性也有保证。较为传统的学术信息聚合平台,提供了期刊订阅、关键词搜索订阅的功能,但其本质与直接订阅期刊官方RSS、使用关键词订阅Scholar Alert的方式是无异的。我个人判断这类订阅方式在广度上比不过背靠搜索引擎的Google Scholar、精准度上难以匹敌精心维护的Web of Science。作为新势力的代表,Semantic Scholar自称AI驱动的科学文献研究工具,可以基于收藏的论文,使用推荐算法将相关的论文推荐给你,其推荐的论文是可能超出施引与被引范围的,这可能有助于开拓读者的思维,但具体效果如何,我暂时无法给出评价。
现在,我已经习惯同时使用Google Scholar,微信,Web of Science进行学术前沿动态的追踪。但由于平台间的割裂,阅读效率是比较低的,也存在着重要文献漏读的情况。我要做的,就是把这三个订阅源聚合在一起。
学术动态追踪 All in One
Google Scholar,微信公众号,Web of Science分别使用邮件订阅、APP订阅和邮件订阅(或网站内浏览)的方式向读者推送消息。用RSS将这三个信息源进行整合是一个很好的方式,套用现有的框架,只需要自制RSS源。
我把这三个RSS源或RSS源自动生成脚本托管在Github上,读者可移步以下链接进行查看和部署:
- osnsyc/Scholar-to-RSS:Google Scholar Alert to RSS;
- osnsyc/WoS-to-RSS:Web of Science Alert to RSS;
- osnsyc/Wechat-Scholar:提供稳定的学术类微信公众号转RSS服务.
Google Scholar 转 RSS
通过解析 scholaralerts-noreply@google.com 的邮件信息,将论文的标题、作者、摘要、源链接按照RSS协议组装好,生成xml文件,并由nginx托管,即制作好一个Google Scholar的RSS源。在Scholar-to-RSS中,读取的收件邮箱为outlook邮箱,可以在Google Scholar Alerts页面设置outlook为接收邮箱;也可以在其它邮箱内接收,把发件人为scholaralerts-noreply@google.com的邮件转发至outlook邮箱。需要读者自行生成outlook的API Token,具体方法参考项目文档。
Web of Science 转 RSS
Web of Science 的订阅可以通过邮件获取,也可以通过登录后的Web of Science主页读取,点击邮件内的链接会进行重定向,速度不如在主页上点击获取。我们使用自动化网页的方式读取订阅主题,并下载推送文献的详细信息。解析论文的标题、作者、摘要、DOI链接、自动完成标题和摘要的翻译,按照RSS协议组装好,生成xml文件,并由nginx托管,即制作好一个Web of Science 的RSS源。在解析的过程中,同时将数据保存/读取为sqlite数据库,通过DOI进行查重,避免重复的推送。
由于Web of Science的访问限制,设置了两种模式,一是校内模式,即IP订阅了Clarivate的相关服务,可直接访问,二是校外模式,即IP未订阅Clarivate的相关服务,需通过中国教育和科研计算机网联邦认证与资源共享基础设施, CARSI认证进行访问。
配置WoS-to-RSS,需要Web of Science登录邮箱与密码,对于校外模式的访问者,还需配置所在高校以及统一认证方式(学号,密码)。
微信公众号转RSS
微信公众号的RSS订阅是一个老大难的问题。为项目安全考虑,未考虑公开详细的技术路线,请读者在家庭服务器Home Server实践寻找实现功能的关键词,请注意,没有开箱即用方法。
当然,读者不会空手而归,在Wechat-Scholar中,我提供了免费的微信公众号订阅源,但只提供学术类微信公众号转RSS服务。何为学术类公众号?我定义为主打学术资讯、论文分享、高质量科普的公众号。时效性方面,Wechat-Scholar每日7am和14pm更新,保留最新20条(或近7日)的内容。如果列表中找不到您需要的公众号,可发起Issues请求添加。此外,Wechat-Scholar不提供全文输出,请在RSS客户端获取全文。
RSS订阅与过滤
Google Scholar 和 Web of Science 的推送质量完全取决于我们预设的跟踪内容,滥用跟踪会导致有价值的文献被稀释,这要求我们细心维护跟踪条目。跟踪有三大类:引文跟踪、检索跟踪、作者跟踪 。2在Google Scholar中,我只设置了作者跟踪。Web of Science中设置全部三类跟踪,引文跟踪的关键在于找到领域内的开山祖师式或里程碑式论文,随着时间的推移,里程碑式论文需要适时更新;检索跟踪关键在于关键词的设定,一般是领域中公认的专业名词组合或缩写组合;作者跟踪,可以把领域内相关的学者全部选定。
将微信公众号转换为RSS订阅后,会被其海量的信息淹没,做好信息的过滤配置是必要的。我通过关键词进行分类/过滤,如“荐号”、“面试”、“年薪”、“招聘”、“预约”、“会议”、“通知”等等。
阅读与沉淀
在仅支持移动端的RSS阅读器内阅读文献是不现实的,我推荐选择跨平台的RSS阅读器。在食堂排队时、通勤时、如厕时,随时随地粗读摘要,做好筛选收藏后,在“生产力平台”再进行进一步的知识沉淀。
结语
我们利用RSS实现了学术前沿追踪的 All in One,在统一的入口内,能集中地浏览学术资讯。
对科研大佬而言,这些可能只是雕虫小技,但希望这些小工具能帮到在一线忙碌的科研人。
https://sspai.com/post/84478