查看原文
其他

11分杂志推荐这个文献检索神器(干货篇)

Zai 科研讲坛 2021-02-21

文献检索是科学研究的第一步,因为新发现都是建立在先验知识之上的。每天数百万用户搜索PubMedhttps://pubmed.gov)和PubMed中心(PMC;https://www.ncbi.nlm.nih.gov/pmc)寻求他们在生物医学方面问题的答案。但是,用户目前不可能通过PubMedPMC搜索一次同时查询两个数据库中的所有文献(全文)的内容。


解决全文搜索难题的解决方案是执行段落或句子级别的检索,而不是传统文档级别的搜索。因为句子具有较高的局部性或信息密度,所以如果某个句子包含多个查询关键词,则包含这些句子的文献更有可能是与你想要的。这样的检索可以更有效,文档长度就不成问题了。句子级搜索在一系列生物医学应用中可以发挥至关重要的作用,例如,将新发现与以前的知识快速进行比较和对比、从文献中进行证据归类、寻找生物医学问题的解答和进行文献综述


这里,我们的主角上场啦,LitSense是一个独特的搜索系统,用于在句子级别搜索生物医学文献,可搜索PubMed29百万篇文章摘要和PMC Text Mining (文本挖掘)Subset 中约300万篇全文文章中的五亿多个句子,并快速返回相关文献。


LitSense发表在了20197月的《Nucleic Acids Research》(IF=11)上。

图1 (图片来源:Nucleic Acids Research)


PubMedPMC相比,LitSense具有一些独特的功能:

(1)在搜索结果排序中,LitSense 在传统的术语匹配信息检索方法的基础上使用了最新的神经嵌入方法(state-of-the-art neural embedding approach)以提高其性能。

(2)LitSense嵌套PubTator,这是最先进的生物学概念识别工具,可在搜索结果中突出显示生物学概念,以实现更好的可视化效果。

(3)用户可以轻松地找到全文中返回的感兴趣句子的位置,并检查上下游文本,还提供了直观交互式界面,该界面允许快速浏览返回的句子,以及按章节标题(例如结果和讨论)和发布日期(例如过去3年)筛选过滤文献。


1. 文本搜索

打开LitSense系统主页,只要输入给定一系列关键词或一个查询句子,LitSense就会通过最先进的神经嵌入方法,根据术语重合情况以及语义相似性找到文献中最匹配的句子并返回相关文献及其期刊。


图2 (图片来源:LitSense 官网)


2. 结果主页面

LitSense从生物医学文献中返回与用户Q提供的查询语句最匹配的相关语句。用户可以按文章部分如摘要或结果A),或出版年份B过滤搜索结果。带PubTator注释的生物概念的颜色图例显示在H上,可以选择突出显示或关闭其中的生物学概念。


LitSense嵌套的PubTator是用于查看和检索全文生物医学文章中的生物概念注释的在线软件(即文本挖掘系统),可以为基因/蛋白质、遗传变异、疾病、化学物质、物种和细胞系等生物学概念提供自动注释并以不同颜色标注。


图3 (图片来源:LitSense 官网)


LitSense仅显示与查询语句共享相似词至少60%的语句。因此,没有相似匹配的长查询语句通常不会返回任何结果。

如果要重点查询句子的某些部分,只需将其用双引号引起来即可,这样子搜索结果仅显示包含双引号内文字的文献。


3. 搜索到的句子片段

在每个返回句子中,匹配的术语以粗体(B)突出显示。如果LitSense嵌套的PubTator发现加粗的术语是生物学概念,则会以对应于其类型(A)的颜色来突出显示。彩色圆点(C)表示返回的句子与用户查询相似的程度,从橙色(高)到绿色(中)到蓝色(低)。

句子在文献中出现的部分显示在(D)中,而原始摘要或全文的链接显示在(E)中。用户可以通过点击(F)使用返回的句子作为新查询来进一步搜索 ,找到其它文献中出现的相似句子。点击(G)可以看到文献的其他信息如标题和作者,单击(H)可以看到摘要或在内部标示搜索结果句子的文献全文。

图4 (图片来源:LitSense 官网)


4. 上下文视图

点击SEE IN ABSTACT/FullText,在跳转的上下文视图页面上,可以在文献摘要或全文(如果可用)中看到突出显示的匹配句子。

图5 (图片来源:LitSense 官网)


除了用于更加精确地检索文献以外,当遇到文章中一些英文不会表述时,也可以用LitSense检索一下,学习文献中的英文搭配和表达。如此好用的文献句子搜索在线平台LitSense,小伙伴们快去试一试吧!


LitSense 官网:https://www.ncbi.nlm.nih.gov/research/litsense/


参考文献:Alexis Allot, Qingyu Chen, Sun Kim, Roberto Vera Alvarez, Donald C Comeau, W John Wilbur, Zhiyong Lu, LitSense: making sense of biomedical literature at sentence level, Nucleic Acids Research, Volume 47,Issue W1, 02 July 2019, Pages W594–W599, https://doi.org/10.1093/nar/gkz289


相关阅读:

· 新版Pubmed,新花怒放,快来看看有哪些变化!

· 干货:一个PubMed账号可以有这么多用处!

· 干货:精准文献检索新技能——以图搜文

· 随手甩你几个文献检索神器

· 如何快速高效地写好自己的SCI文章?

· 用AI帮你理解文献、搜索文献!



    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存