查看原文
其他

【声明】关于中国知网智能检索系统升级的说明

2017-12-04 广东知网

老师童鞋们

近期大家有没有遇到

在不同时间段、不同浏览器进入知网主页

针对同样的检索条件

检索结果不一样

甚至同一时间、同一浏览器

不同电脑的的检索结果也不一样

除检索外,很多功能在主页上都找不到入口了

比如CNKI翻译助手、全球学术快报

针对此类现象,特做如下说明


通 知

尊敬的知网用户:

大家好!

    中国知网的智能标引技术在今年取得了突破性进展,该技术从2012年开始研发,旨在精确标引出每一篇文章的主题特征,主要应用场景便是主题检索,目的是为读者提供更加完整、系统、准确、及时的检索服务。

    智能检索的核心突破是:主题相关条件下按照时间排序,让读者发现最新的高相关文献。智能检索(用NVSM表示)与传统检索(用KNS表示)的主要区别如下:

1、检索技术

(1)KNS检索

 KNS检索,以“主题”字段检索为例,实现机制是在题名、作者关键词、机标关键词、摘要等内容字段中检索,无法体现全文特征,容易造成漏检;

以“全文”字段为例,实现机制是在“全文索引”中进行检索,容易造成过检,检出大量不相关的内容;

(2)NVSM检索

NVSM检索是在中国知网标引出来的主题字段中进行检索,该字段内容包含一篇文章的所有主题特征,同时在检索过程中嵌入了专业词典、主题词表、中英对照词典、停用词表等工具,并采用关键词截断算法,将低相关或微相关文献进行截断。

2、排序算法

(1)KNS检索只能实现一维排序,即检索出结果后只能按照主题排序或者按照时间排序。造成的后果就是:第一、按照主题排序,读者获得的结果长时间不变,排在前几页的结果几乎没有变化,最新发表的研究成果往往淹没在海量文献中,无法被读者第一时间发现;第二、按时间排序,由于没有准确的主题标引,排在前列的结果会出现“主题漂移”,与读者的检索意图相去甚远。

(2)NVSM检索实现了主题和时间二维排序。即首先通过智能标引算法实现了主题相关,然后默认按时间排序。这样就攻克了检索领域的这一难题,让读者不仅获得主题相关的内容,并且最新的成果排在前列,让最新的研究成果可以被读者第一时间发现。

关于最新读者发现的检索结果不一致的说明:

上述智能检索的部署,涉及中国知网底层数据的“大换血”,并且全面升级检索程序,嵌入大量专业词表,工程较大。为了尽量减少对读者的影响,中国知网采用了边部署、边监测、边优化的分布部署策略。目前中国知网的后台有两套系统在为各位读者服务:NVSM智能检索,承载15%的用户流量,KNS传统检索承载85%用户流量。知网将一步一步将KNS检索迁移到NVSM智能检索,计划2017年年底最终完成全部切换,当然同时保留原有KNS版本。

所以,读者在检索过程中会出现检索结果不一样的现象,待全部升级完毕后,此现象将自动消失。

持续的技术创新一定能够带来更优质的检索体验,请各位读者尝试新的智能检索,并提出宝贵意见。对于新技术给读者造成的困惑和不便,敬请原谅。

体验域名:http://nvsm.cnki.net

特此说明

中国知网智能检索项目组

大家在使用过程中遇到问题

或者有宝贵意见

可以直接给小编留言

对于新技术给读者造成的困惑和不便

敬请原谅



编辑/广东小知


推荐阅读:


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存