【深度】虚假信息检测技术研究
2019学术大礼包丨加入学术plus丨2018学术大礼包丨2017不可以错过的重磅报告们
今日荐文的作者为火箭军工程大学专家李少臣,李晓军,姚俊萍,肖栩豪,61486部队专家马可欣。本篇节选自论文《虚假信息检测中Bayes模型应用:技术与研究进展》,发表于《中国电子科学研究院学报》第15卷第10期。
摘 要:为了总结分析Bayes模型在虚假信息检测中的应用研究现状及发展趋势,本文综述了虚假信息检测中的Bayes模型应用研究。运用系统性综述研究方法,在确定虚假信息定义及主要类型基础上,依据信息特征将虚假信息检测分为虚假信息发布者、内容及场景模型等3类,分别阐述了Bayes模型在上述模型中应用的关键技术原理及主要方式,并结合虚假图像、视频类信息检测问题,提出了Bayes模型应用于虚假信息检测中存在的关键技术挑战、可能的研究机会与技术思路。本文结果与结论为虚假信息检测技术相关研究提供了借鉴和参考。
关键词: 虚假信息检测;Bayes模型;关键技术;研究进展
《中国电子科学研究院学报》更多精彩文章
请移步中国知网下载阅读,或持续关注本号更新
论文全文摘编如下
仅供学术交流与参考
引 言
自媒体,尤其是移动自媒体的快速发展极大地拓宽了用户的信息获取渠道、方式及便捷性[1],但同时,信息质量较低的问题,尤其是虚假信息则显著地伤害了用户信息行为体验,甚至会误导个人及组织的决策。例如,
文献[2]发现2006—2017年间65%的美国Twitter新闻含有虚假成分,且社交网络中虚假信息往往会传播得更快、更广。 文献[3]围绕2012年桑迪飓风期间网络微博,发现虚假信息传播造成的损害具有很高的集中度,并且心理压力下用户信息转发行为具有盲目性。 文献[4]研究发现2016年美国总统大选期间,社交媒体中存在着各种形式的谣言。
因此,准确快速地实现网络虚假信息的检测成为政府监管机构、信息媒体运营商和学术研究人员重点关注的问题,对于网络信息监管、用户信息应用具有重要的支撑作用。
虚假信息检测的技术模型主要包括Bayes模型、决策树模型、知识冲突模型等。其中,相较于其他技术手段,Bayes模型有其独特的优势。例如,
文献[5]在网络水军识别研究中提出了Bayes模型优势:计算先验概率时目标值之间具有相互独立性;可依据先验概率同时计算出网络中水军与非水军的分类,这是决策树、逻辑回归等其他方法所不具备的;具有良好的可扩展性,即当提取到的特征属性集优化时,模型依然有效。 文献[6]发现应用Bayes模型建模,结合否定处理、基于互信息的特征选择等方法可有效提高评论分类准确率,改进Bayes模型的准确率可达到88.80%; 文献[7]通过改进Bayes模型,使得新的垃圾邮件过滤技术的准确率比传统技术提高了8%。
综上所述,可以发现,对于信息分类问题来说,Bayes模型具有良好的适应性、更高的精度、较强的可扩展性等比较优势。因此,基于Bayes模型的虚假信息检测正成为该领域的重要研究方向。在这样的背景下,本文围绕Bayes方法在虚假信息检测中的应用问题,开展综述研究,在虚假信息定义及Bayes模型梳理基础上,分析该技术的相关特点及其在虚假信息检测中的应用现状,发现领域研究机会,为后续研究提供参考和借鉴。
本文的组织结构安排如下,第2节介绍虚假信息检测概念及主要方法;第3节介绍Bayes模型及其应用;第4节总结研究现状并提出可能的研究机会。
1.虚假信息检测及主要方法
虚假信息的概念是开展虚假信息检测的前提和基础,但直至当前关于虚假信息的定义仍旧存在争议,尤其是虚假信息和错误信息两个概念在很多研究中甚至存在着混用和错误使用的问题。
3类虚假信息
虚假信息之所以种类繁多,是因为其误导的目标人群及传播方式各不相同,根据不同种类虚假信息的表现形式,本文将虚假信息分为以下三种类别。
(1)文字类虚假信息
如垃圾文字邮件、虚假新闻等。Bogers等在社交网络上垃圾邮件传播可行性分析基础上,发现垃圾文字邮件正日益严重[18]。Markines等研究了社交垃圾邮件生成动机,发现社交垃圾邮件最具威胁性的动机是经济利益,垃圾邮件泛滥的过程中,好的信息资源就会被稀释成垃圾,网络环境最终遭到了破坏[19]。而对于虚假新闻来说,Shu等人发现虚假新闻传播对个人和社会产生严重的负面影响[20]:虚假新闻会打破新闻生态系统的真实性平衡,虚假新闻故意说服消费者接受偏见或错误的信任;虚假新闻改变了人们解读和回应真实新闻的方式。
(2)图像类虚假信息
例如经过处理后的照片等。由于分享的多媒体帖子不一定是真实的,原因可能包括来自过去事件的内容被转发为涉及当前事件、被故意操纵的内容和被错误地用于表示当前事件的一个方面的内容,Boididou等通过对相关虚假图像案例的研究,提出了4种图片内容虚假类型的划分[21]:真实的转发,来自过去事件的真实照片被转发为与当前事件相关联;重新发布合成的数字图像,如艺术品或电影快照,以真实事件图像的形式呈现;推测,来自正在进行的事件的真实照片,表达关于人员或行为与事件的关联的推测;数字处理的照片。
(3)视频类虚假信息
例如垃圾视频邮件、在线相关视频等。Da等针对社交网络中的垃圾视频邮件,提出垃圾视频邮件很难界定其垃圾性和合法性,因为一个合法元素中可以找到大量的视频内容,视频的多样性是压倒性的特点[22]。不只是垃圾视频邮件,相关领域的在线视频也可能是虚假的,Hou等人通过研究,首先指出误导健康视频可以被定义为与当前已确立的医学理解相矛盾的不正确信息,或者是只涵盖或促进部分事实的有偏见的信息,并提出YouTube网站上有大量的与医学相关的视频,这些医学视频普遍具有质量很差、包含误导性的特点,同时也指出了要检测这些误导视频的困难性及原因[23]。
虚假信息检测的模型是虚假信息检测的关键。依据虚假信息检测所使用的特征,虚假信息检测模型分为虚假信息发布者模型、虚假信息内容模型和虚假信息场景模型等3类。
(1)虚假信息发布者检测模型
主要依靠信息发布者或其社交网络的属性来对虚假信息发布者进行分类。基于信息发布者属性的研究,例如,Yusof等人利用从用户配置文件中获得的和用户共享的内容构建的16个特征,包括视频总数的订阅率、视频总数的分享率、总视图的相似比率等,来对视频垃圾邮件发布者进行检验,通过实验,发现利用这些特征进行检测的平均准确率达到98%[24]。基于社交网络属性检测虚假信息发布者,如,Benevenuto等人提出,社交网络属性表示用户如何通过视频响应与其他用户交互,将节点入度、节点出度、聚类系数等作为社交网络特征属性,证明了社交网络度量属性是SVM分类器考虑的一个重要的属性集[25]。同样,Bhat等人提出基于社区特征的模型,该模型将用户节点分为核心、非核心及离群点三类,并包含了所要提取的社区相关特征,如总互易性、总输入与输出的比率以及外部链路失效概率等,最终达到识别社交网络中垃圾邮件发送者的目的[26]。
(2)虚假信息内容检测模型
主要通过信息中知识冲突以及提取信息相关特征等方法来判断一条信息是否为虚假信息。因为虚假信息的最终目的是为了误导他人,所以,虚假信息和真实信息在关键的地方必然会产生不一致,利用信息内容上的不一致,可以对信息的虚假性进行判断。例如,吴晔等提出对虚假内容特征的研究,是及时遏制虚假信息传播、降低虚假信息控制成本的关键,并提出虚假信息多通过文本传播,可以通过分析虚假信息内容特征来检测信息的真实性[27]。Levchuk等构建了文本知识冲突检测模型,通过检测知识之间的相互冲突最终返回知识片段的虚假性[28]。在信息相关特征提取方面,可以根据不同种类方法提取特征进行建模。例如,除了利用传统的内容特征(词汇、句法)之外,Marco L等通过利用与新闻交互的用户身份和新闻项目的文本信息特征,实现了虚假新闻的检测并提高了检测效率[29]。在识别网络上虚假情报方面,任敏提出了一种基于支撑数据的大数据网络虚假情报信息优化识别方法[30]。而在垃圾邮件内容特征提取方面,Markines等通过识别并分析了垃圾邮件内容的六个不同特征(广告数量、剽窃内容、有效链接等),结合监督学习算法来构建垃圾邮件的检测模型,通过实验取得了很好的效果[19]。
(3)虚假信息场景检测模型
主要通过检测虚假信息环境是否异常来判断信息的虚假性。例如,Mukherjee等通过关注由于利润或名声的原因,人们试图通过垃圾观点(如写虚假评论)提升或降级一些目标产品的问题,根据提取到的虚假信息环境特征(内容相似性、最多评论次数、评论突发性等)构建虚假信息检测的场景模型,用于对垃圾评论的检测[31]。而对于某些相关问题数据的真实性检测,Zhang等人通过学习每个问题的答案因素和每个答案因素的真实标签等上下文特征,创建概率模型,来判断每个答案的因素可信度,从而从多源文本数据中发现真实信息[32]。
2.Bayes模型及其应用
Bayes决策,是指在不完全信息条件下对特定未知状态进行概率估计,然后用Bayes公式进行修正,最后做出最优决策,是主观Bayes派归纳理论的有机组成部分[33]。应用Bayes模型检测虚假信息,其基本思想是首先用先验概率对待检测信息进行判断,然后利用Bayes公式计算其后验概率,最后使用计算得出的后验概率进行相关信息虚假性的判断。
Bayes模型在工程中有着很广泛的应用,主要包括Bayes网络模型和朴素Bayes模型等。其中,Bayes网络又称信度网络,是将随机变量设置为节点,构成有向无环图,通过与目标节点的相连的变量来预测目标节点,而朴素Bayes模型在Bayes算法的基础上进行相应简化,通过假定条件变量之间相互独立,来预测目标变量。同时,朴素Bayes模型按照变量分布方式的不同可以分为伯努利朴素Bayes、多项式朴素Bayes模型及高斯朴素Bayes模型;而按照特征提取不同又可以分为情感朴素Bayes模型、文字朴素Bayes模型等。
本文主要讨论朴素Bayes模型在虚假信息检测中的应用,并将朴素Bayes模型主要分为情感朴素Bayes模型、文本朴素Bayes模型等。
(1)情感朴素Bayes模型
主要步骤是先提取待检测信息中的相关表达感情的词汇或视频中表达情感的特征,通过相关数学抽象,对信息进行情感分析,由此得出待测信息的虚假性。
本文在第2.2节虚假信息检测模型中第三部分虚假信息场景模型中提到,目标产品的相关评论是会影响目标产品的,包括垃圾观点中的极性评论,对于如何去检测一个评论情感是否极性,情感朴素Bayes模型可以很好地解决这个问题。Vivek Narayanan等人在研究中就发现情感分析包括从在线评论等文档中提取主观信息,以确定特定对象的极性或其上下文的极性。因为电影评论数据集同时涵盖了广泛的人类情感和大多数与情感分类相关的形容词,所以模型以电影评论数据集为研究背景,从而发现了提取有效的否定处理、单词n-grams和基于互信息的特征选择等的朴素Bayes模型可以有效提高评论情感分类的准确率[6]。
因此,朴素Bayes模型对于文本类的情感分类是有效的,同样,对于视频而言,虽然其信息量显著增强,但由于信息解析原理和分析模型的一致性,使用朴素Bayes模型来学习视频中的情感也是有效的。视频情感识别作为一个新兴的研究领域,近年来受到的关注越来越多,Xue等通过研究发现,虽然以前的研究提出了很多方法试图通过探索各种视频特征来学习视频层面的人类情感,但大多数的研究仅仅使用了简单低级的视频特征,没有考虑视频中不同多模式数据之间的进一步潜在联系。为了解决这些问题,Xue等提出了一种新的Bayes非参数多模态数据建模框架,用于从视频中学习情感,在这个框架中,首先从每个视频中提取基于CNN(卷积神经网络)的深度特征和音频MFCC(梅尔频率倒谱系数)特征,然后,利用对称对应分层狄利克雷过程(Sym-cHDP)对多模态数据进行建模,并进一步学习图像数据和音频数据之间的潜在情感事件,并通过实验,表明该文的方法优于其他方法[34]。综上所述,不论是对于文本信息还是视频信息,都可以通过情感朴素Bayes模型来完成待检验信息的分类,最终为进一步判断信息的虚假性提供可靠支撑。
(2)文本朴素Bayes模型
主要步骤是提取待检测信息的关键性文本特征向量,通过特征的权重分析,最终判断待检测信息的虚假性。例如,基于Bayes算法的分类方法仍然是垃圾邮件过滤方法目前研究的热点问题,Jeremy Eberhardt通过分析对比垃圾邮件检测环境下朴素Bayes文本分类的两种不同方法(多项式朴素Bayes和伯努利朴素Bayes),在对特征选择过程进行讨论后,得出提高特定环境的精确度的修改是使Bayes方法有效的关键的结论[35]。而Li等在研究传统的朴素Bayes模型检测垃圾邮件过程中发现,存在以下局限性:(1)在中文垃圾邮件过滤分类方面,朴素Bayes算法分类准确率明显低于英文邮件处理;(2)朴素Bayes使过滤器的准确性依赖于样本的顺序,在使用中,信息可能会造成误判。基于此Li等人提出了改进的朴素Bayes模型,主要是对特征选择方法TF-IDF(term frequency–inverse document frequency)进行研究,并对其提出了增强高频词类别权重的改进[36]。综上所述,用提取文本的文字特征来构建虚假信息的检测模型是可行的,同时,文字特征提取的不同以及权重的不同对于文本朴素Bayes模型的检测效率是有影响的。
需要注意的是,关于朴素Bayes模型在虚假信息检测中的应用,大部分是在文字类虚假信息检测中的应用,因为就复杂程度而言,文字类虚假信息比图像类或视频类虚假信息相对简单,因此研究较为深入,可以对目前检测模型进行分类,而图像或视频类虚假信息,虽然目前可以实现检测,但是仍然没有实现用Bayes模型进行检测,故情感朴素Bayes模型和文本朴素Bayes模型只是针对文本类虚假信息的Bayes模型进行分类。
用Bayes模型检测虚假信息的框架如图1所示,其主要思路是:对于获取的待检测信息,首先判断信息是否具有先验概率,以此对信息虚假性进行初步预测,然后使用Bayes模型处理提取到的待测信息相关特征及信息虚假性的初步预测,最终得出此信息为虚假信息的概率。本文是根据Bayes模型检测所使用的特征来对Bayes模型在虚假信息检测中的应用进行区分,主要有以下三个方面:
图1 Bayes模型在虚假信息检测中的应用
2.2.1 Bayes模型在虚假信息发布者检测中的应用。
应用Bayes模型对虚假信息发布者进行检测所得出的并不是虚假信息的概率,而是虚假信息发布者的概率,因为虚假信息发布者传播发布虚假信息的可能性非常高,所以快速而准确地检测虚假信息发布者会有效地抑制虚假信息传播的源头。而如果一条信息是虚假信息发布者所发布的,那么这条信息是虚假信息的可能性也会很高。虚假信息发布者的特征多是在注册时所填写的姓名、电话号码等其本身的特征,例如Freeman在研究过程中就曾提到,一个信息发布者所填写注册信息的真实性反映了信息发布者的真实性,并通过提取用户名称等特征,结合Bayes分类器构建相关模型,来检测信息发布者注册账号的真实性[37]。综上所述,Bayes模型在虚假信息发布者的检测应用中虽然是成功的,但是还要随时注意虚假信息发布者的相关动态,以便及时调整模型,保持较高的正确率。
2.2.2 Bayes模型在虚假信息内容检测中的应用。
虚假信息内容的检测是对信息虚假性最直接的检测,因为,经常发布虚假信息的人也有可能会发布真实信息,而真实的信息也有可能会引发某些虚假信息场景属性的异常,例如消费者在一段时间内突然对某件商品有极大的需求量,而这件商品又因为质量较好获得了很多好评,这种情况虽然造成了信息场景中评论突发性属性的异常,但是却不是虚假信息的传播。因此,利用模型对信息内容虚假性进行检测,可以最直接地体现出使用模型的效率,参考价值更大。
针对虚假信息内容使用Bayes模型检测是可行的,对于虚假信息中的垃圾邮件内容方面,Bin等就通过基于正则表达式的文本预处理、基于虚假信息内容分词的特征提取及TF-IDF(term frequency–inverse document frequency)算法,建立了基于朴素Bayes算法的垃圾邮件分类模型[38]。Islam M S等人通过提取邮件的内容和标题特征,如邮件内容中的超链接数量、文字的颜色种类等,对待检测邮件建立Bayes模型,实现了检测邮件垃圾性的目标[39]。而针对虚假信息中的虚假新闻内容方面,Yang等提出用无监督的方式来解决虚假新闻检测问题,具体做法是将待检测新闻内容的真实性和用户的可信度视为潜在的随机变量,通过构建Bayes网络模型对虚假新闻进行检测[40]。
2.2.3 Bayes模型在虚假信息场景检测中的应用。
因为虚假信息的检测不是孤立的,其本身和场景相关信息的联系对检测虚假信息是有帮助的,所以,通过提取虚假信息相关场景的特征来建立Bayes模型最终检测信息的虚假性是可行的。这种Bayes模型应用的主要的技术模式有以下两种:
一是基于构建Bayes网络模型来检测信息的虚假性。因为垃圾邮件作为虚假信息的一种类型,通常是在社交网络中进行传播交流的,可以将社交网络定义成由一定数量的节点和边组成,通过提取信息场景的相关特征建立Bayes网络模型来检测垃圾邮件。例如Park等人通过建立一个具有节点和边的社交网络,通过提取请求拒绝率(一个节点发送的朋友请求有多少次被其他节点拒绝)、朋友的朋友(某人更可能接受朋友的朋友请求)等相关场景特征,构建了一个可以发现垃圾邮件的Bayes网络模型[41]。
二是基于朴素Bayes模型来检测信息的虚假性。通过利用提取到的不同种类的虚假信息场景特征构建Bayes模型是可行的。例如,Arjun等通过提取内容相似性、极端评论等特征针对垃圾观点建立Bayes模型,可以实现对垃圾评论者的检测[31]。虽然Arjun等的文献检测的是垃圾评论者,但是提取的特征属于场景特征,而垃圾评论者发布的也是虚假信息,因此,本文将Arjun等构建的Bayes模型划分到虚假信息场景检测中应用的类别。Hooi等针对虚假评论现象,提取其中评论爆发性和极端评级的特征构建Bayes模型,最终实现了虚假评级的检测[42]。
综上所述,作为无监督学习的一个典型代表—Bayes模型在虚假信息检测中有着很广泛的应用,而使用虚假信息提取到的相关特征来建立Bayes模型也可以达到令人满意的检测效果。
3. 研究展望
虽然朴素Bayes模型应用于文字类虚假信息检测研究较为深入,但多是针对微博、以及垃圾邮件,未来朴素Bayes模型的应用研究可以在文本的种类上进一步拓展,比如开源情报的检测。以此来不断增强朴素Bayes模型应用的普遍性,同时,因为朴素Bayes模型在检测过程中会默认待检测信息是相互独立的,最终会对模型检测的准确率产生一定影响,属于朴素Bayes模型的天然缺陷,因此需要把这个因素考虑进去,不断优化模型,以期达到更高地模型检测准确率。
通过综述研究发现,相较于文本类信息,图像、视频类虚假信息的检测相关研究还不充分,主要原因是图像、视频类虚假信息的特征较多,提取难度大,同时虚假图像、视频的定义及判定标准还没有统一,因此,针对图像、视频虚假信息检测研究相对较少,暂时还没用使用朴素Bayes模型来检测图像、视频虚假信息。同时,针对朴素Bayes模型应用于图像、视频类虚假信息检测主要还存在以下两个方面的挑战,也是未来该领域研究亟待解决的关键性问题。
一是先验概率的确定,因为对于所建立的Bayes模型而言,需要待检测信息的先验概率,如何更有效地获得先验概率,为模型检测提供有效输入是一个挑战。要获得图像类或视频类虚假信息的先验概率,首先就要知道这类信息的源头及上下文、作者活动特点等方面的信息,以此来估计待检测信息的先验概率。这对于相关研究人员比较困难,因为研究人员获得的往往只是孤立的一张图片或一段视频,先验概率难以判断。虽然可以通过参数估计方法得到待检测信息先验概率,但毕竟是估计的,正确率有待检验。未来研究可通过直接将先验概率固定或者选择合适的参数估计方法来解决检测信息先验概率的问题。
二是后验概率的计算,主要体现在如何有效提高Bayes模型对于图像类和视频类虚假信息的检测效率。目前利用虚假信息特征建立的Bayes模型大多针对的是文本类虚假信息,针对图像类和视频类虚假信息一直没有建立有效的Bayes检测模型,这主要是因为对于文本类的虚假信息来说,虽然可以提取到的特征有限,但是应用这些有限的特征可以很好地实现Bayes模型对于信息本身的检测。而图像类和视频类的虚假信息,其信息量本身非常大,可提取到的特征也很多,从信息本身来说对于提取到的特征,区分哪些可以有效利用,哪些属于冗余特征占据了研究人员很大的精力,但即使使用有用的特征最终也没有实现与检测文字类虚假信息相当的检测效率和效果。未来可在保证模型通用性基础上,通过缩小检测信息的种类来提高特征提取率,例如,重点针对健康类虚假视频提取其中的共有特征,找到关键特征建立模型,最终实现检测效率的提高。
结 语
移动自媒体的快速发展为虚假信息的传播提供了很大的便利,而虚假信息的传播会损害正常产品的影响、误导个人或组织的决策、降低用户的体验,快速发现、定位虚假信息对于网络信息治理具有重要意义。在这样的背景下,虚假信息的检测问题成为情感分析、自然语言处理等领域研究的热点问题。
本文在对信息、错误信息和虚假信息等相关文献比较分析的基础上,认为虚假信息是在信息传播的过程中,为了达到个人或组织的某种目的(如经济、政治),而有意传播旨在于达到误导他人目的的信息,其有着意向性和误导性的关键特征,可分为文字类、图像类和视频类虚假信息三种类型。本文重点综述了无监督学习的典型代表—Bayes模型在虚假信息发布者检测、虚假信息内容检测和虚假信息场景检测中的相关应用,在研究案例回顾基础上分析了Bayes模型在虚假信息检测中应用的技术原理及主要方式。同时,在文献综述基础上,本文结合虚假图像、视频类信息检测问题,提出了Bayes模型应用的关键技术挑战,并给出未来研究可能的机会与技术思路。
【参考文献】
[1] 白冰茜. 自媒体的发展研究[J]. 新媒体研究, 2018, 4(6): 109-110.[2] VOSOUGHI S, ROY D, ARAL S. The spread of true and false news online[J]. Science, 2018, 359(6380):1146-1151.[3] GUPTA A, LAMBA H, KUMARAGURU P, et al. Faking Sandy:Characterizing and identifying fake images on Twitter during Hurricane Sandy[C]//Proceedings of the 22nd International Conference on World Wide Web companion.New York:Association for Computing Machinery,2013: 729-736.[4] JIN Z, CAO J, GUO H, et al. Detection and analysis of 2016 US presidential election related rumors on Twitter[C]//Proceedings of International Conference on Social Computing, Behavioral-Cultural Modeling and Prediction and Behavior Representation in Modeling and Simulation. New York:[s.n], 2017: 14-24.[5] 张艳梅, 黄莹莹, 甘世杰,等. 基于贝叶斯模型的微博网络水军识别算法研究[J].通信学报,2017,38(1):44-53.[6] NARAYANAN V, ARORA I, BHATIA A. Fast and accurate sentiment classification using an enhanced naive bayes model[J]. Lecture Notes in Computer Science,2013, 194-201.[7] WU J, DENG T. Research in anti-spam method based on bayesian filtering[C]//Proceedings of the 2008 IEEE Pacific-Asia Workshop on Computational Intelligence and Industrial Application.Institute of Electrical and Electronics Engineers. Wuhan:IEEE Press,2008: 887-891.[8] FLORIDI L. In defence of the veridical nature of semantic information[J].European Journal of Analytic Philosophy,2007,3(2): 1099-1113.[9] FLORIDI L. Is semantic information meaningful data?[J].Philosophy & Phenomenological Research,2005,70(2): 351-370.[10] FETZER J H. Information: Does it have to be true?[J].Minds & Machines,2004,14(2): 223-229.[11] FALLIS D. Floridi on disinformation[J].Etica & Politica,2011,14: 201-214.[12] KARLOVA N A, FISHER K E. A social diffusion model of misinformation and disinformation for understanding human information behaviour[J]. Information Research,2013,18(1):1-17.[13] Primiero G . Information in the philosophy of computer science[M]//The Routledge Handbook of Philosophy of Information. London: Routledge Taylor & Francis Group,2016.[14] STOKKE, ANDREAS. Lying, deceiving, and misleading[J].Philosophy Compass,2013,8(4): 348-359.[15] FALLIS D. What is disinformation?[J].Library Trends,2015,63(3): 401-426.[16] SøE S O.Algorithmic detection of misinformation and disinformation: Gricean perspectives[J].Journal of Documentation,2018,74(2): 309-332.[17] SøE S O.A unified account of information, misinformation, and disinformation[J]. Synthese,2019,11:1-21.[18] Toine Bogers, Antal Van Den Bosch. Using language models for spam detection in social bookmarking[C]//Proceedings of 2008 ECML/PKDD Discovery Challenge Workshop. New York:Association for Computing Machinery,2008: 1-12.[19] MARKINES, BENJAMIN, CATTUTO, et al. Social spam detection[J]. Proceedings of the 5th International Workshop on Adversarial Information Retrieval on the Web. Madrid: Association for Computing Machinery, 2009: 41-48.[20] SHU K, SLIVA A, WANG S, et al. Fake news detection on social media: A data mining perspective[J]. ACM SIGKDD Explorations Newsletter, 2017, 19(1):22-36.[21] BOIDIDOU C, PAPADOPOULOS S, APOSTOLIDIS L, et al. Learning to detect misleading content on Twitter[C]//Proceedings of the 2017 ACM on International Conference on Multimedia Retrieval, Bucharest. Romania: Association for Computing Machinery, 2017: 278-286 .[22] DA LUZ A, VALLE E, ARAUJO A. Content-Based Spam Filtering for Video Sharing Social Networks[C]//Proceedings of CoRR. Brawse-Sart . 2011.[23] HOU R, PéREZ-ROSAS V, LOEB S, et al. Towards automatic detection of misinformation in online medical videos[C]//Proceedings of ACM International Conference on Multimodal Interaction. Suzhou: Association for Computing Machinery, 2019: .[24] YUSOF Y,SADOON O H. Detecting video spammers in youtube social media[C]//Proceedings of the 6th International Conference of Computing & Informatics. Sepang: University Utara Malaysia, 2017:228-234.[25] BENEVENUTO F, RODRIGUES T G, ALMEIDA V, et al. Identifying video spammers in online social networks[C]//Proceedings of the 4th International Workshop on Adversarial Information Retrieval on the Web. Beijing: Association for Computing Machinery, 2008: .[26] BHAT S Y, ABULAISH M. Community-based features for identifying spammers in online social networks[C]//Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. Niagara Falls: IEEE Press, 2013: 100-107.[27] 吴晔, 李永宁, 张伦. 计算视角下的虚假信息传播:内容、主体与模式[J]. 河南师范大学学报:自然科学版, 2019, 47(2): 29-35.[28] LEVCHUK G , JACKOBSEN M , RIORDAN B . Detecting misinformation and knowledge conflicts in relational data[C]//Proceedings of SPIE Signal Processing, Sensor/information Fusion, & Target Recognition XXIII. San Diego: International Society for Optics and Photonics, 2014: .[29] VEDOVA M L D, TACCHINI E, MORET S, et al. Automatic online fake news detection combining content and social signals[C]//Proceedings of the 22nd Conference of Fruct Association. Jyvaskyla:IEEE Press, 2018:272-279.[30] 任敏. 大数据网络中虚假情报信息优化识别仿真研究[J]. 计算机仿真, 2017, 34(3): 297-300.[31] MUKHERJEE A, KUMAR A, LIU B et al.Spotting opinion spammers using behavioral footprints[C]//Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. Chicago: Association for Computing Machinery, 2013: 632-640.[32] ZHANG H, LI Y, MA F et al.TextTruth: An unsupervised approach to discover trustworthy information from multi-sourced text data[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. London: Association for Computing Machinery, 2018: 2729–2737.[33] 熊立文. 贝叶斯决策理论与归纳逻辑[J]. 北京师范大学学报(社会科学版), 2005(2): 109-114.[34] XUE J, LUO Z, EGUCHI K, et al. A Bayesian nonparametric multimodal data modeling framework for video emotion recognition[C]//Proceedings of the IEEE International Conference on Multimedia & Expo. Hong kong:IEEE Press,2017: .[35] EBERHARDT J. Bayesian spam detection[J]. Morris Undergraduate Journal, 2015, 2(1): 1-6.[36] LIN L, CHI L. Research and improvement of a spam filter based on naive bayes[C]//Proceedings of the International Conference on Intelligent Human-machine Systems & Cybernetics. Hangzhou: IEEE Press, 2015: 361-364.[37] FREEMAN D M. Using naive bayes to detect spammy names in social networks[C]// Proceedings of the 2013 ACM workshop on Artificial intelligence and security. Berlin: ACM, 2013: 2-12.[38] NING B, JUNWEI W, FENG H. Spam message classification based on the naieve Bayes classification algorithm[J]. IAENG Internaitonal Journal of Computer Science, 2019, 46(1): 46-53.[39] ISLAM M S, MAHMUD A A, ISLAM M R. Machine Learning Approaches for Modeling Spammer Behavior[M]. Berlin:Springer, 2010.[40] YANG S, SHU K, WANG S, et al. Unsupervised fake news detection on social media: A generative approach[C]//Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Hawaiian: AAAI, 2019: 5644-5651.[41] PARK D H, CHO E A, ON B W. Social spam discovery using Bayesian network classifiers based on feature extractions[C]//Proceedings of the IEEE International Conference on Trust, Security & Privacy in Computing & Communications. Melbourne: IEEE Press, 2013: 1808-1811.[42] HOOI B, SHAH N, BEUTEL A, et al. BIRDNEST:Bayesian inference for ratings-fraud detection[J]. Computer ence, 2016: 495-503.来了快看:2019学术大礼包
声明:版权归《中国电子科学研究院学报》所有。转载请务必注明出处,违者必究。文章观点不代表本机构立场。
《中国电子科学研究院学报》欢迎各位专家、学者赐稿!
投稿链接 http://kjpl.cbpt.cnki.net
邮箱:dkyxuebao@vip.126.com