政科前沿|吴江 张小劲:大数据国际政治研究的回顾与展望
【摘 要】近年来,随着数据挖掘算法和新数据库的不断引入,大数据国际政治研究逐渐发展起来。这一新的研究方向目前已在暴力冲突研究、反恐研究、国际政治传播学研究以及公共外交中取得了一定成果。大数据与国际政治研究的结合可以在事件预测与辅助决策、微观理论和中层理论研究,以及宏观理论研究这三个层次上得以实现。然而,大数据国际政治研究也必须应对数据和算法的不完善性所带来的挑战。大数据国际政治研究的未来方向不仅仅是加强实际应用,而且更应该侧重完善学科的理论建构。为此,应开发新的数据源,倡导多种研究方法的协同运用,大胆创造新的算法-数据实体,建立新的研究合作机制,并积极运用可视化技术。
【关键词】大数据;数据挖掘;国际政治;国际关系;
一、导言
“大数据”可以从两个层面加以定义。狭义的“大数据”是指体量异常庞大、结构复杂,以至于传统数据处理技术难以应对的数据集。人们通常用“5V”或“6C”来概括大数据的特点。所谓“5V”是指“Volume”(即数据集中的个案或字段数量庞大)、“Variety”(即数据种类多样化)、“Velocity”(即数据传输和处理的速度应大幅提高)、“Veracity”(即数据应准确反映实际情况、提供精确信息)和“Value”(即富有价值的信息能够从信息信息密度较低的数据中被提炼出来)。所谓“6C”,是指大数据技术所涉及的6个主题,即“Connection”(数据收集装置和信息网络)、“Cloud”(数据存储和数据需求)、“Cyber”(模型与内存)、“Con-tent”(意义和关联)、“Commu-nity”(分享与合作)和“Customi-zation”(个性化的信息获取)。广义的“大数据”则被视为海获取、传输、存储、结构转化、清理、分析、解和应用读量数据(即狭义的“大数据”)的方法、技术和模式。由于数据分析工作在海量数据处理过程中居于核心地位,研究者进一步提出了“大数据分析”(Big Data Analytics)的概念。
“大数据+”为社会科学研究带来了新的理论视域和技术手段。大数据国际政治研究,与大数据社会学、大数据金融、大数据政治学等一样,是大数据与社会科学相结合后开辟出的一个前景广阔的研究领域。将大数据用于研究只不过是以前所从事的定量研究的自然延伸而已:一方面,实证研究的不断发展需要引入新的研究方法、数据和模型;另一方面,以往从事定量研究的研究者在了解了数据科学的基本知识(如API的使用、数据库语言)后,可以顺利踏上基于大数据的探索之路。另外,虽然多数国际政治方面的定量研究,如分析战争死亡人数、军费、民主/集权程度等等,只需处理体量较小的样本,实际上,对大样本数据的关注也一直存在。
在数据收集工作上,早在1972年,兰德公司就建立了“兰德恐怖主义年鉴”(RA-ND Terrorism Chronology)数据库;20世纪80年代,美国政府就已开始使用这一数据库。在冲突研究方面,Trappl等人尝试利用C4.5决策树来预测冲突管理行为的结果。Kovar等人探讨了利用数据挖掘算法来为事件数据的时间序列建模并进行事件预测的可能性。在预测系统方面,基于QJMA (Quantifi-ed Judgement Method of Analysis)方法的TNDM(Tactical Numerical Deterministic Model)模型也在20世纪70年代诞生了。它允许用户输入假想的冲突数据,并据此对冲突的损失进行预测。然而,尽管这些研究均涉及大量数据的收集和使用,但由于样本量和技术方面的限制,这些研究尚无法被归入基于大数据的研究这一范畴。不过,也有一些作品,尽管在其产生之时并没有“大数据”这一提法,但以今天的观点来看,它们确实可以算是基于大数据的研究的雏形。比如,Mallery探讨了利用文本分析技术为政治认知建模,优化外交决策等问题。
从2005年开始,将大数据与国际政治研究相结合的成果开始不断出现。在数据资源方面,研究者们已不再满足于COW(Correlates of War)、WEIS (World Eve-nts Interaction Survey)等数据库,而是开始更多地使用来自路透社、Google、GTD (Gl-obal Terrorism Database)等数据提供方的资源。同时,支持向量机、隐马尔科夫模型、贝叶斯模型平均、随机森林等数据挖掘方法也被引入研究中。借助不断丰富的数据、复杂的模型和先进的计算机技术,国际政治与大数据的融合促成了一些具有很高学术价值或实用价值的成果。有鉴于此,对这一领域目前的发展状况进行总结,有助于我们了解这一研究方向的前沿议题、掌握关键研究方法,洞悉现有研究的不足之处,从而推动相关研究取得更大进展。
二、大数据国际政治研究的议题领域
大数据与国际政治科学的融合目前已在多个议题领域取得研究成果;而暴力冲突研究、恐怖主义研究,以及国际政治传播学和数字外交方面的跨学科研究则是研究成果较为集中的领域。
(一)大数据在暴力冲突研究上的应用
战争与和平是国际政治研究的核心议题。冷战后,尽管大国之间爆发大规模战争的可能性降低,但是边境冲突、局部战争、有外国力量干预的内战(甚至是冲突双方都受大国影响的内战)时有发生。借助大数据技术,研究者们可以对冲突进行更深入的研究,以期洞察关键动因,寻找解决之道。
在对冲突进行的量化研究中,一个重要的研究方向是根据事件数据的时间序列来抽取暴力事件的发生、变化模式。Schrodt利用隐马尔科夫模型来达到这一目的,并考察了这一模型是否能有效预测1990年代发生在南斯拉夫的各类冲突。作者提取路透社相关新闻的第一句话进行了自动编码,然后分别为高冲突星期序列(high-conflict-weeks equences)和低冲突星期序列(low-conflict-weeks equences)建立模型。在预测时,模型会分别计算一个事件序列与以上两个序列相符的可能性,进而做出判断。经过验证,作者发现隐马尔科夫模型在预测政治事件时具有较高的稳健性。
Yonamine对1997年至2011年间29个亚洲国家的约两百万条经自动编码的新闻事件进行了研究,以探讨一国国内冲突对该国与别国的关系产生的影响。线性回归模型和多维样条模型显示,一国的国内冲突并不会增加它与其他国家在接下来的几个月中爆发冲突的可能性,但是却会使它在当月与别国发生冲突的可能性增加。
Zammit-Mangion等人借助贝叶斯分层模型和时空数据对冲突中的不确定性进行量化分析的方法,并利用Wiki Leaks Afghan War Diary中的数据对模型进行检验。Perry尽管并未进行国际冲突研究,却结合格网化数据介绍了朴素贝叶斯和随机森林这两种机器学习的常用算法在政治事件预测方面的作用。
(二)大数据在恐怖主义研究上的应用
在恐怖袭击时有发生,反恐话题热度不减的背景下,大数据被广泛用于反恐研究。大数据可以在以下几个方面对反恐研究有所贡献:恐怖活动预测、恐怖组织网络分析、恐怖组织宣传及文化分析,以及以打击恐怖主义为根本目标的基础研究。
在预测恐怖活动方面,Petroff等探讨了利用隐马尔科夫模型和经过自动编码的事件数据进行预测的方法。用1990年至2009年间伊拉克和阿富汗的数据建立了模型,两个模型的RMSFE值均接近0,可见模型的预测效果是令人满意的。
值得注意的是,受冷战的意外结束、发生在索马里和前南斯拉夫的冲突,以及卢旺达大屠杀等事件的影响,美国早在20世纪90年代中期就开始尝试利用计算机技术对冲突进行预测,由其PITF(Political Instability Task Force)项目开发的模型可以提前两年对全世界的动荡事件进行预测,准确率在70%至80%之间。
在对恐怖组织网络进行分析方面,Fire等利用社会网络分析中的链接预测方法。近年来,社交媒体的发展在为人们的交流沟通提供了巨大方便的同时,也为恐怖分子提供了建立组织和策划活动的工具。Fire等设计了一个用于进行链接预测的机器学习模型,并且强调,尽管链测预测通常都被社交媒体用来向用户推荐好友,同样也可用来寻找像恐怖组织这样的较隐蔽的社交网络。
Carley主张利用动态网络分析(dy-namic network analysis)来对恐怖主义组织或个人的行为进行研究。与社会网络分析不同,动态网络分析不但关注人与人之间的联系,还关注人与知识、资源、任务、地点和组织等实体的关系,并能够对人和组织的演化过程进行分析。借助这一方法,研究者能够发现恐怖分子网络的弱点并且判断这一网络在外在干预下会发生怎样的变化。作者利用这一模型对基地组织的网络结构、精英人物、势力范围等进行了分析。
对恐怖主义宣传手段和文化进行研究,有助于决策者采取有效措施消除恐怖主义的心理根源和文化根源。在这方面,Skillicorn和Reid利用语义模型对吉哈德组织的两份电子杂志Inspire和Azan进行了研究。结果显示,在两份杂志中,告知性语言(用来传达关于敌对目标和技术手段的知识)、想象性语言(用来激发情绪并压抑理智)、欺骗性语言、吉哈德式语言(用来表达作者的思想)这四者均有较高的密度,而文章的复杂程度与其他杂志相仿。这些特点说明,吉哈德组织与国家一样能够掌握有效的宣传手段。
还有一些学者以分析恐怖组织为根本目的,对算法进行了深入研究。比如,Husslage等对无中心恐怖组织的最优结构进行了探讨。一方面,恐怖组织会避免让组织中的所有人认识所有人,以免出现在一人被抓时其他人也会有危险的情况;另一方面,成员之间的熟识程度又不能过低,因为这样会阻碍信息传递和行动协调。作者指出,这两个方面可以分别用“秘密尺度”和“信息尺度”这两个变量来衡量,而恐怖组织的总体表现是关于这两个变量的函数;恐怖组织越是能在这两个变量间取得平衡,总体表现值越高。在对算法进行了详细介绍后,作者对回教祈祷团在策划实施巴里岛爆炸时所组成的网络进行了分析。
Simari等设计了CONVEX算法以及通过加入权重而得到改良的CONVEX Merge算法。这两种算法的原理就是用代表行为体当前处境的向量与过去的个案进行对比并计算相似度。作者利用1980年至2004年中东地区多个种族政治群体(其中有许多群体都参与了恐怖活动)的活动数据对两个模型进行了检验,预测准确率超过了95%。
(三)大数据在国际政治传播学和数字外交跨学科研究中的应用
有些基于大数据的研究,很难将其完全归入国际政治领域或传播学领域。因此,更合理的做法是把这样一些研究看成是跨学科研究。
例如,Stockmann在对《北京晚报》和《人民日报》上关于美国的报道进行研究时,试图弄清的问题是:市场竞争压力是否会使媒体改变内容?作者指出,与1999年相比,北京市民在2003年对美国的态度更具否定性;因此,假如市场竞争压力确实会使报纸为迎合人们的心理而改变内容的话,那么2003年的报纸就会包含更多否定美国的内容———这一假设在研究中得到了证实。与此同时,为了防止媒体过多批评美国,媒体管理者会对带有某些重要内容的新闻(特别是关于中美关系的新闻)加以审查。因此,报纸要想增加批评美国的内容,就只能更多地报道那些不需要被审查的事件。作者于是提出,如果市场竞争确实会使媒体改变内容的话,就会看到各类报纸(特别是代表官方立场的《人民日报》)对不需被审查的事件的报道会增加———这一假设也得到了证实。作者最后的结论是,中国政府无意丑化美国;相反,为了使中美正常交往在舆论中得到合法性,就必须要求媒体不要过多批评美国,从而避免在舆论中激起民族主义。
Baum和Zhukov为研究冲突报道模式而收集了来自113个国家的2252份报纸中关于利比亚危机的213406篇文章。结合事件数据和政治制度测量指标所作的分析表明,民主国家和非民主国家对利比亚危机的报道存在着系统性的差异。与非民主国家相比,民主国家的报纸更多地报道由反对派发起的非暴力集体行动,且更多地报道由政府行动造成的人员伤亡,但对由反对派的行动而导致的伤亡报道较少。
数字外交(又称“电子外交”)———利用社交媒体达到外交目的———则是大数据、国际政治与传播学三者相结合的重要成果。随着互联网和社交媒体的快速发展以及传播学理论的不断进步:一方面,外交决策者发现,社交媒体是一个高效率、低成本的公共外交工具,借此,政府可以实时发布信息、传播理念、应对危机事件,并大量收集公众反馈;另一方面,非国家行为体,甚至是个人,借助互联网为沟通交流和组织动员提供的便利,可以在国际舞台上发挥更大影响力。在这种情况下,各国决策者逐渐认识到了数字外交的重要意义,并纷纷将其纳入外交战略中。比如,2009年,时任美国国务卿希拉里·克里顿着手进行数字外交方面的工作。在她领导下,国务院相关部门开通了194个Twitter账户和200个Facebook账户。在美国的带动和影响下,英国、加拿大等西方国家也将数字外交提上了日程;而伊朗、朝鲜等在国际社会中相对受孤立的国家也希望利用社交媒体发出自己的声音。无疑,互联网已经成了各国争夺国际话语权、展现本国形象、获取国际舆论支持、对外国民众施加影响的“电子战场”。尽管未来的国际外交舞台仍然以政府对政府的行动为主要内容,但是,无法适应数字外交新形势的政府将会发现自己难以应对别国、甚至是本国的舆论和社会运动所带来的挑战。
成功开展数字外交,以对于互联网技术、传播学、国际政治等学科的深刻理解为基础。总的来看,以推进数字外交为目的而开展基于大数据的研究,有两个核心研究方向:一是利用空间分析、社会网络分析等方法研究如何扩大信息传播的有效性,即如何让更多人接触到信息,以及如何增强信息的说服力。为此,研究者们可以利用大数据技术分析用户性格特点和浏览习惯、信息扩散网络、舆论领袖的作用,以及政府的互联网行为与现实中的正式行为的相关关系等。另外,值得强调的是,正如电子商务网站可以利用各种推荐算法为用户提供个性化的推荐组合一样,利用大数据和互联网技术,数字外交领域的决策者同样可以让不同的用户得到具有差异性的内容,或是以不同形式包装的同一内容。二是利用各类舆情分析技术(包括话题分类、情感分析等)来获取有助于决策的重要信息。比如,在2011年利比亚战争期间,英国政府相关部门利用社交媒体来识别重要社交媒体平台和关键人物,以便了解利比亚民众如何看待北约的干预,并且每天都将信息整理成报告供决策部门参考。
三、大数据国际政治研究的分析层次
本文以实用性和理论性为标尺的两端,将大数据国际政治研究划分为三个层次:预测与辅助决策、微观理论和中层理论的研究,以及以宏观理论为导向的研究。由此,我们能够更清晰地厘清大数据在推动国际政治研究方面的作用。
(一)结合层次一:基于大数据的预测和决策系统
预测和决策是国际政治最重要的主题之一,也是大数据与国际政治结合的第一个层次。其特点是,一方面,它具有较高的实用价值;另一方面,它的理论性较弱,但并非完全没有理论色彩,因为,在对模型给出的预测结果进行解释时,至少要以一定的国际政治理论和国际关系史方面的知识为基础。从既有文献来看,在所有利用大数据进行国际问题研究的论文中,以预测和决策为研讨目标的论文所占的比例高于其他类型所占的比例。
已有一些学者设计出基于新闻事件的预测模型。Chadefaux利用COW事件数据和Google News Archive提供的新闻事件在建立早期预警系统方面进行了尝试。作者首先证明,如果关于紧张关系的新闻报道数量上升,那么冲突更有可能发生,因此新闻事件可以成为冲突预警信号。以此为依据,作者建立了一个利用不断更新的新闻数据计算风险指数、预测在每个国家中冲突是否会发生并计算冲突发生的主观可能性的Logit模型。
Krummenacher的研究团队利用设在中亚、北高加索、巴尔干半岛等地区的LIN (local information networks)收集新闻事件,并且在对新闻事件进行文本挖掘的基础上建立了FAST早期预警系统。该系统可以分辨多达186种事件类型,从而帮助决策者能够了解冲突发展趋势,识别危机,以便及时制定应对策略。除了定量分析外,FAST系统还包括对单个国家潜在冲突的根源和影响因素所进行的定性分析。
在为外交决策提供辅助方面,Lowe对CBR(Case Based Reasoning)系统进行了深度探讨。CBR可以用于疾病诊断、设备故障检测等,也可用来提供决策支持。它假设人们在进行决策时总是参考以前的案例,因此,CBR首先根据每个事件所具有的多个特点进行编码,然后利用最近邻元素法、结构映射引擎等算法来判断事件所归属的类别。如果现在要对一个将要发生的事件的结果进行预测,就要把这个事件的相关信息按照编码方式输入到系统中,然后系统就会给出预测结果。这个结果要么是在以往事件中与我们所关注的事件最相似的一个事件的结果,要么是若干个相似事件的结果的众数。
还有一些作品,虽然是以事件预测为主要目的,但却更强调研究的基础认知性质。比如,Martinez等在利用行为模型预测恐怖组织行为方面做出了努力。他们指出,尽管人们已经开发了一些模型用以预测行为,如SOMA (Stochastic Opponent Modeling Agents)、CONVEX(Context Vectors)、Sit CAST(Situ-ation Forecaster)等,但是这些方法均试图抽取以往事件的内在模式并通过计算新的事件与这些模式的相似度来进行预测。然而,人类行为是富于变化的,并不总是与以往的模式相符,而以前的模型难以处理这类变化性。与这些关注相似性的模型不同,作者及其团队设计的基于行为时间序列的CAPE算法(Change Analysis Predictive Engine)关注行为的变化性,即行为体会在何时以何种方式改变其行为。以CAPE算法为基础的模型CAPE-Forecast能够综合CAPE、CONVEX和Sit CAST给出的结果并做出最终判断。作者利用五个恐怖组织在十年间的行为数据对这一算法进行了检验。
(二)结合层次二:微观理论和中层理论研究
在大数据与国际政治科学相结合的第二个层次上,数据和模型被用来检验一些假设;这些假设有时涉及一些并非立基于更高层次的理论之上的微观理论,有时则涉及国际政治某个细分领域中的中层理论。这一结合层次的理论性显然要高于预测与辅助决策领域,但其实用性却相对较低;然而,这并不妨碍通过研究而得到的洞察在得到进一步完善后可用于解决现实问题。
例如,Drury对影响美国总统有关经济制裁措施的因素进行了分析。利用自动编码的新闻事件和讲话文本,作者发现,首先,当美国与别国的紧张程度增加时,美国总统发起或扩大经济制裁的可能性会增加;但当别国对美国的制裁行为表示出强烈敌意时,美国会减小制裁力度。其次,在信念方面,美国总统的战略取向越偏向于合作一面,他发起经济制裁的可能性就越低;在制裁过程中,总统越是相信自己有能力掌控事件的发展,越可能会减小制裁力度。
再如,Baum和Zhukov利用文本挖掘技术对50个国家的1925份报纸中关于2011年利比亚事件和北约相关行动的102568条新闻进行了分析。他们发现,报纸的所有权结构及其与其他报纸的联系网络,会对涉及外交政策的报道产生影响。发行量较大、所有权结构较简单的报纸,对利比亚事件报道得更多,并且更偏好报道与军事相关的行动和决策,同时,对本国政府的政策持有更具批判性的态度。作者还指出,相对于逮捕、暗杀等选择性的暴力行为,报纸会更多地批评利比亚政府的非选择性暴力行为,如空袭居民区等。
(三)结合层次三:宏观理论研究
在大数据与国际政治相结合的第三个层次上,研究者或是试图检验一些对宏观理论来说至关重要的假设,或是试图借助数据和模型来建立一套全新的理论。这一层次的结合更加适合于那些特别关注理论探索的研究者,但其实用色彩却很少。
在国际政治理论领域,现实主义、自由主义和建构主义的缺陷早已被人所知,因此,学术界又发展出英国学派、国际政治的前景理论、国际政治的女性主义理论等新的流派。然而,无论是“三大主义”,还是其他各类理论,在资料收集、假设验证等方面都有不少缺陷。现实主义所讨论的国家实力通常都被简化成经济发展水平和军事实力;建构主义关注行为体的观念,但其依据通常只是官员讲话或少量官方文件。就此而论,大数据却可以为国际政治理论研究带来新的工具和新的视野。例如,现实主义者可以通过数以万计的变量来对国家进行描述,并且利用这些变量并通过降维算法所得到的潜变量来对综合国力进行更精细的界定和分解。自由主义者可以借助海关大数据,对科技快速发展和产业转型升级背景下政治关系与贸易关系之间的互动进行更深入的探讨,这是因为,与单纯的贸易量相比,商品贸易结构等因素也许更能反映国际政治的结构性特征。建构主义者则可以利用文本挖掘技术来分析海量的官方文件和公众舆论信息;研究生态环境与地区冲突的学者可以更好地对各地的不稳定因素进行监测,等等。
在利用大数据进行理论建构方面,已有一些学者作出了努力。Crooks等利用Twitter用户言论、联合国大会投票情况、武器转移数据对自2011年开始的叙利亚冲突进行了研究。借助社会网络分析技术,作者发现,除了由作为主体的国家所组成的“自上而下”的国家共同体和国际关系网络外,还存在着一个基于各国公民的、通过对话题的讨论而形成的“自下而上”的共同体和网络,二者呈现出相当不同的结构。作者对共同体的相似度进行了计算:由参加联合国大会的各国组成的共同体,其1990年代的状态与21世纪初的状态相似度高达0.81(该值的范围为从0到1),而这一共同体冷战前的状态与冷战后的状态之间的相似度为0.55。这两个数据之间的差异是由苏联集团的解体和冷战后新的国家间关系的形成而造成的。不过,由国家组成的共同体与基于公民的网络共同体之间的相似度仅为0.27。
Baggott尝试结合大数据探讨相互感知中的不确定性在安全困境形成过程中的作用。他一方面利用反映相互感知的内部文件:1969-1981年中国的官方内部讨论资料,以及美国FRUS (Foreign Relations oft he United States)数据库中的文件;他同时也利用《纽约时报》上报道双边外交事件的130万条新闻。借助回归模型,作者发现,与口头行为相比,一方的实质行为给另一方的感知造成的影响更大;与合作行为使对方产生的正向感知相比,挑衅行为产生的负向感知更为明显。其次,与中国对美国的态度相比,当美国对中国的感知中存在不确定感时,这种不确定感会导致美国对中国持更加积极友善的态度。可见,不确定性在不同国家的外交评估中产生的效果是不同的。
四、大数据国际政治研究中的误区、挑战和建议
大数据为国际政治研究开辟了新的发展空间。在将大数据用于推动国际政治研究的过程中,既要避免对“大数据”作出过等泛化的理解,同时也应当正视并妥当处理研究过程中的各种挑战。大数据国际政治研究的推进也许比其他的研究方法更多地有赖于人们在创新合作模式、开掘数据资源等方面作出更大的努力。
(一)大数据国际政治研究的误区
当前,一个不可忽视的误区是,人们不愿或未能明确哪些研究议题归属于大数据国际政治研究。首先,诸多科普类文章和媒体报道强调“大数据”指的是一种思维方式,以及一种科研、经济和社会生活的发展趋势,即重视对数据的收集、整合和利用。这种对大数据的界定主张,人们不应过分关注数据集的大小,而应关注如何让数据产生更多思想的或物质上的价值。然而,正如本文开头的定义所强调,无论是狭义上的还是广义上的“大数据”,都强调数据量要足够大。以这样的标准来看,在国际政治研究中,有些量化分析文章只是使用了COW、KOSIMO(Conflict Simulation Model)等传统事件数据库,另一些使用了世界银行、Polity IV,以及统计年鉴的数据;还有一些文章将多个数据库的资源投入到一项研究中,以便借助数据间的内在关联而发现规律。按照本文对于大数据的界定,由于所使用的数据的体量并不大,这些研究尚难以被归类为基于大数据的研究。
其次,被称为大数据的资料必须是可进行量化分析的资料;或者,虽然资料暂时无法被量化,但至少收集资料的工作是以量化分析为最终目标的。仅仅收集海量的定性资料,以完成信息分类、知识积累和知识分享,而不进行量化分析或并不以量化分析为最终目的,那么这些工作同样难以被归入大数据研究的范畴。例如,在情报学领域,用以辨别一个组织是否在开发生物武器的模型,要求人们去搜集与设立试验区域、获取试验材料、运输战剂、运送动物、处理动物尸体等行为相关的信息。然而,这一识别模型承担的主要是信息的整合、对比和拼接任务,而并非是真正意义上的量化分析工作。因此,也很难将这类情报分析看作是大数据研究。
再次,我们还很难将直接用于具体业务的数据收集和分析行为视为大数据国际政治的关注点。与上文中提到的基于大数据的预测和决策系统(结合层次一)相比,此类研究更加缺少学术价值。例如,国家安全部门出于反恐需要对电话、邮件、网上聊天内容等进行监控,以此来对恐怖分子的关系网络进行分析,并安排相应的监控和抓捕行动。再如,Hisakawa尝试利用GIS (Geo-graphic Information System)技术来识别高渗透性地区并进行边境管理。这两种应用所涉及的数据完全可以称为大数据,这些与应用紧密结合的分析已超出国际政治的研究范围。尽管我们承认,利用从监控过程中得到的信息,可以分析恐怖分子在不同国家间来往的特点;掌握更丰富的边境地理信息,也有助于更好地进行外交决策———但这些分析毕竟都与最初的业务领域有较大的差异。这是应用衍生发展而非学术研究的拓展。实际上,一些早已存在的基于海量数据的研究更适合被划入情报学、军事科学、地理学、金融学等领域,而并不适合纳入大数据国际政治的研究议程。
(二)大数据国际政治研究的挑战
像其他数据密集型社会科学一样,基于大数据的国际政治研究也需要应对诸多问题和挑战,包括变量过多且存在自相关性,以贝叶斯主义的方式解释频率主义的统计结果,待验证假设超出了数据的统计强度,等等。不过,这一研究方向同时还有一些更为明显的缺陷。
首先,国际政治领域中多数与大数据有关的文章都需依靠对新闻资料进行文本挖掘,这对研究的科学性有不可忽视的影响。一是借以分析新闻文本的自然语言处理技术尚不成熟,难以处理转折关系、因果关系等形式范畴和结构复杂的语句,更不用说准确地理解比喻、夸张等修辞方法。二是在冲突发生时,新闻报道的数量会急剧增加当局势平和时,报道又会较少甚至消失。因此,一些导致冲突升级的重要事件就会被遗漏。导致报道遗漏的另外一个原因是,媒体倾向于只报道那些会引起广泛关注的事件。三是研究者利用新闻资料时往往假定,在新闻事件中,主体的行动能够反映其真实意图;但事实上并非如此。同时,新闻报道在话题、内容和数量方面也极易受到政府的干预。最后,在对新闻报道进行赋值(比如,文本挖掘时常用到的喜爱-厌恶值、冲突-合作值等)时,是对单个报道赋值,还是应该对一个周期(比如一周)内的报道集合赋值,还有待进行更深入的研究。一方面,采用单篇报道的数值是不合理的,因为一篇新闻报道不足以反映事件全貌。另一方面,对报道集合赋值同样也不能令人满意。较之于两个国家在同一个星期内发生多次小规模武装冲突,两国在一周内进行了一场激烈战斗的场景有所不同;而以星期作为集合周期的话,第一种场景的冲突程度数值却可能与第二种场景的数值是相等的。这种把多个不同事件“简化”成一个数值的做法,无疑会对分析结果产生不可忽视的影响。这也是关注事件的性质和情境的国际政治研究者不愿意看到的。
其次,大量基于大数据的政治模型都是为了对事件进行预测而开发出来的。然而,模型能够被真正用于实际工作的可能性相对较低。一是在定性分析中,人们往往凭借直觉和少数几个变量就可以做出非常准确的判断,使用大数据和复杂的算法就是不必要的了。当然,大数据技术对于决策者的最大吸引力在于它具有自动监测、自动处理数据和自动提示等功能。然而,多数模型的自动化程度并没有达到这一水平;就此而论,大数据技术的吸引力也就大大降低了。第二,多数国家都在异国设有使领馆、记者站等机构,这些机构的工作人员会利用身处当地的优势和个人体悟对复杂的形势做出判断。这些判断或许要比模型给出的预测结果更加有价值。因此,要说服外交决策者放弃这些信息来源转而去相信数据和机器的预测,也是完全不可能的。第三,人们仍普遍认为大数据科学更强调相关性而不是因果性。这种观点至少对国际政治来说完全是误导性的。相关性不但不能满足理论建构的需要,也难以用于外交决策工作。显然,就目前的发展水平而言,大数据技术无法有效地分析政治体制的决策模式、国家长远战略的稳定性、偶然事件的微妙影响、威慑与实际行动之间的精巧平衡等重要因素在事件发展过程中所起的作用,而涉及这些因素的因果关系却是决策者在实践中必须时刻考虑的。最后,理想的情况是研究者把预测模型做成图形界面,供并不精通大数据技术的人员使用,更好地发挥模型的实用价值。但在现实的研究工作中,设计成互动界面的模型毕竟只是少数。
再次,在利用大数据进行预测时,模型本身的缺陷使其能够产生的有效知识及其对决策的帮助有所伤害。众所周知,模型在应对复杂多变因而无模式可循的情况时难以得到较高的准确性。即使是准确性很高的模型,其价值也会受到质疑。以常用的Logistic回归为例,假设我们要生成一个用来判断事件是否取真值的模型,再假设在我们的样本中,97%的个案为非真值,这意味着空模型的准确率高达97%。现在把大量变量放入模型中,使准确率升到了98%,也就是说,只使准确率上升了1%。但决策者在决定采用大数据技术之前,必然思考是否为了这1%的提升而动用大量资源。同时,模型生成的假阳性结果———无论是将公民误判为恐怖分子,还是误判某个国家未来一年会发生叛乱———都可能会造成严重的决策失误和资源浪费。因为,决策不仅仅是为得到分析结果,而是还要根据分析结果调整应对策略并调配大量资源。现有模型在减少假阳性结果方面并不尽如人意。
(三)大数据国际政治研究的前景和相关建议
上述评价并非是一种悲观主义的价值立场,相反,要推动大数据国际政治研究的健康发展,研究者需要在以下几个方向上作出更多的努力和尝试。
第一,增加数据种类和数据来源。将大数据与国际政治研究相结合,意味着研究者要把国际政治科学改造成一门数据密集型科学。这样一门科学包括收集数据、选取算法、分析计算结果、将研究成果转化成实际应用等环节。在学科的每个发展阶段,都会有一个主导环节,而其他环节都会围绕这个主导环节被建构和组织起来。在当前阶段,大数据国际政治的主导环节还是数据发现和数据收集。尽管国际政治学者们已经使用过大量数据,如前所述的COW事件数据、外事访问信息、联合国公开的统计数据等等,但就它们的体量而言都难以被称为大数据。实际上,目前大数据国际政治所能利用的大型数据集是非常有限的,包括新闻报道库、社交媒体信息、官方文件集、地理数据、海关数据、一段较长历史时期的关系数据等。这些数据无法满足未来大数据国际政治研究的需要。因此,研究者们需要寻找新的有价值数据及获取渠道。
第二,倡导多种研究方法的联合运用。一方面,基于大数据的研究需要借助其他研究方法来弥补自身在历史文化背景、国际政治理论等方面的短板,以便更好地洞察问题,解释数据和分析结果,并将研究成果理论化。其他研究方法同时也需要利用定量研究在假设检验、理论与现实对接等方面的优势。因此,研究者们应该注意在研究中同时使用定量分析、形式模型、思辩分析、案例分析、历史分析等多种研究方法。
第三,致力于利用大数据及数据挖掘技术构建算法-数据客体。在进行理论研究时,分类和概念化是一项重要的工作:分类就是区分出一个待研究客体与另一个客体,或者指出一个客体如何不同于其他客体;而概念化就是对被分类的客体进行抽象界定。通过分类和概念化产生的术语很多都被用来指称理论依赖型客体,比如物理学中的夸克、弦、平行宇宙等。在国际政治领域,同样需要发现这样一些更为抽象的客体,很显然,像单极世界、两极世界、相互依赖这样的半理论化术语难以用来分析当前世界的复杂现象。借助海量数据,以及聚类、因子分析、决策树等算法,我们可以发现一些新的分类方式,找到一些新的理论依赖型客体———或可称之为算法-数据客体。我们在量化分析中时常遇到的结构方程模型中的潜变量、判别分析中的判别函数、决策树输出的规则集等等,均可看作是算法-数据客体。正如其他理论依赖型客体是存在的,但却只有在特定的概念背景下才能被理解一样,算法-数据客体也是存在的,但却只有在明确所使用的算法和数据的前提下才真正具有意义。借助这些新概念,研究者们可以超越目前仍然基本停留在机械论的理解方式中的国际政治理论。需要强调的是,国际政治科学借助大数据来提高自身的实用价值具有一定合理性,但是,一味强调大数据在预测或外交辅助决策方面的应用,对学科建设和发展来说却是不利的。相反,如果国际政治研究有志于创造实用价值,最好的办法也许是走某种迂回路线。也就是说,要借助大数据开展基础研究,发展新理论,改变人们看待世界事务的视角。
第四,研究者之间要建立新的合作模式。在数据密集型自然科学领域,Abbott早已指出,在新的科研模式中,创新将更加频繁,创造知识和使用知识的人之间的关系将更加紧密,科研合作机制也将发生改变。Hunt等人指出,为了综合多个数据库的数据进行研究,需要发挥云计算的优势。这又进一步要求,应该在云发展有助于研究者和数据提供者进行合作的新方式。这些自然科学领域的建议也适用于国际政治科学。基于大数据的国际政治研究必然会强调各种研究要素的整合协调,包括数据、计算基础设施,以及统计学、数据库、国际政治,传播学等方面的知识;而多种研究方法的联合使用,以及从数据到理论的抽象提炼过程,进一步对合作效率与合作质量提出了更高要求。一种鼓励合作的研究进制应确保每个人的贡献都应在最后的成果中有所反映;不满足这一标准的科研机制不太可能成为一种有效的机制。当前的学术评价和发表机制较难满足这一要求。最为明显的难处在于:一方面,基于大数据的研究对数据的体量、质量和多样性提出了更高要求,仅仅是收集数据的工作就可能要耗费大量时间精力,甚至还可能要以复杂的技术知识为基础;另一方面,在当前人们尚普遍强调论文的第一作者或者是唯一作者的情况下,与执笔者相比,为论文写作提供数据的学者贡献更难以得到充分承认。因此,我们无疑需要制定出一些能够鼓励合作、能够更平等地反映每个人贡献的发表机制、科研机制和确认机制。建立了这样的机制,合作研究将会更加普遍,也会有更多的资源、更多的创造力和想象力被吸引到这一领域中。
第五,加强大数据国际政治的可视化展示。目前,已有一些作品在冲突分析的可视化方面做出了努力。比如,Stahl在分析与水资源相关的国际关系史时,在世界地图上对从聚类和决策树模型中得出的结果进行了可视化。在此,数据可视化并不只是一种为研究者提供方便的工具。一方面,随着大数据技术的引入,国际政治研究的专业性相应增加;研究者们同时也应更积极地以生动、易理解的方式展示和宣传研究成果,从而使更多人对国际政治产生兴趣,甚至踏入这一学术领域。在这方面,利用数据可视化技术制作内容丰富、可看性强的图表,无疑是非常有益的。
【注:限于公众号的篇幅限制,省略了参考文献和注释,但不影响读者理解原文】
原载于:《华中师范大学学报(人文社会科学版)》2016年第4期,第1-10页
本文作者:吴江,清华大学政治学系博士后;张小劲,清华大学政治学系教授
本期编辑:靳佑鼎