查看原文
其他

文章荐读 | 基于全要素网络构建的大规模政策知识关联聚合研究

张维冲, 王芳等 情报学报ISSN10000135
2024-09-23

文 章 荐 读 



基于全要素网络构建的大规模政策知识关联聚合研究


张维冲1,2, 王芳2,3, 赵洪4

1.华北电力大学法政系,保定 071003

2.南开大学网络社会治理研究中心,天津 300071

3.南开大学商学院信息资源管理系,天津 300071

4.同方知网(北京)技术有限公司,北京 100191


摘要

       现有政策智能处理技术缺乏对政策文本语料的深层关联与有效聚合,这一技术瓶颈导致政策文本资源知识复用困难,碎片化文本难以转化为系统性知识。本文以政策网络、全要素网络、知识聚合为理论基础,以知识图谱为技术框架,提出基于全要素网络构建的政策文本关联聚合技术方案。研究过程以16万余篇政策为数据样本,实现了政策文本的语义表示与识别、知识关联与聚合、政策网络构建、政策知识聚合,从政策主体、客体、目标、依据、主题等多维度揭示了政策间的高度关联性,并运用SARS和COVID-19案例进行了规模化应用检验,为推动政策科学更加有效地解决社会复杂问题提供借鉴。最后面向实际应用场景,设计了具备信息整合和网络多维分析功能的政策智能分析平台原型,为提升实践应用水平提供参考。


关键词

政策网络; 全要素网络; 知识图谱; 政策关联; 知识聚合


引用格式:

张维冲, 王芳, 赵洪. 基于全要素网络构建的大规模政策知识关联聚合研究[J]. 情报学报, 2023, 42(3): 289-303.


👈长按识别文章二维码查看全文


0

引言

         “公共政策是对全社会的价值做权威分配”[1]。从利益视角来看,公共政策是政策主体协调利益冲突,平衡利益选择,实现利益整合、利益分配和利益增进的过程[2]。政策的制定和扩散是政府进行社会治理和公共服务的主要手段。地方政府受到追求治理效果和创新绩效目标的驱动,在政策扩散过程中会通过“创新擂台赛”的形式进行政策创新[3]。政策创新需要与上位政策的基本要求相一致,但是由于政策创新者知识视域和分析能力的限制,有时会出现新政策与既有相关政策规定之间的不一致甚至矛盾冲突。比如,2013年,某古城门票政策修改时没有兼顾各利益相关方的诉求,引起广泛讨论,后又接连仓促修改,引发了负面网络舆情事件[4]。这种不一致会为政策的有效执行带来干扰,影响政策效果,甚至带来其他负面影响。

        政策文本作为政务数据的一种,是政府调控和管理行为的真实“印迹”和有效依据。近年来,我国政府数据的跨部门共享取得突破性进展,数据的关联比对在社会治理、市场监管、精准扶贫、行政许可审批等方面发挥了显著作用。但是,由于没有建立完善的政策信息汇聚平台与关联分析预警功能,不同政府部门之间协调合作不足,政策文本出现零散、相互分割的碎片化状态[5],成为当前数字政府“一网通办”“跨省通办”面对的深层次难题。

        碎片化政务数据难以转化为可供决策使用的系统性知识[6]。对政策内容要素及其潜在关联进行智能识别,在构建要素网络的基础上消解政策系统中的碎片化风险已成为当务之急。“全要素网络”概念最早由经济学学者喻登科等[7]于2016年提出,认为可以将产业集群中的资金、知识、人才、物资等生产要素转换为包括描述性知识和操作性知识的“知识标签”,通过知识网络系统的构建,实现资源的快速流动、优化配置、共享利用和协同增值。政策内容当中包含生产要素及多种政策工具要素,这些知识要素的有效复用是提升政府治理能力的重要途径[8]。为实现大规模政策文本中知识要素的协同复用,提升政策制定的科学性与整体性,持续推进政府治理能力现代化,可以借鉴“全要素网络”思路将大规模政策文本中的知识要素进行关联聚合。为实现这一目标,本文尝试基于大规模政策文本深层语义分析构建政策全要素网络,实现政策主体、客体、目标、依据、工具、主题等要素在时空维度上的聚合,有效揭示各政策间存在的主客体差异、主题衍生与扩散、目标延续与偏离、依据继承与遗漏、工具衔接与创新等深层次关联关系,为政策制定、实施和利用提供高效的政策查询与知识复用支持。


1

理论基础与研究回顾

1.1 政策网络理论及相关研究

        “政策网络”(policy networks)理论的核心是政府与其他社会行动者之间的相互关系[9]。政策网络分析既可以看作一种政策研究范式,用于分析政策网络系统内部的政府结构、社会结构及其相互关系[10],也可以视为某种政策分析视角或隐喻,为立体、准确地理解复杂政策问题提供一种分析框架[11]。随着社会关系网络分析技术的快速发展,政策网络分析更多地转向了社会网络分析方法的创新运用。政策文本之间的关联可以体现政策意图的继承、发展和进步的脉络[12]。Huang等运用结构洞理论对中国原子能政策的多维核心政策工具进行了分析[13],识别了政策的核心目标与核心工具[14]以及政策过程的模式与特征[15]。Yang等[16]构建了政策制定者网络并在此基础上分析了政策目标共现网络中心度的演化情况。已有政策网络相关的研究大多将政策网络刻画成系统中行动者之间的关系[17],基于小规模数据在制度层面进行定性分析[18]。也有学者提出,如果将网络的结点由行动者放宽为包括行动者以及政策系统中的任何影响因素,则政策网络的内涵就大大扩展了[19]。相应地,可以分析的内容也将增加很多。本文在政策网络的构建过程中,尝试在行动者(政策主体、政策客体)的基础上,拓展增加政策目标、政策依据、政策工具、政策主题等其他政策要素,构建“全要素网络”,以观察完整的政策体系。

        对政策之间的显性与隐性关联进行表示,可以发现难以觉察的政策演变轨迹,揭示政策之间的价值传导机制。1969年,美国学者Walker[20]对美国各州创新政策的实施、发展及演进过程进行研究,为公共政策时空关联构建和演化研究奠定了基础。之后关于政策关联、协同、演变等内容的研究相继展开,大致可以划分为六种类型:一是政策主体关联研究,用于刻画政府间联合行文、合作、协同等关系[21]。二是政策主题关联研究,用于分析政策主题的历史变迁[22]、政策扩散[23]、政策协同[24]、政策流变[14]、区域政策应用强度[25]等。三是政策工具关联研究,用于揭示政策工具的选择与组合及结构特征[13]。四是政策目标关联研究,用于解析并重构政策目标体系[26]。五是政策依据关联研究,用于挖掘政策引证关系,为探究政策演化变迁、扩散规律、影响力、府际关系等提供路径。政策文献之间的参照关联既可能体现在政策的标题中,也可能存在于正文中;既包括以政策内容形式呈现的显性关联,也包括以政策意图相似呈现的隐性关联[27]。六是政策语义关联,通过并列、转折、共现、矛盾等特殊关系构建不同语义结构间的关系网络,从而挖掘出具有关联性的语义结构[28]

        在公共政策文本关联的技术性研究上,现有成果主要运用处理小规模数据的信息计量方法[29],以及基于词语、句子的浅层统计分析方法[30]等。刘刚等[31]提出了政策基因概念,基于政策篇章相似度计算方法挖掘政策之间的隐性血缘关系,构建政策谱系树并计算政策要点,构建政策复杂网络体系与检测政策碎片化。然而,政策文本相似度计算算法目前仍然需要牺牲效率换取精确度,处理大规模文本的适用性较弱。王芳团队结合深度学习和认知计算等构建了基于大规模政府公文智能处理的算法,包括政府公文的篇章语义结构解析、主题自动标引、自动摘要、重点内容提取与排序计算等,实验结果表明该算法性能较好[32-33],但尚未对公文间的关联与聚合进行分析。


1.2 知识聚合理论及相关研究

        政策知识的关联聚合涉及多维关系和多粒度信息对象的组织、关联、排序与呈现。知识聚合指运用数理统计与知识组织等相关方法以及人工智能相关技术,以语义关联分析为着眼点,对知识单元进行关联与汇聚,以形成系统的知识体系并催生新的知识单元,以满足用户知识需求的过程[34]。2012年,贺德方等[35]提出了从概念及概念关系、引证关系和科研本体等角度对馆藏资源进行深度语义聚合的研究思路。其他学者也从不同视角对知识聚合进行了概念界定[36-38],但基本认识较为一致,即认为知识聚合是运用知识处理技术方法对知识单元进行语义关联与汇聚,形成新的知识单元或知识体系的过程。聚合的粒度越小,知识单元的数量越丰富,语义关系越明确,越能为知识的多面描述提供可能[39]。目前,关于文献资源语义关联与知识聚合的研究主要集中于馆藏资源[40]、金融[41]、网络社区[42]、医药和生命科学[43]等领域,为关联文本间关系的有效揭示提供了启示。

        利用知识聚合相关方法,在政策文本与文本之间建立起交叉、立体关联,形成多层次、立体化的知识网络,便于观察到在小数据环境中难以观察到的关系与问题,能够克服政策分析目前存在的资料离散和时空分离两大难题[44],为政策分析提供新的视野。同时,通过聚合分析,能够直观发现在词频统计之外的知识内部更深层的关系,如整体网络特征、核心政策功能、府际关系演化模式,揭示隐藏在海量政策中的知识、模式、关系、趋势与规律,从而提升政策知识发现的能力。目前,面向政策文献分析的需求,以语义关联与知识聚合为基础的公共政策智能处理与分析技术仍需要开展更深入的研究:一是针对海量政策文本,文本解析与重组技术尚不足以支撑高效的政策处理工程实践,特别是关于政策文件、法律法规等知识类资源的细粒度开发和利用,需要不断深入创新;二是知识挖掘深度不够,现有政策文本的关联挖掘研究主要以元数据为核心处理对象,且主要针对单一或部分政策要素,加上公开的政策背景知识源存在较大缺位,面向深层次政策全要素与隐式多维知识关联关系的分析有待智能化技术的支持。为了弥补上述不足,本文拟以政策网络和知识聚合为理论基础,以知识图谱为技术框架,提出基于全要素网络构建的政策文本关联聚合技术方案,对大规模政策文本语料进行深层语义分析,对全部政策要素在时空上进行关联聚合,构建政策时空关联图谱,进而揭示政策间深层次关联关系。


2

研究流程

        以知识网络、全要素网络、知识聚合理论为基础,以知识图谱为技术框架,本文提出政策文本关联聚合流程,如图1所示。整体上,通过政策知识表示与识别将政策文本中散落分布的政策要素结构化为知识单元,进而关联形成政策网络,实现政策间的要素关联与多维聚合分析。具体包括以下四个方面。

图1  基于全要素网络构建的政策知识关联聚合流程


(1)政策知识表示。公共政策是一个多要素构成的有机系统。本文以政策要素为依据进行政策知识表示,既可最大限度保留政策内容与知识基础[45],又便于实现分类识别与抽取。

(2)政策知识识别。可分为实体识别和关系抽取,实体识别关注政策要素以及要素中人物、事件、地名、官职、主题等实体的识别,关系抽取则自动从文本中识别出实体间的语义关系或实体的属性关系。

(3)政策知识关联。将识别出的知识存储于图数据库,以知识图谱的方式展现实体与关系,海量政策知识将在图数据库中完成关联,形成大型政策知识图谱。一方面,如果来自新政策的实体与图数据库中的实体属于同一ID或索引,那么会建立政策关联;另一方面,通过语义关联计算挖掘的领域知识,也会形成丰富的关联关系(如语义相关、分歧、矛盾等关系)。

(4)政策知识聚合。旨在将知识图谱中的政策知识按照一定的规则聚集在一起,形成新的知识类或知识簇,实现多策略、多模式、多方法、多层次地检索和获取知识,从而支持政府或研究人员快速、充分地了解政策支撑要素,作为知识库扩大相关工作人员的“认知视域”,提高决策水平。


3

数据和方法

3.1 数据来源与描述

        本文所用的政策文本数据主要来源于两个部分。第一,自建数据库[32]。数据范围:中央单位公开发布的政府公文,包括全国人民代表大会、中国共产党中央委员会及其所属机构、国务院及所属各部门、军事机构等;地方政府公开发布的政府公文,包括天津和贵州两个省份(东西部各选取了一个代表性省份)。时间范围1995—2018年,总计公文数量15.7万篇,数据库已对中文标题、发布机关、效力级别、时效性、发布日期、全文等元数据项进行了提取和标识。第二,新冠疫情案例数据,用于方法检验。数据范围:中央单位公开发布的政府公文,湖北与河北两个省份各级政府各部门的公开政策文件(选取了疫情最为严重的省份湖北和中等程度的代表省份河北),采集字段信息包括政策标题、发布时间、发布机构、全文。时间范围为2020年1月1日—2020年4月25日,总计政策数量4789篇。


3.2 政策知识表示方法

3.2.1 政策实体表示

        就要素而言,政策知识表示过程主要侧重于对文本数据库中语言要素的处理,通过对语义、语法、语用要素的规律性研究,解析篇级、章级、词级等不同颗粒度的语言要素,进而将语言要素转化为政策要素。政策知识识别过程聚焦于对政策要素和治理要素的处理,政策要素包括政策主体、政策客体、政策依据、政策目标、政策内容、政策形式、政策工具等,治理要素则包括政府治理体系中常见的生产要素、主体要素、客体要素、资源要素、环境要素、价值要素、制度要素、知识要素、创新要素、战略要素等细分要素。治理要素是在政策要素的基础上进行的更细粒度的拆分。比如,将政策主体“保定市行政审批局”拆分为“保定市”和“行政审批局”,分离出行政单位和发布机构两个治理要素。又如,从政策目标“为了深入贯彻党中央、省政府决策部署”分离出“党中央决策部署”和“省政府决策部署”两个价值要素,相应地,文本粒度也从短句缩减为实体级/概念级短语。

        为了对政策文本进行篇章级、句子组块级和术语实体级等多粒度信息的分解重构,需要将政策要素进行分类描述,储存为不同层次、不同描述属性的知识单元。本文按照“词级—章级—篇级”三种粒度构建公共政策的知识表示方法体系,在不同分类基础上,研究公文资源的语义表达方式,基于语义分类单元揭示资源之间的语义关联。

        词级:以词为单位的知识表示粒度,如主题词、概念词、实体词等各类语素。在政策文本中,政策主体、政策客体(包括社会问题和目标群体)、政策主题可表示为“词级”知识单元。

        章级:以章节为单位的知识表示粒度,包括段落、句群、句子,主要用于存储政策中的语块信息,涉及政策依据、政策工具、政策目标和关于不同主题的政策内容,这些部分在公文中多以章节片段出现。

        篇级:以语篇为单位的知识表示粒度。对政策文本的外部特征进行标记,注明其基本特征,包括一些政策计量要素,如发布机构、发布时间、分类、主题等,表示为“篇级”知识单元。

        三种粒度级别的知识表示以政策id号为索引。对于每篇政策,存在如下关系:词级知识belong to章级知识,词级知识belong to 篇级知识,章级知识belong to篇级知识。每一层的知识单元都可以通过篇级知识进行索引,并可以通过词级知识进行检索,实现知识库的多粒度“精细化”控制。


3.2.2 语义关系表示

        通过梳理,将政策文本语义关系总结为以四种类型。

(1)通用关系。例如,同义、反义、上位、下位、整体与部分、继承、相关、因果等关系。

(2)要素关系。构建政策要素间的关联关系,如图2所示。其中,要素包括政府机构、政策、政策目标、政策依据、政策主体、目标群体、政策主题。要素间的直接关系:政府机构-[Issue]->政策,政策-[In_Order_To]->政策目标,政策-[According_To]->政策依据,政策-[Involve]->政策主体,政策-[TargetGroup]->目标群体,政策-[Topic]->政策主题。要素间的间接关系:政府机构-[Pay_Attention_To]->政策主题。


图2  政策要素及要素间的关系模式


(3)属性关系。政策的属性有标题、编号、主题分类、发布日期、时效性、标签、其他,政策主体的属性有地区、级别等,政策客体的属性有地区、主题分类等,政策目标的属性有关键词、数字等,政策依据、政策工具的属性有关键词、数字等。

(4)指令性关系。根据语言学相关研究[46],公文中指令言语行为分为六个类型:命令、禁止、建议、请求、允准、希望。行政公文中的动词性非主谓句能表达上述六种指令言语行为。一般是表示指令意义的动词,或者情态动词(如要、应、应当、不得、不准)+动词,或者副词(如必须、一定)+动词,或者形容词(如坚决、积极、努力)+动词等充当谓语。例如,“严格执行和逐步提高船舶排放标准,……,禁止……进入三峡库区”。


3.3 政策知识识别过程

        政策文件通常包括以下几个部分:公文标题、公文编号、公文主送机关、正文内容(包括公文说明和公文内容,有的含有附件)、发布单位和发布日期,不同部分阐述了不同的政策要素。比如,公文标题——政策主题和政策形式;公文主送机关——政策主体;公文说明——政策依据中的政策参照;公文内容——政策依据中的指导思想、政策客体中的目标群体、不同的政策主题、政策目标、政策工具;公文发布单位——政策主体。此外,公文发布日期、公文发布单位、公文编号等为元数据,通常在数据收集过程中获得。

        首先,根据公文结构对政策要素实体进行识别与抽取,计算方法如图3所示,具体包括以下几项。

图3  政策要素语义计算方法


(1)政策主体,记为PolicySubject,既包括政策发布单位,还包括政策全文中涉及的政府机构。政策主体的词性相对单一,多属于政府类别的命名实体,采用命名实体识别算法和规则匹配进行抽取。

(2)政策客体,专指政策目标群体,标记为TargetGroup,也均属于命名实体,但类别比政策主体更为复杂,包括人名、机构团体名、职业名等多种类别,抽取方法同政策主体,准确率可达90%以上。

(3)政策依据,记为PolicyBasis,基于特定的标识词,例如,据、根(依)据、按(遵、依)照、查、奉等,识别相关句群,然后进行政策依据条文的细粒度区分。从识别结果看,政策依据一般有两种类型,一种是文件型的政策依据,即政策文件,通常用书名号表示,可据此进行抽取;另一种是蕴涵型政策依据,比如,“按照国务院和省、市统一安排部署”“按照‘楼不落户、户不落人’的要求”,需进行语义匹配。

(4)政策目标,记为PolicyGoal,其语义特征:①在位置上往往紧邻政策客体,是对社会问题和目标群体的优化和改善;②不少公文具有显式特征,多以“为了+动词+名词短语”的形式出现[16],如“为了促进科技成果转化”,其中“促进科技成果转化”是政策目标,“科技成果转化”是社会问题。本文以“为了”“为”等为标识词,利用“标识词+句法特征”匹配策略,对政策目标句进行识别,准确率可达95%以上。

(5)政策客体中的社会问题,即政策主题,记为PolicyTopic,主要以主题词形式概括出来。政策主题的识别需要以各领域的规范化术语为基础,通常涵盖科技、教育、环境等不同领域。主要操作步骤包括:①基于多源信息获取政策“主题词表”[47],并补充到本地词典中,对公文语料进行分词;②采用TextRank算法提取公文全文的关键词;③对关键词进行词性标注,并依据词性规则筛选主题词。

(6)政策工具,记为PolicyTool,在部分公文中具有明显的词汇特征,可借鉴已有研究,采用词库与规则匹配的方法进行提取[13],或采用“人工标引—模型训练—结果解读”的深度学习自动提取方法[48];另一部分公文并未直接指明,需要结合内容分析法进行半自动化识别。由于从大规模政策文本中识别政策工具需要大量特定政策领域的专业知识和较高的数据标注成本,且相关研究方法较成熟,本文仅将政策工具纳入政策网络建构的框架设计,未对全数据进行处理。

        其次,识别抽取语义关系。政策的语义关系抽取可以分为两种方法:一种是基于特定关系模式抽取实例信息,用于元数据层面的关系抽取;另一种是实体和关系联合抽取算法,用于深度语义层面的关系抽取。本文使用第一种方法进行关系识别,即采用基于“概念+实例”的预定义关系抽取方法,先对概念以及概念之间的关系模式(schema)进行预定义(见图2),然后从语料中抽取概念对应的实例。由于概念同实例具有映射关系,概念间的关系也就等同于实例间的关系。预定义关系后,只需要将每份政策文本当作一个实例,抽取其中的政策目标、依据、主体、客体、主题以及相应的属性信息,即可对每份政策文本实现关系抽取。


3.4 政策知识关联过程

        将处理形成的关联数据导入图数据库Neo4j,创建政策领域知识图谱,命名为PolicyNetwork。该图谱共包含91.3万个节点和379.2万对关系,相关统计数据如表1所示。

        图4是在Neo4j系统中进行数据检索与结果呈现的界面示例。系统所使用的拓展应用GraphXR能够支持超大网络的3D界面化分析,可流畅地在普通个人电脑上显示数万节点和关系,且支持地理空间映射和时间序列的动态可视化,便于展现时空数据。因为本文所用时间和空间数据记录在Policy节点的属性中,所以通过拉动左下角时间条即可平滑地观察时空环境下政策要素的关联与变化。节点的分类、关联关系、标签、属性等信息可以通过右侧功能区查看。

图4  政策全要素网络数据提取与呈现示例


3.5 政策知识聚合方法

        针对知识图谱的数据特点与政策分析需求,适合采用的政策知识聚合规则有三种类型。一是共现关系规则,如图5a所示,如果M节点和N节点在与C、D等节点的关联中经常共同出现,即为“共现关系”。二是耦合关系规则,如图5b所示,当节点M和节点N同时关联另外一个或多个同类节点时,则称M和N具有耦合关系;关联同类节点越多,则耦合关系越强。三是复杂网络关系规则,即基于路径搜索、中心性、社群发现等图论算法进行的网络关系。

图5  公共政策知识聚合规则

        通过基于政策知识单元间共现关系、耦合关系以及复杂网络关系的知识聚合,能够清晰展现特定政策目标、政策主体、政策客体、政策依据、政策主题下的政策族谱,实现从知识单元到知识群的集聚。

        (1)基于共现关系的聚合。在知识图谱中的聚合规则以及能够揭示的内容如表2所示。

        其中,规则1可聚合某政策的所有发布部门,规则2可聚合某政府部门发布的全部政策。规则3可聚合特定政策中的政策目标,进而统计哪些政策目标常常共同出现于同一政策中,如果经常共现,则两个政策目标间存在强关联关系,可据此在后续政策制定过程中起到政策知识推荐作用。规则4可将特定目标下不同部门的政策聚合在一起,可有效地检视不同部门政策不一致的情况,从而有效防止政策冲突及其带来的不良影响。规则5可聚合某政策中不同的政策依据,进而查看哪些政策依据常常共同出现。规则6可聚合引用同一政策依据的所有政策,因为政策依据多为其他政策,所以形成的聚合结果实际为政策之间的引证关系网,如果在时间和空间维度下观察,会形成政策流变链条,便于观察政策间存在的衍生、延续、补充及冲突等深层次关联关系。同理,规则7可聚合某政策中涉及的不同政策主体,规则8可聚合涉及某政策主体的所有政策。规则9可聚合某政策中涉及的不同政策客体,规则10可以聚合涉及某政策客体的所有政策。规则11可聚合某政策提及的所有政策主题,形成政策主题网络;规则12可聚合涉及某政策主题的所有政策,为政策条文的查询提供高效、深层的检索结果。

        (2)基于耦合关系的聚合,在知识图谱中的聚合规则以及能够揭示的内容如表3所示。其中,规则1可聚合某政府部门的所有政策目标、涉及某政策目标的所有政府部门,从而为决策部门寻找特定政策目标下的责任单位提供参考依据。规则2可聚合:①某政府部门发布的政策文件中的所有政策依据,再经过数量统计即可获得该部门常用政策依据,可作为经验知识为同类政策制定提供参考;②参照某政策依据的所有政府部门,进而发现政府部门之间的协同关系。规则3可聚合某政府部门下辖的所有政策主体、某政策主体的所有上位政府部门,进而形成由政府部门构成的政府关系网络。规则4可聚合:①某政府部门关注的所有政策目标群体,为厘清政府机构的职、权、责提供参考;②某政策目标群体的所有主管部门,通过进一步检查主管部门的政策之间的关系,可检验是否存在政出多门、政策不一致等碎片化问题。规则5可聚合某政府部门涉及的所有政策主题、关注某主题的所有政府部门,为政府解决相同主题的问题提供线索借鉴。规则6可聚合为实现某政策目标可能参照的政策依据、某政策依据可能涉及的所有政策目标。规则7可聚合:①为实现某政策目标可能涉及的政策主体,进而为政策制定提供协调、预判与预警;②某政策主体可能影响到哪些政策目标,进而明确政策主体的角色定位。规则8可聚合:①为实现某政策目标可能涉及的政策目标群体,进而为政府部门梳理工作重点提供参考;②某政策目标群体可能受哪些政策目标的影响,进而通过对不同政策目标的影响分析提前做出针对性预判。规则9可聚合某政策目标涉及哪些政策主题、某政策主题可能有哪些政策目标,根据同一政策主题下的政策目标是否矛盾可判断是否存在政策碎片化问题。规则10可聚合某政策依据涉及哪些政策主体、某政策主体可能需要遵从哪些政策依据,从而为特定政策主体查找相关规制提供参考。规则11可聚合某政策依据涉及哪些政策目标群体、某政策目标群体可能需要遵从哪些政策依据,从而能够为特定政策客体提供政策知识服务。规则12可聚合某政策依据涉及哪些政策主题、某政策主题可能需要参照的政策依据。规则13可聚合某政策主体同哪些政策目标群体可能有关联,某政策目标群体同哪些政策主体可能有关联,从而构建行动者网络,为政策运行提供参考。规则14和规则15可聚合涉及政策主题所有的政策主体、政策客体,为学习地区政策知识,了解地区的治理专长、治理空白,提供路径遵循。

        以上基于共现和耦合的知识聚合规则,能有效揭示政策间的深层关联关系,为政府部门进行政策知识的管理与应用提供方法参考,支撑决策过程。

        (3)基于复杂网络关系的聚合。通过逻辑语言查询与面向约束的推理,实现对众多客观实体的管理以及实体间复杂关系的查询与推理,有利于对政策主体、客体、目标、依据、主题等不同维度下的政策谱系进行理论建模与深度分析,进而向政府提供精准知识服务。

        关于复杂关系的实验结果表明,基于知识图谱创建的政策全要素网络具有以下优势:①能够通过节点、关系、属性值的设定实现很好的聚类性能和分类精度,尤其便于对政策文本中的语义关系、概念关系、等级关系(政府等级与条块关系)、映射关系、论述关系等进行精准操作;②图数据库基于图论基础,支持路径搜索、中心性、社群发现等图论算法,对社会网络分析的相关研究视角和方法依然适用,特别适合多跳查询、计算最短路径、推理分析等特殊网络分析需求。


4

实证检验

4.1 案例选择

        选择“传染性非典型肺炎(SARS)”和“新型冠状病毒肺炎(COVID-19)”两次重大公共卫生事件下的政策样本进行实证分析。面对两次疫情,我国政府采取了一系列紧急应对措施,这些应对措施体现为大量的中央和地方政府政策。对两次疫情下的政策进行跨时空分析,从中汲取有价值的经验,同时发现政策过程中的不足,可以为建立和完善应急管理机制提供参考。为此,基于所构建的政策全要素网络,对如下问题进行分析:①疫情应对需要组织哪些政策主体的力量?②需要关注哪些政策客体?③政策关注的主题有哪些?④需要避免哪些碎片化问题以达到整体性治理?


4.2 实验分析

        在图数据库PolicyNetwork中,以检索词“非典型肺炎+SARS”进行检索,共得到335个Policy节点。再分别通过不同关联规则获取聚合结果,生成的部分图谱如图6所示。


图6  SARS政策图谱

    图6a为“政府—政策”关联图谱,即关联关系为(Government)-[Issue]->(Policy)。由政府部门和政策形成的整体网络较为分散,以各个部门为中心形成政策聚类,部分聚类之间存在密切关联,体现了政府部门之间的合作关系。图6b为“政策—政策主体”关联图谱,即关联关系为(Policy)-[Involve]->(PolicySubject)。政策主体既包含政策制定部门,又包含政策执行部门。由政策主体形成的政策图谱,节点全部聚合为一个网络整体,中心区域关联度高,体现了相关政策主体在其中承担的核心角色。比如,中心区域较高的两个点分别为卫生部和国务院,其后是卫生部办公厅、财政部等。图6c为“政策—政策目标群体”关联图谱,即关联关系为(Policy)-[TargetGroup]->(TargetGroup)。由政策目标群体形成的政策图谱既形成了较为集中的聚合网络,又在整体周围存在零星散点。从微观看,每个政策节点周围关联多个政策目标群体节点,形成伞状群落,中心区域群落之间的关联最为密切,其中的中介节点即政策实施的重要目标对象。图6d为“政策—政策主题”关联图谱,即关联关系为(Policy)-[Topic]->(PolicyTopic)。网络整体在空间中呈伞状分布,中心为核心主题(非典型肺炎、SARS、传染病、流行病学等),中间为政策节点,外层为政策的相关主题。

        采用同样方法检索COVID-19政策,共得到5789个Policy节点,生成的政策图谱如图7所示。

图7  COVID-19政策图谱

        其中,图7a为“政府—政策”关联图谱。因为涉及许多行政区域,网络分布更加分散,以核心政府部门为中心,形成了多个政策聚类,且聚类之间具有千丝万缕的关联,充分显示了地方政府合作关系的复杂性。图7b为“政策—政策主体”关联图谱。基于共同的政策主体,政策节点形成了较为集中的聚合网络,但是中心区域并非一处,而是近似两处,分别为湖北省和河北省行政区域内的政策主体及政策。政策主体中除中央、部委级别外,地方政府和基层部门在疫情防控工作中也承担了繁重任务,多部门发布的政策都涉及了村委会、街道办事处等基层单位。图7c为“政策—政策目标群体”关联图谱。同样也形成了较为集中的聚合网络,中心区域分布着核心政策目标群体,是许多政策的目标对象,由此产生的关联关系使中心区域的网络密度很高。而其他一些零散的政策目标群体在聚合网络的外围呈伞状分布,为地域性目标群体,与其他地区的政策几乎没有关联。图7d为“政策—政策主题”关联图谱。由政策主题生成的网络聚合程度较高,多数政策节点围绕几大核心主题聚集,外围通过政策节点关联许多相关主题。


4.3 结果与讨论

(1)SARS和COVID-19应对政策的相似性

        通过对SARS和COVID-19政策图谱中的要素进行统计分析与对比发现,在两次公共卫生事件背景下,一些政策要素具有高度相似性。比如,两次疫情中的政策具有很多共同的政策主题,包括公共卫生、传染病、身体健康、生命安全、野生动物、交叉感染、交通运输/工具、市场监管、生活必需品、突发事件、防护用品、绿色通道、违法行为、流行病学、哄抬物价、市场秩序、食品安全、社区卫生、医疗保险等。二者共同的政策目标群体则包括疑似病例、发热门诊、务工人员、农民工、培训机构、零售药店、疾控中心、乡镇卫生院、社会组织、医院、诊所、餐饮服务单位、商场超市、重点企业等。这些政策目标对象和政策主题值得在未来同类事件中再次给予关注。

(2)COVID-19应对政策的创新性

        与SARS政策相比,COVID-19政策对突发公共卫生事件的应对更加创新、全面和精细,充分体现了国家治理能力和治理水平的大幅提升。

        在治理手段上,COVID-19的应对更加依赖技术与创新。比如,用手机二维码省去了打印纸质健康证明,用手机客户端采集市民每日体温变化数据,用最新开发的红外设备监测行人异常体温;通过建立全国统一、高效、兼容、便捷、安全的医疗保障信息系统,实现医疗保障信息互联互通;对社区创新性地实行网格化管理等。这些在SARS疫情期间是未有过的。

        在治理范围上,COVID-19政策更加全面。从政策目标对象的范围来看,新增了棋牌室、校外培训机构、旅行社等聚集性场所,以及监管场所、养老机构、福利院、精神卫生医疗机构等特殊场所,强调对各种具体场景的管控,以降低疫情扩散风险;鼓励电商平台、在线教育、远程医疗、线上政务的发展,尽可能避免线下接触;新增档案收集工作,多个区县疫情伊始即发布政策文件,要求及时收集疫情档案信息。

        在治理精度上,COVID-19政策更加精细。新冠疫情期间采取网格化、地毯式等管理方式,织密疫情防控组织体系。通过启动定期调度、24小时应急值班、请示报告等快速响应机制,畅通网格、村(社区)、街乡、区县、市、省指挥部等多级信息网络,全方位加强了信息报送和对疫情的监测防控,在治理深度上更加下沉。比如,关注“卫生死角”,更加注重对公共物品及公共接触物品的定期清洗和消毒工作,做好包括过道、厕所、中央空调、电梯等在内的所有区域的消毒,彻底消除卫生死角,创造干净整洁有序的公共卫生环境。

(3)政策碎片化的表现

        对两次疫情期间的政策网络分析,也发现了政策中存在的一些碎片化问题,具体如下。

        表现一,政策主体、客体、主题表述缺乏统一规范,导致命名多样化。在新冠肺炎疫情期间,各地成立的疫情防控指挥主体,其名称的数量达44种之多。其中,“领导小组”共有27种命名方式,“指挥部”共有17种命名方式。此外,还存在对政策客体的界定不清问题。比如,有政策提出“教育培训机构一律停课”,那么如在线教育培训机构等一些并不会产生聚集性活动的培训机构是否也要停课?如果不对政策客体做详细划分而采取“一刀切”的做法,不但违背“精准防控”的原则,还会给人民群众生产生活造成不良影响。

        表现二,政策目标表述的偏差与冲突。比如,以下两份文件中的政策目标:

        E市L区(2020-01-25),“为切实落实以社区防控为主的综合防控措施”

        E市E区(2020-01-26),“为落实以社区防控为主的综合防控措施”

        其中,“落实”和“切实落实”具有程度副词上的偏差,预示着在政策过程中带来的实际效果可能是不一致的。同样的情况还有“为贯彻落实XX要求”“为认真贯彻XX部署”“为深入贯彻XX决策和部署”“为坚决贯彻XX部署”等,表现出的政策执行力度各不相同。政策文件的措辞,一字千钧,如类似的程度副词、数量词、情态动词等差异,一方面能体现政策制定者的态度倾向,另一方面也容易在现实中带来政策的执行偏差。

        表现三,政策依据缺失。涉及人民正当合法权益的政策政令,应该有充分的法律依据,不宜以疫情为由,随意发号施令。通过对政策图谱的研究发现,在疫情严重时期,部分地方政府发布的政策存在政策依据缺失现象。以ZJ市发布的1号令为例,正文中即缺少对上位政策法规的引用作为依据,且只公布了命令措施,未明确如果拒不配合防控工作将如何处理,给基层执法人员柔性执法创造了空间,易造成执法不公,执法不一,从而可能引发社会矛盾。相比之下,YD市发布的1号通告,则明确标明《中华人民共和国突发事件应对法》和《中华人民共和国传染病防治法》两项政策依据,为政策执行提供了法律依据和行政规范。

        以上,通过选取两个重大突发公共卫生事件的典型案例SARS和COVID-19,对超大政策网络进行了规模化应用验证。通过跨时空数据的关联分析,一方面发现两次公共卫生事件下一些政策要素具有高度相似性,另一方面也发现了公共政策中存在的碎片化问题。这也表明,本文所采用的方法能够支撑超大政策网络的跨时空分析,实现了公共政策大规模、高效率、细粒度、多维度的关联聚合应用。


5

应用设计

        为进一步面向政策查询需求的实际应用,本文提出构建以政策全要素网络为核心的政策智能分析平台,实现公共政策信息整合、政策网络多维分析等应用功能。

(1)政策信息整合。逻辑基础在于政策要素间的语义关联,分析平台检索界面如图8所示。

图8  公共政策智能分析平台:检索界面设计

        在数据方面,公共政策智能分析平台的搜索功能界面具备两个特点。一是碎片化政策信息的多维度整合。维度主要按照政策要素进行划分,包括政策文件、主体、客体、依据、目标、主题等。如图8左上区域所示,在高级检索模块设有下拉菜单和文本输入框,可进行多维度检索规则的设定。同时提供政策来源限定,包括法律法规、政策文件、行政命令、领导人讲话等。二是基于语义关联的公共政策深度搜索。图8左下区域所示为语义关联推荐模块,用于实现搜索推荐功能。比如,搜索政策客体“未成年人”,则会出现少年、青少年、儿童、童工、子女、新生儿、村民等具有特定关联关系的政策客体,右侧区域显示检索结果。


(2)政策网络多维分析。分析界面如图9所示,选取政策网络类型、政策空间布局、政策要素、政策网络特性等多个维度构建分类体系,以实现多策略、多方法、多层次、多视角地检索和分析政策知识。

图9  公共政策智能分析平台:政策网络分析功能设计

        在图9左侧,政策网络采用搜索框式和索引式两种搜索方式。政策网络分为两类,一是实体层网络,细分为行动者网络、组织网络、企业网络、人际网络、政策网络、基础设施网络等类型;二是意义层网络,细分为创新网络、议题网络、保障网络、应急网络、协作网络、产业网络、贸易网络、沟通网络、情报网络等类型。如图9右侧所示,分析平台提供部分必要的政策网络特性分析方法,以导航式窗口呈现,具体功能包括中心性分析、凝聚子群分析、网络演化分析、网络稳定性分析、网络碎片化分析、网络整体性分析、网络治理机制分析、网络范式分析等。右侧中间位置为政策图谱分析模块,通过调用GraphXR,基于政策要素的关联聚合,实现对政策知识的多维特征分析,比如,对知识规模、知识结构、知识质量(多样性、复杂度、原创性)以及知识的集聚程度、溢出效应、地区差异等内容的探究。右上位置为政策空间模块和分析视角模块。分析视角模块用于对政策网络进行多视角梳理,如顶层设计、城市发展、地方政府和基层治理等视角,直观审视政策体系中的要素结构。

        以知识图谱为核心搜索引擎的政策智能分析平台,较原有基于关键词的政策获取单一模式,可提供多维度知识检索发现模式,使政策要素间的关系一目了然,能够为政府、企业、个人等聚焦国家政策的用户提供精准的政策画像与知识服务,提高政府知识管理水平。


6

研究结论

        本文以政策网络、全要素网络、知识聚合理论为指导,以知识图谱为技术框架,提出了基于全要素网络构建的政策文本关联聚合技术方案。基于实验实现了大规模政策文本的语义表示与识别、知识关联与聚合、政策网络构建,系统梳理了政策知识聚合的逻辑、方法和规则,从政策主体、客体、目标、依据、主题等多维度揭示了政策间的高度关联性,并运用SARS和COVID-19案例进行了规模化应用检验,为推动政策科学更加有效地解决社会复杂问题提供借鉴。最后面向实际应用场景,设计了具备信息整合和网络多维分析功能的政策智能分析平台原型,为提升实践应用水平提供参考。

        作为一个宏大的数据模型,基于知识图谱构建的政策全要素网络,具有高效的检索能力、大规模关联数据处理能力、较好的政策关系分析与推理能力、流畅美观的动态可视化展示等优势,在探究公共政策的知识发现、异常检测、冲突预警、时空关联、要素影响、体系结构、演化变迁等方面具有广阔的应用前景。本文作为一项探索性研究,对于不同类型政策要素的挖掘尚存在改进空间,要素类型有待进一步丰富和完善。未来希望通过对数据规模与算法水平的提升,继续深化对多种政策要素的结构化表征,真正实现“全”要素基础上的政策网络智能分析,从而达到落地应用,在政策法规领域内提供更全面的知识类型、更复杂的知识结构、更有效的知识获取、更强大的知识指导、更精深的知识推理,推动跨层级、跨地域、跨系统、跨部门、跨领域的政策统筹与协同。


参考文献

[1] 戴维·伊斯顿 . 政治体系——政治学状况研究[M]. 马清槐, 译 .北京: 商务印书馆, 1993. 

[2] 冯静, 杨志云 . 利益视角下的公共政策过程分析[J]. 中国行政管理, 2009(1): 26-30. 

[3] 张海柱, 林华旌. 政策扩散中“政策再创新”的生成路径与内在逻辑——基于 16 个案例的定性比较分析[J]. 公共管理学报,2022, 19(1): 27-39, 166. 

[4] 韦潇竹, 赵素桃. 公共政策冲突产生的事实影响及其法律救济——以A县D镇某征地拆迁案件为例[J]. 现代商贸工业, 2016,37(25): 123-125. 

[5] 后向东 . 国家制度体系信息平台建设: 历史审视、国际经验与现实路径[J]. 电子政务, 2021(12): 34-44. 

[6] 北京大学课题组 . 平台驱动的数字政府: 能力、转型与现代化[J]. 电子政务, 2020(7): 2-30. 

[7] 喻登科, 周荣. 战略性新兴产业集群全要素网络模型及要素共享机制研究[J]. 科技进步与对策, 2016, 33(3): 50-56. 

[8] 王芳 . 以知识复用促数字政府效能提升[J]. 人民论坛·学术前沿, 2021(17): 46-53. 

[9] Ramia G, Patulny R, Marston G, et al. The relationship between governance networks and social networks: progress, problems and prospects[J]. Political Studies Review, 2018, 16: 331-341. 

[10] 王春福 . 政策网络与公共政策效力的实现机制[J]. 管理世界,2006(9): 137-138. 

[11] Blanco I, Lowndes V, Pratchett L. Policy networks and gover‐nance networks: towards greater conceptual clarity[J]. Political Studies Review, 2011, 9: 297-308. 

[12] 黄萃, 任弢, 张剑. 政策文献量化研究: 公共政策研究的新方向[J]. 公共管理学报, 2015, 12(2): 129-137, 158. 

[13] Huang C, Yang C, Su J. Identifying core policy instruments based on structural holes: a case study of China’s nuclear energy policy[J]. Journal of Informetrics, 2021, 15(2): 101145. 

[14] Yang C, Huang C. Quantitative mapping of the evolution of AI policy distribution, targets and focuses over three decades in Chi‐na[J]. Technological Forecasting and Social Change, 2022, 174:121188. 

[15] Huang C, Yang C, Su J. Policy change analysis based on “policy target-policy instrument” patterns: a case study of China’s nucle‐ar energy policy[J]. Scientometrics, 2018, 117(2): 1081-1114. 

[16] Yang C, Huang C, Su J. A bibliometrics-based research frame‐work for exploring policy evolution: a case study of China’s in‐formation technology policies[J]. Technological Forecasting and Social Change, 2020, 157: 120116. 

[17] 李江, 刘源浩, 黄萃, 等. 用文献计量研究重塑政策文本数据分析——政策文献计量的起源、迁移与方法创新[J]. 公共管理学报, 2015, 12(2): 138-144, 159. 

[18] 赵德余, 唐博 . 近十五年我国政策网络研究的知识图谱——基于 CiteSpace 的 文 献 综 述 [J]. 复 旦 公 共 行 政 评 论 , 2021(1):248-268. 

[19] 赵德余. 政策科学方法论[M]. 上海: 上海人民出版社, 2017. 

[20] Walker J L. The diffusion of innovations among the American states[J]. American Political Science Review, 1969, 63(3):880-899. 

[21] Boschken H L. Aligning a multi-government network with situa‐tional context[J]. The American Review of Public Administra‐tion, 2017, 47(2): 189-208. 

[22] 王芳, 纪雪梅, 田红 . 中国农村信息化政策计量研究与内容分析[J]. 图书情报知识, 2013(1): 36-46, 77. 

[23] 王芳, 徐路路. 基于智能化公文主题分析的我国政策层级扩散倾向性研究[J]. 情报学报, 2021, 40(4): 387-401. 

[24] 周环, 幸强国, 唐泳 . 基于政策文本计算的数据开放与隐私保护政策协同度研究[J]. 图书馆论坛, 2021, 41(11): 118-127. 

[25] 裴雷, 周兆韬, 孙建军 . 政策计量视角的中国智慧城市建设实践与应用[J]. 图书与情报, 2016(6): 41-46. 

[26] 孟溦, 李杨 . 科技政策群实施效果评估方法研究——以上海市“科技创新中心”政策为例[J]. 科学学与科学技术管理, 2021, 42(6): 45-65. 

[27] 黄萃, 吕立远. 文本分析方法在公共管理与公共政策研究中的应用[J]. 公共管理评论, 2020, 2(4): 156-175. 

[28] 武楷彪, 郎宇翔, 董瑜 . 融合句法结构和词义信息的政策文本关联挖掘方法研究[J]. 数据分析与知识发现, 2022, 6(5): 20-33. 

[29] 汪波, 李坤 . 国家养老政策计量分析: 主题、态势与发展[J]. 中国行政管理, 2018(4): 105-110. 

[30] 叶江峰, 任浩, 甄杰 . 中国国家级产业园区 30年发展政策的主题与演变[J]. 科学学研究, 2015, 33(11): 1634-1640, 1714. 

[31] 刘刚, 傅玮萍, 马莺歌 . 基于语义的政策血缘网络演化机理研究[J]. 中文信息学报, 2018, 32(5): 114-127. 

[32] 赵洪, 王芳, 王晓宇, 等. 基于大规模政府公文智能处理的知识发现及应用研究[J]. 情报学报, 2018, 37(8): 805-812. 

[33] 赵洪 . 认知计算下的政府公文篇章语义理解研究[D]. 天津: 南开大学, 2021. 

[34] 马翠嫦, 曹树金, 郑建瑜 . 多学科领域视角下网络聚合单元概念框架构建研究[J]. 情报科学, 2015, 33(10): 16-22. 

[35] 贺德方, 曾建勋 . 基于语义的馆藏资源深度聚合研究[J]. 中国图书馆学报, 2012, 38(4): 79-87. 

[36] 张建红 . 基于语义关联的海量数字资源知识聚合与服务研究[J]. 图书馆工作与研究, 2016(8): 44-47. 

[37] 赵雪芹. 知识聚合与服务研究现状及未来研究建议[J]. 情报理论与实践, 2015, 38(2): 132-135. 

[38] 李洁, 毕强 . 数字图书馆资源知识聚合可视化模型构建研究[J]. 情报学报, 2016, 35(12): 1273-1284. 

[39] 曹树金, 马翠嫦 . 信息聚合概念的构成与聚合模式研究[J]. 中国图书馆学报, 2016, 42(3): 4-19. 

[40] 邱均平, 王菲菲. 基于共现与耦合的馆藏文献资源深度聚合研究探析[J]. 中国图书馆学报, 2013, 39(3): 25-33. 

[41] 唐旭丽, 马费成, 傅维刚, 等. 知识关联视角下的金融知识表示及风险识别[J]. 情报学报, 2019, 38(3): 286-298. 

[42] 陶兴, 张向先, 张莉曼, 等. 网络学术社区跨平台用户生成内容知识聚合研究[J]. 情报理论与实践, 2020, 43(7): 151-156. 

[43] Mountantonakis M, Tzitzikas Y. Large-scale semantic integration of linked data: a survey[J]. ACM Computing Surveys, 2020, 52(5): Article 103. 

[44] 刘石, 李飞跃 . 大数据技术与传统文献学的现代转型[J]. 中国社会科学, 2021(2): 63-81, 205. 

[45] 王礼鑫 . 公共政策的知识基础与决策权配置[J]. 中国行政管理, 2018(4): 98-104. 

[46] 樊小玲. 指令言语行为的重新分析[M]. 上海: 上海社会科学院出版社, 2013. 

[47] 张维冲, 王芳, 赵洪 . 多源信息融合用于新兴技术发展趋势识别——以区块链为例[J]. 情报学报, 2019, 38(11): 1166-1176. 

[48] 李娜, 姜恩波, 朱一真, 等. 政策工具自动识别方法与实证研究[J]. 图书情报工作, 2021, 65(7): 115-122

制版编辑  |  李    静

审核  |  王海燕


国家自然科学基金管理学部A类期刊

全国中文核心期刊

CSSCI来源期刊

《中国人民大学复印报刊资料》重要转载来源期刊

CSTPCD(中国科技论文与引文数据库)收录期刊

NSSD (国家哲学社会科学学术期刊数据库)

长按扫描二维码 | 关注我们

情报学报官网:qbxb.istic.ac.cn

邮箱:qbxb@istic.ac.cn

电话:010-68598273

欢迎投稿!


【免责声明】本公众号主要发布《情报学报》期刊的录用文章,或转载其他媒体与网站的图文资讯。文章仅代表作者本人观点,本公众号对文中陈述、观点判断保持中立。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。抄袭本文至其他渠道者引发的一切纠纷与本公众号平台无关。

继续滑动看下一个
情报学报ISSN10000135
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存