徐 鲲,张皓月,宋正雯 | 考虑语调的区域创新政策测度指标改进及评价:基于七个主要经济区政策文本挖掘的研究
考虑语调的区域创新政策测度指标改进及评价:基于七个主要经济区政策文本挖掘的研究
一、引言
区域创新政策对于区域技术创新环境的营造、企业技术创新能力的提升至关重要,而政策制定又受不同地域范围及政府治理结构的影响,其多层次与多执行者的特点更加深了自身的复杂性[1],同时也增加了对区域创新政策评价的难度。目前对创新政策的测度研究,在传统维度和视角的基础上,开始逐步探索从政策文本中获取增量信息,关注政策文本量化和文本挖掘的测度方法。政策文本是用来记录政府或地区实施政治活动的文献,反映各地区政府在一定时期内的预期活动与规范举措[2]。与解读少量文本的定性方法不同,政策文本分析的核心思想在于对大量政策文本的关注与分析[3]。目前学界主要聚焦基于内容的政策文本分析,通过统计词频数量及共词分析等方式评价创新政策文本内容[4],但文本内容不能体现政策制定者的情感倾向及政策布局动机,且对区域创新能力的解释力度有限[5]。随着互联网信息化与大数据技术的不断发展,文本信息具有更加丰富的量化与测度方式[6]。文本语调在公司财务领域应用较为广泛,语调是对企业有限财务信息的补充,信息发布者会通过语调传达情感倾向或透露私有信息[7]。而政策文本信息是政策制定者向地区传递创新战略布局与未来发展导向的重要依托,基于语调的研究也为创新政策测度提供了一种新思路。因此,本文提出考虑语调程度的政策文本挖掘方式,以2012—2019年全国七个主要经济区为样本测度区域创新政策语调,对传统的区域创新政策评价方法进行修正。在借鉴国家统计局东部、中部、西部地区划分标准的基础上,考虑到东部地区发展能力的差异,将其进一步细分为京津冀地区、长三角地区、珠三角地区和东北地区。中部地区选取长江中游地区,即中三角,西部地区选取经济发展独具代表性的成渝经济带和陕甘宁地区。通过测算七个主要经济区的政策语调探讨考虑语调的创新政策指标能否增强区域创新政策评价的有效性与科学性。
研究贡献在于,第一,本文研究拓展了政策测度的视角和维度。目前基于内容的创新政策测度方法难于反映政策制定者的主观情感态度,本文提出考虑政策语调的文本挖掘测度方法,计算政策词频得分以衡量政策语调的积极程度,丰富了已有政策测度的方法。第二,本文研究提升了政策效用的解释程度。尽管对政策文本量化指标的构建较为成熟,但研究表明传统的政策评价指标对区域创新能力的解释力度有限,难以解释个别区域政策发布力度高而经济效应低的现象。本文试图将政策语调信息作为传统政策评价的增量信息,进而对政策制定有效性做出更为全面的解释。第三,研究结论对于实践工作具有一定指导意义。研究表明考虑语调的区域创新政策评价具有更强的有效性,因此,地方政府在政策发布过程中可考虑增强对创新活动的积极态度,向外界传达更加乐观的情感倾向,推动区域创新发展。
二、文献综述
(一)区域创新政策溯源与界定
随着经济社会的发展,人们对创新理论的理解和研究不断深化,学者们发现几乎半数以上的经济增长驱动力都来自技术进步与科技创新[8],创新政策越来越受到社会各界的广泛关注。创新政策与创新理论之间存在紧密联系,20世纪末以来,创新理论的研究开始得到OECD等机构的扶持,并成功地将创新理论应用于创新政策的设计中,使二者实现了更快速的发展。对创新政策概念的扩展理解在治理能力、协调能力和政策制定方面正变得越来越复杂[9],学界由此展开了有关区域创新政策概念界定的一系列研究,主要形成了以下三类观点:第一种观点认为区域创新政策是政府经济政策与科技政策调和的产物,能促进地区经济与技术的共同发展[10-11];第二种观点认为区域创新政策是科技政策与产业政策调和的产物,是各地政府用来刺激科技进步和技术变革的手段[12],从根本上是为了鼓励产业技术发展,通过保障创新能力的方式提高地区竞争力[13];第三种观点则认为区域创新政策是政府为驱动科技活动、提高创新能力而调控政策的总和,是地区政府为了鼓励经济活动的涌现以促进经济增长的重要载体[14-15]。近年来,学者们更倾向于将区域创新政策定义为一个综合性概念,即区域创新政策是地区为驱动当地科技创新活动而整合了科技政策、产业政策和经济政策[16],具有全面性、系统性和全局战略性的特点。
(二)区域创新政策测度的研究及演进
区域创新政策的测度即为对政策的度量和评价,现阶段学界对于区域创新政策测度方面的研究大致经历了基于结果的政策测度、基于政策本身的政策测度和基于文本量化的政策测度三个阶段。
1.基于结果的政策测度
在基于结果的政策测度阶段,学者往往直接对政策结果进行研究,主要包括对比分析法和统计分析法。对比分析法是将政策评估看作是价值判断,而判断的关键就在于建立评估标准,如从“前—后”“投射—实施后”等多角度进行政策有无、政策落实前后的对比分析[17]。统计分析法是依据政策结果选取指标,基于多维度的区域创新政策指标进行评价[18]。早期学者们多以创新投入与产出等指标量化政策实施效果,将区域创新绩效指标作为政策本身的替代[19]。但由于这类政策测度方式缺乏控制变量,且创新政策与绩效间的内生性问题难于解决,因此目前应用得越来越少。
2.基于政策本身的政策测度
在基于政策本身的测度阶段,学者将视角逐渐转向政策本身,而非直接关注政策结果。Libecap[20](1978)进行了首次尝试,将产权划分为15个范畴,为法律政策在各个范畴内与先前政策相比的精确程度赋予相应的得分,由此第一次实现了对政策的量化评价。随后有学者采用实证研究法分析中央及地方政策对外商直接投资的影响,但对政策的细分有一定局限性,对政策影响力的评价也不尽准确[21]。统计分析法也适用于对政策本身进行数量统计,以政策出台数量来评价政策效力,但是在数量统计的过程中忽略了政策的具体内容以及各政策之间的差异[22]。基于政策内容设计的政策评价手册应用较为广泛,从政策力度、政策目标与政策措施三个维度细化政策,由专家对政策维度进行充分讨论后独立量化政策标准并进行评价[23]。此外,该阶段多侧重于对单一创新政策的评价,从宏观区域经济发展角度评价区域创新政策的研究较少[24]。
3.基于政策文本量化的政策测度
政策文本计算是一种非介入式的研究方法,能够使得研究者在对政策的量化过程中减少主观偏见,使研究结果更具有客观性与中立性。在基于政策文本量化的区域创新政策测度阶段,学者主要从政策文本总体特征出发,在研究结构属性的同时分析内容结构,主要使用的方法有政策计量分析法、内容分析法和效词分析法。
政策计量分析法并非关注于解释与理解政策文本内容,而是将其视作一种具有文字形式的数据,在宏观层面上理解经济发展规律[25]。国内最早由李江等(2015)将文献计量方法应用于政策文本研究领域,并正式提出了政策文献计量法的概念,将研究视角更多地集中于大样本量的政策文本定量分析[26]。该方法侧重提炼政策外部属性,多聚焦于主题词和“目标—工具”视角计量统计相关政策[27-28]。内容分析法适用于分析政策工具和政策文本,将筛选出的有效政策主题词编码,以定量化识别并抽取相关概念[29]。内容分析法有三种实现手段,一是基于政策工具研究相关政策的文本量化,从已筛选的政策中提取出相关的政策工具并计算频次[30];二是借助文献工具提取政策关键字段,通过共现图谱来分析政策文本异同,在不同的分析框架中研究各角度政策的分布情况[31];三是文本编码,基于特定的维度编码文本内容以统计政策频数,并引入文本计算方法提高研究速度[32]。效词分析法将政策看作文本模型,通过大量的计算机模型捕捉更丰富的文本特征,将文本的定性编码升级为定量的量化[33-34]。引入计算机编码来替代专家编码,能够减少主观判断以增强有效性和可靠性,将政策文本拆分成若干文本单元,编码数据进行计算和分析[35]。文本词频测量可以估计经济影响、度量政策的不确定性并减少经济环境风险[36]。
(三)基于文本量化的政策测度及评价
随着计算机技术的发展,利用计算机代替手工收集信息的方式备受关注。在政策文本量化的方法中,效词分析法集成了机器学习、自然语言处理、文本挖掘等技术[37]。文本挖掘法是计算机技术在提取文本信息中的应用,依托在文本中进行分词处理来得到需要的量化指标,适用于处理含有大量文字的内容。通过挖掘政策的结构特点搭建逻辑框架,从整体上把握政策的内在结构关系[38]。也有学者针对政策对象梳理创新政策的演变历程,明晰区域政策布局与制定过程中的薄弱环节[39]。由此可见,现有研究主要是基于内容的文本挖掘方法进行区域创新政策测度的研究,研究呈现出聚焦于政策文本内容、集中于政策演进及内容的共词分析、高级别政策研究居多等特征。
对文献梳理发现,目前学者多采用文本挖掘法评价创新政策的内部结构特征与对区域经济效益的影响,基于政策内容的文本挖掘方法有利于了解创新政策与政策活动的匹配程度,同时减少专家评分的主观因素,研究成本也较低。然而,这种方式更多关注文本层面的直接信息,未深入探究政策制定者的内心态度与情感倾向,也无法解释在政策力度相同的情况下,区域创新能力的不同表现。因此,本文提出考虑语调程度的文本挖掘方式,对区域创新政策进行测度优化与评价,以挖掘政策文本深层次的情感态度,增强政策评价体系的解释力度。
三、考虑政策文本语调的区域创新政策测度
(一)基于内容的区域创新政策测度方法
1.基于内容的区域创新政策评价指标的构建
传统的区域创新政策测度关注于分析政策的内容效度,学者们多参考彭纪生等(2018)[40]的做法,从政策力度、政策措施与政策目标三个维度对政策文本进行量化分析。在具体的测算过程中,以政策级别或政策制定部门的类型代表政策力度,反映政策制定者对创新主体的影响与约束力;以政策语言体现的政府支持程度代表政策措施,反映政府对创新活动落地实施的助推效果;以目标实现的明确程度代表政策目标,反映政府的合理目标对创新活动做出的规范。依据政策量化标准操作手册对上述三个维度进行打分并评价,随后构建创新政策评价体系衡量政策指标对区域创新能力的驱动作用。区域创新政策量化方法如公式(1),其中,TTEGit表示t年度i区域创新政策量化分值,PGm表示该年度第m项区域创新政策力度得分,即政策权重,AGm表示政策目标得分,MGm表示政策措施得分。
(1)
2.传统政策内容测度方法的弊端
区域创新政策激发了经济活力,扶持产业特色活动,如发展创新创业项目等进一步提高区域创新能力。2012年,党的十八大召开,正式提出实施创新驱动发展战略,将创新作为引领发展的第一动力,形成新的增长动力源泉。故以2012年为起点,采用传统的政策内容指标量化方法解释各区域创新能力的表现。
选择各地区发明专利申请授权量的算数平均值作为区域创新能力的量化指标,七个地区的创新能力如图1所示。由于《中国科技统计年鉴》中专利数据一般滞后1年,而本文重在比较同年度下区域创新能力和政策得分以及二者的变化趋势,因此缩短观察年限,将区域创新能力指标还原至2012—2019年。可以发现,珠三角地区的创新能力居于首位,随后是具有较高创新能力的长三角地区与京津冀地区,而东北地区与陕甘宁地区的创新能力表现较弱。
图1 区域创新能力
在传统的政策内容量化指标选择上,首先,参考已有研究[41],选取各地区政策数量的算数平均值作为政策发布力度的量化指标。加大区域创新政策的推行力度能够推动区域创业发展,促进区域间的良性竞争,推动区域多元化创新。如图2所示,各地区创新政策发布数量差异性较大,陕甘宁地区政策发布数量最多,其次是京津冀地区、长三角地区和东北地区。然而,尽管陕甘宁地区与东北地区的政策发布数量较高,但结合图1不难发现,创新政策的高力度推行并没有带来创新能力的增长,两地区的创新能力均处于末位,可见仅仅加大政策发布力度并不能合理地解释地区的创新发展。此外,目前已有文献基于政策力度、政策目标与政策措施三个维度量化区域创新政策,并研究其对区域创新能力发展的作用效果。然而李胜会和朱绍棠(2021)发现,虽然传统方法测度的创新政策指标与区域创新能力显著正相关,但纳入环境变量后消除了创新政策对创新能力的促进作用[42]。
图2 区域创新政策发布数量
由此可见,传统的政策内容评价指标不足以解释区域创新能力的发展。政策文本能够反映决策者制定政策的意图与心理活动[43],而仅仅通过文本分析未考虑政策制定者的情感倾向及对创新活动的态度,这也体现出了传统政策测度方法的局限性。因此,本文将代表决策者积极程度的政策语调引入政策评价体系之中,改进了传统基于内容的政策测度方法,从而增强区域创新政策对创新能力发展的解释力度。
(二)考虑政策文本语调的修正后政策测度方法
1.创新政策文本语调测度思路
本文提出了考虑语调的区域创新政策评价方法,采用政策制定者的情感态度对传统的评价模型进行补充,故需要对区域创新政策的文本语调进行测度。具体而言,基于政策语调的文本挖掘方法求出七大区域包含的各省、自治区与直辖市的创新政策语调得分,并进一步计算各区域得分的算术平均值。由于不同地区政策特质、政策篇幅及文本格式等因素的差异,需要采取一致的标准对政策文本进行抓取与量化。在政策文本阅读过程中发现总则、指导思想、总体要求、总体安排、总体思路、基本要求等部分通常阐述了政策发布目的,充分体现各项创新政策的核心内容和主旨思想,故本文抽取总则、指导思想等最能够体现政策语调全貌的部分作为样本集,进行词频分析和语调分析,探究不同经济区创新政策语调的表现情况。思路流程图如图3所示。
图3 创新政策语调得分思路流程图
第一步,在收集到的政策文本中,随机抽取省份和直辖市的1000条政策作为训练集。第二步,通过人工阅读训练集政策的方式,判断政策中最能够体现政策语调全貌的核心语调段落。尽可能穷举出能够体现出政策语调全貌部分的表述方式,整理出各类表述方式的起始词和结尾词。第三步,确定核心语调段落表述方式的优先级顺序。通过阅读训练集政策发现,政策中的总则、指导思想等部分最能够体现出一项政策的总体语调,在没有类似部分的政策中,紧跟称呼的第一段也是能够体现政策整体语调的部分,但相比总则、指导思想等部分,其效力较低。第四步,在通过Python程序进行政策筛选时,优先抓取带有总则、指导思想等部分的政策,即优先级;对于没有总则、指导思想等部分的政策,抓取紧跟称呼后的第一段,即次级。经过对核心语调段落表述方式的穷举以及优先级排序,进行样本全集的文本抓取。最后,依据抓取的样本核心部分集对政策词频打分。
2.创新政策文本语调测度具体方法及关键环节
为了识别出政策制定者的情感倾向,如何测定政策文本的感情色彩是量化政策文本语调的关键。本文采用词典法对文本语调进行分析,通过对词语特征的划分来确定词语类型,进而形成专属于区域创新政策的特征词词典。在构建政策文本语调词典时,首先将政策文本中的表述词语分为语调词和语气词。由于政策文本语言的正式性,且创新政策的核心目的是推动区域创新活动发展,所以创新政策文本的语调词均为积极词,而语调词之前的语气词能够体现语调积极程度大小。在确定了特征词分类标准后,由多人独立阅读政策文本找出其中的语调词与语气词。将收集到的特征词语进行汇总与校对,重复的语调词与语气词直接加入相应的种子词集。对于提取重复度低的词语,在经过多人讨论后确定是否将其纳入种子词集之中。同时,由于汉语语义的多样性,进一步对已有的情感词典的范围进行扩充,最终形成政策文本语调词典。
在确定了政策文本语调词典后,采用Python的jieba工具对已抓取的全样本核心集进行分词,依据构建的政策文本语调词典分别爬取全样本核心部分集中的语调词、语气词和核心样本总词频数。为了计算政策语调得分,需要对情感词典的词语赋予不同权重。本文依语气词的感情色彩程度由低到高分别赋予1、2、3的分值,以体现不同政策语调词情感的积极程度。计算出的第k条政策语调得分(Tonek)如公式(2)所示。政策语调得分越高,则情感倾向越积极,进一步体现出了政府推行政策的态度。
(2)
需要说明的是,在计算出创新政策语调得分之后,对零值异常样本结果做了进一步处理。零值样本的出现主要有两类原因:一是原政策文本中确实没有体现语调程度的词语,此种情况的得分结果仍然保留。二是由于不同区域政策格式的差异,对核心语调段落表述方式的穷举未涵盖该类政策文本而造成定位错误,如“项目申报”类政策语调表述靠后,或个别“条例”类政策以目录为开篇而被错误抓取。本文将这类文本定位错误溯源至原始政策文本,重新摘取正确核心语调段落,计算政策语调得分并修正结果。
3.考虑政策文本语调的修正后政策测度指标体系构建
在构建修正后的政策评价模型时,企业管理层语调的研究视角为本文提供了理论基础。针对微观企业层面的研究表明,文本语调具有一定的可信度,能够提供信息增量以反映信息发布者的心理动机及对企业绩效的真实期望[44]。在对上市公司信用风险预警研究中发现,加入多维度文本信息披露指标提高了对信用风险的预测能力[45]。其中,情感基调等文本软信息能够增强对财务风险预测模型的拟合程度[46]。利用语调信息可以深入理解政策制定者对预期政策活动的主观态度,为传统的政策评价体系提供补充。因此,本文在基于政策内容评价体系的基础上引入政策语调,以验证政策语调是否增强了区域创新政策的解释力度。
基于公式(1)修正区域创新政策测度指标体系,将政策内容指标与政策语调指标进行标准化处理后,采用熵值法确定权重。运用改进后的评价体系计算i区域t年度政策综合得分Policyit,如公式(3)所示。TTEGit与Toneit表示创新政策内容及政策语调得分,α1与α2为各指标权重,α1=0.53,α2=0.47。
Policyit=α1*TTEGit+α2*Toneit。
(3)
四、我国七个主要经济区的创新政策评价有效性分析
(一)数据获取与处理
以2012—2019年全国主要经济区为研究样本,对区域创新政策的文本语调进行测度。如前文所述,七大区域为京津冀地区、长三角地区、珠三角地区、东北地区、中三角地区、成渝经济带和陕甘宁地区,区域具体划分标准如表1所示。区域创新政策文本来自北大法宝数据库,以“创新”“技术”“科技”等为关键词检索创新政策,对于不满足起始词和结尾词抓取规则的政策进行人工筛查与摘取,最终得到七大地区有效词频得分的政策文本。
表1 区域划分标准
(二)区域创新政策语调得分
基于文本挖掘的方法计算各区域的政策语调得分,如图4所示。以七大地区政策语调得分均值0.121 3作为辅助线,更为清晰地反映出各地区政策语调积极程度的相对高低及变化趋势。在各区域的比较中,京津冀地区、长三角地区与成渝经济带的语调得分较高,中三角的创新政策语调趋于平均水平,而东北地区、陕甘宁地区与珠三角地区的语调得分都偏低。表明成渝经济带作为西部地区开发的重要环节,政府也日益重视创新活动的开展,而东北地区与陕甘宁地区的语调得分体现出政策制定者的态度并不乐观。
图4 区域创新政策语调得分
各地区的政策语调得分自2016年起都出现显著提升,结合制度背景可以更好地理解这一突变趋势。首先,2015年,国务院发布《关于大力推进大众创业万众创新若干政策措施的意见》,国内掀起“大众创业,万众创新”的热潮,国家通过解放社会创造力来推动经济发展,促进人民群众积极参与到创新创业活动中。其次,党的十八大以来,中央持续推进“西部开发、东北振兴、中部崛起、东部率先发展”的区域发展战略,并在2017年实现多地区产值大幅度提升,进一步掀起科技创新热潮。由此可见,随着经济社会的不断发展与方针制度的层出叠见,地方政府会顺应时代背景而对政策重视程度产生差异,造成政策语调波动。政策语调的积极程度受到制度影响,并顺应产业结构的发展,图4中政策语调变化趋势也体现出了这种特定时代下的政策制度背景。
前文已经提到,语调的研究能够提供信息增量。结合图4可以看出,政策语调可以为区域创新能力的差异化表现提供解释。同时,政策语调也能够说明政策力度解释不足的问题。东北地区与陕甘宁地区创新政策语调得分较低,纵使政策发布力度大,但政策制定者对创新活动的激励程度不足,较难激发该地区的创新活力。值得注意的问题是,珠三角地区创新能力一直居于七大地区之首,但其政策发布力度与政策语调都处于较低水平。本文分析这可能与以下原因有关:首先,创新基础好。广东省的创新能力连续五年领跑,持续保持全国领先水平。而尽管北京市发明专利申请授权量较高,但由于京津冀地区河北、天津的创新能力增速疲软,导致该地区的排名较低,故珠三角地区保持领先。其次,省份单一、政策发布数量有限。本文将广东省单独划入珠三角地区,而广东省政策发布数量较少,尽管将各地区政策语调得分取算术平均值进行比较,但由于广东省样本数量较少,也会对计算结果造成一定影响。
(三)考虑政策文本语调的修正后政策评价实证分析
1.模型设定与变量说明
为验证考虑语调的区域创新政策评价的有效性,探究修正后的政策量化指标与创新能力的关系,对七大区域的面板数据进行回归分析,构建计量模型如公式(4)所示。本文同时控制地区i与年份t的双向固定效应,引入地区固定效应控制区域间不可观测因素异质性对结果的影响,以时间固定效应吸收时间维度如宏观经济环境等随时间变化的因素对不同区域的同质化影响。
Patit=α0+α1Policyit+α2Innit+α3Openit+α4Indit+α5Govit+α6Emit+Ui+Yt+εit。
(4)
因变量为区域创新能力(Pat),综合已有研究文献,选取各省份发明专利申请授权量的自然对数表征区域创新能力。之所以选择这一测度指标,主要原因有:第一,与企业研发费用、新产品数、新产品产值等数据指标相比,专利的相关规定更为规范与统一,数据具有易获性和可比性;第二,相比于其他专利数量,发明专利申请授权数更能体现地区的创新水平。
核心解释变量为修正后的区域创新政策综合得分的自然对数(Policy)。本文在政策内容指标的基础上引入政策语调,形成了考虑政策文本语调的区域创新政策评价体系,计算修正后的政策综合得分。
控制变量包括市场化进程(Inn)、对外开放水平(Open)、产业结构(Ind)、财政支出(Gov)和研发人员数(Em)。其中,市场化进程(Inn)选用樊纲等编制的市场化指数衡量;对外开放水平(Open)用经营单位所在地进出口总额占地区生产总值比重的对数衡量;产业结构(Ind)采用各地区第三产业增加值占地区生产总值的比重衡量;财政支出(Gov)采用地方财政一般预算支出的对数衡量;研发人员数(Em)用地区研究开发人员数量表示,Ui和Yt分别表示地区固定效应和年份固定效应。
2.数据来源与描述性统计
考虑到数据的有效性、可获取性与连续性,选择2012—2019年京津冀、长三角、珠三角、东北、中三角、成渝和陕甘宁地区,共18个省份作为研究样本。数据来自《中国统计年鉴》《中国科技统计年鉴》《中国市场化进程指数数据库》。将区域创新能力、政策综合得分、对外开放水平和财政支出作对数处理,对所有连续变量进行上下1%的winsorize平滑处理。
描述性统计如表2所示,主要变量不存在较大差异。此外,相关性分析表明修正后的区域创新政策综合得分(Policy)与区域创新能力(Pat)的相关系数为0.553,且在1%的显著水平下显著,这初步表明了区域创新政策评价指标与创新能力的正相关关系。控制变量的相关系数均在1%的显著水平下显著,这说明推动市场化发展、促进区域对外开放、适宜的产业结构与财政及人力的投入能够提升区域的自主创新水平。本文各变量的方差膨胀因子均小于5,变量间不存在多重共线性。
表2 描述性统计
3.回归分析
模型实证检验的回归结果如表3所示。列(1)为不包含语调的政策评价指标(TTEG)对区域创新能力(Pat)的影响,列(2)纳入控制变量后,回归结果仍然不显著。这说明传统的政策量化指标不能解释区域创新能力的变化,故引入政策语调这一评价维度进一步分析。列(3)为修正后包含语调的政策综合得分(Policy)对区域创新能力(Pat)的影响,Policy的估计系数为正,且在5%的显著水平下显著。在纳入控制变量后,区域创新政策评价指标的系数仍为正,在1%的显著水平下显著,显著性得到提高。在分别比较列(1)与列(3)、列(2)与列(4)后可以发现,与传统指标相比,加入语调维度的创新政策量化指标能够对区域创新能力的发展提供更强有力的解释,且纳入控制变量后的解释力度更强。这说明政策语调提高了区域创新政策的评价力度,提供了增量信息。
表3 回归分析
注:***、**、*分别代表1%、5%、10%显著性水平,括号内为t值。
(四)实证结论
通过传统政策内容评价指标与政策语调对区域创新能力影响效果的对比分析,发现政策语调可以解释传统政策评价指标与区域创新能力的失衡问题。高发行力度、低经济产出的结果源于政策语调积极程度欠缺,体现出政府对推行创新活动的积极态度不足。同时,引入语调维度的政策评价指标加强了对区域创新能力的解释力度,并在引入其他环境变量后仍显著,这体现出语调对评价区域创新政策的重要作用。经济发展依托于创新活动的不断涌现,作为经济高速发展的地区,开发创新活动需要依托于资金源源不断地供应、对人才日益增长的需求及创新环境的保障。如何提高资金补助的供应量与供应效率,如何提供更多创新项目以满足人才需求,从而吸引更多的创新型人才是政府亟待解决的问题,这也需要政策制定者积极促进创新活动,利用政策语调传达积极信号。
五、结论及建议
本文通过梳理区域创新政策测度的演化历程,总结了已有研究中评价区域创新政策的方法,同时提出了考虑语调的文本挖掘方法评价区域创新政策。将我国划分为京津冀、长三角、珠三角、东北、中三角、成渝和陕甘宁地区,计算相应区域的创新政策语调得分。进一步地,将语调得分应用于创新政策评价指标,分析创新政策与地区创新活动表现之间的关系,探究优化后的政策评价体系的有效性。
本文研究发现,第一,区域创新政策语调程度受到制度背景的影响。自2015年“大众创业,万众创新”以及党的十八大的区域发展战略提出以来,创新政策语调积极程度持续增加,说明创新制度的发展会影响地区政府对于创新政策制定的关注度,国家对创新活动的推动战略会使政策制定者产生更加积极的态度推行政策活动。第二,创新政策语调可以解释地区政策发布力度与创新能力发展的失衡问题。对于经济发展低迷的东北地区和陕甘宁地区,其较高的政策发布力度并没有推动区域创新能力增长,背后原因是这两个地区政策制定者对创新活动的推行力度不足。第三,在传统的区域创新政策评价指标引入语调维度后,能够加强对区域创新能力的解释力度,这表明语调能够提供增量信息,考虑政策语调的区域创新政策测度能够更好地解释区域创新能力。
本文提出的考虑语调的文本挖掘政策测度方法及相关结论分析,对我国创新活动实践具有一定的启示意义。一方面,政策制定者应该明晰自身的情感倾向,积极推动地区的创新活动发展,尤其是对于创新发展动力不足的东北地区与陕甘宁地区,政府应加大对创新活动的推行力度,营造健康活力的创新环境。另一方面,政策评估及监管机构在评价政策效力时,可以将政策语调纳入评价体系,强化区域创新政策对区域创新能力的解释力度。
[参考文献]
[1] Arrona A, Zabala-Iturriagagoitia J M:“On the Study and Practice of Regional Innovation Policy: The Potential of Interpretive Policy Analysis”, Innovation: The European Journal of Social Science Research, Vol.32, No.1, September 2018, pp.148-163.
[2] 裴雷、孙建军、周兆韬:《政策文本计算: 一种新的政策文本解读方式》,《图书与情报》2016年第6期, 第47—55页。
[3] 郑新曼、董瑜:《政策文本量化研究的综述与展望》,《现代情报》2021年第2期, 第168—177页。
[4] 吴卫红、盛丽莹、唐方成等:《基于特征分析的制造业创新政策量化评价》,《科学学研究》2020年第12期, 第2246—2257页。
[5][42] 李胜会、朱绍棠:《科技评价是否有效促进了区域科技创新?——基于政策驱动的视角》,《科研管理》2021年第7期, 第11—21页。
[6] 沈艳、陈赟、黄卓:《文本大数据分析在经济学和金融学中的应用: 一个文献综述》,《经济学(季刊)》2019年第4期, 第1153—1186页。
[7] 陈艺云:《基于信息披露文本的上市公司财务困境预测: 以中文年报管理层讨论与分析为样本的研究》,《中国管理科学》2019年第7期, 第23—34页。
[8] Lynn K, Mytelka, Keith S:“Policy Learning and Innovation Theory: An Interactive and Co-Evolving Process”, Research Policy, Vol.31, No.8-9, December 2002, pp.1467-1479.
[9] Meissner D, Polt W, Vonortas N S:“Towards a Broad Understanding of Innovation and Its Importance for Innovation Policy”, The Journal of Technology Transfer, Vol.42, No.5, June 2016, pp.1184-1211.
[10] OECD: Innovation Policy, Paris: OECD, 1982.
[11] Lundvall B A, Borras S: Technology and Innovation Policy, New York: Oxford University Press, 2005.
[12] Rothwell R:“Public Innovation Policy, to Have or to Have Not”, R&D Management, Vol.16, No.1, January 1986, pp.25-36.
[13] 鲍克:《市场经济中的技术创新政策》,《科学学研究》1994年第4期, 第47—54+2页。
[14] 陈劲、王飞绒:《创新政策: 多国比较和发展框架》, 浙江大学出版社2005年版。
[15] Dodgson M, Bessant J: Effective Innovation Policy, London: International Thoson Business Press, 1996。
[16] 范柏乃、段忠贤、江蕾:《创新政策研究述评与展望》,《软科学》2012年第11期, 第43—47页。
[17] 匡跃辉:《科技政策评估:标准与方法》,《科学管理研究》2005年第6期, 第62—65+79页。
[18] 张炜、费小燕、方辉:《区域创新政策多维度评价指标体系设计与构建》,《科技进步与对策》2016年第1期, 第142—147页。
[19] 郭强:《基于省级数据的区域科技创新政策评估》,《统计与决策》2012年第3期, 第81—84页。
[20] Libecap G D:“Economic Variables and the Development of the Law: The Case of Western Mineral Rights”, The Journal of Economic History, Vol.38, No.2, June 1978, pp.338-362.
[21] 殷华方、潘镇、鲁明泓:《中国外商直接投资产业政策测量和有效性研究:1979~2003》,《管理世界》2006年第7期, 第34—45+171—172页。
[22] 刘凤朝、孙玉涛:《我国科技政策向创新政策演变的过程、趋势与建议——基于我国289项创新政策的实证分析》,《中国软科学》2007年第5期, 第34—42页。
[23][40] 彭纪生、仲为国、孙文祥:《政策测量、政策协同演变与经济绩效: 基于创新政策的实证研究》,《管理世界》2008年第9期, 第25—36页。
[24] 俞立平:《区域创新政策评价的框架、测度与检验》,《地理科学》2020年第10期, 第1610—1617页。
[25] Laver M, Benoit K, Garry J:“Extracting Policy Positions from Political Texts Using Words as Data”, American Political Science Review, Vol.97, No.5, May 2003, pp.311-331.
[26] 李江、刘源浩、黄萃等:《用文献计量研究重塑政策文本数据分析——政策文献计量的起源、迁移与方法创新》,《公共管理学报》2015年第2期, 第138—144+159页。
[27] 任弢、黄萃、苏竣:《公共政策文本研究的路径与发展趋势》,《中国行政管理》2017年第5期, 第96—101页。
[28] 杨正:《政策计量的应用:概念界限、取向与趋向》,《情报杂志》2019年第4期, 第60—65+51页。
[29] Bali A S, Howlett M, Lewis J M, Ramesh M:“Procedural Policy Tools in Theory and Practice”, Policy and Society, Vol.40, No.3, July 2021, pp.295-311.
[30] 罗敏、朱雪忠:《基于政策工具的中国低碳政策文本量化研究》,《情报杂志》2014年第4期, 第12—16页。
[31] 田进、杨正:《同质与差异:省级政府权力清单制度推行政策的文献计量分析》,《情报杂志》2017年第5期, 第75—81+94页。
[32] 张涛、蔡庆平、马海群:《一种基于政策文本计算的政策内容分析方法实证研究——以互联网租赁自行车为例》,《信息资源管理学报》2019年第1期, 第66—76页。
[33] Pandey S, Pandey S K, Miller L:“Measuring Innovativeness of Public Organizations: Using Natural Language Processing Techniques in Computer: Aided Textual Analysis”, International Public Management Journal, Vol.20, No.1, January 2017, pp.78-107.
[34] Marvel J, D, Mcgrath R, J:“Congress as Manager: Oversight Hearings and Agency Morale”, Journal of Public Policy, Vol.36, No.3, December 2016, pp.489-520.
[35] Laver M, Garry J:“Estimating Policy Positions from Political Texts”, American Journal of Political Science, Vol.44, No.3, July 2000, pp.619-634.
[36] Baker S R, Bloom N, Davis S J:“Measuring Economic Policy Uncertainty”, Quarterly Journal of Economics, Vol.131, No. 4, July 2016, pp.1593-1636.
[37] Gentzkow M, Kelly B, Taddy M:“Text as Data”, Journal of Economic Literature, Vol.57, No.3, September 2019, pp.535-574.
[38] 张永安、闫瑾:《基于文本挖掘的科技成果转化政策内部结构关系与宏观布局研究》,《情报杂志》2016年第2期, 第44—49页。
[39] 张超、官建成:《基于政策文本内容分析的政策体系演进研究——以中国创新创业政策体系为例》,《管理评论》2020年第5期, 第138—150页。
[41] 陈雄辉、楚鹏飞、罗晓晴等:《科技政策对企业创新的作用机制研究——以广东省为例的实证分析》,《技术经济》2020年第12期, 第61—68页。
[43] 郑新曼、董瑜:《基于科技政策文本的程度词典构建研究》,《数据分析与知识发现》2021年第10期, 第81—93页。
[44] 谢德仁、林乐:《管理层语调能预示公司未来业绩吗?——基于我国上市公司年度业绩说明会的文本分析》,《会计研究》2015年第2期, 第20—27+93页。
[45] 李成刚、贾鸿业、赵光辉等:《基于信息披露文本的上市公司信用风险预警——来自中文年报管理层讨论与分析的经验证据》,《中国管理科学》2023年第2期, 第18—29页。
[46] 吕喜梅、蒋翠清、丁勇等:《融合临时报告软信息的新三板企业财务困境预测研究》,《中国管理科学》2022年, 第1—13页。