周蓉蓉|数据治理:审判体系与审判能力现代转型跃迁之道——以技术类知识产权数据的一体化司法应用为中心视角
点击关注了解更多精彩内容!!
载《中国应用法学》2021年第1期
作者简介:周蓉蓉,山东省高级人民法院法官助理,中国社会科学院研究生院博士研究生。
本文系2020年湖北省社会科学基金重点项目“国家治理体系和治理能力现代化视野下的法治湖北建设路径研究”的阶段性成果。
大数据、云计算、人工智能、区块链等信息技术高速发展推动社会的现代化变迁,传统认知和司法技能难以适应现代信息技术迅速迭代带来的创新要求,成为制约审判体系和审判能力现代化转型的瓶颈。数据治理成为应用法学的主要研究渠道和研究方法,驱动着法治建设的现代转型跃迁。在法治建设中以数据治理体系嵌入智审模式有助于破解困扰智慧法院建设的现实难题。在知识产权司法审判体系现有规章制度基础上创新并优化风险评估制度,明确治理目标、规则体系、权责划分、具体措施,优化元数据管理、数据质量管理、主数据管理、数据生命周期管理体系,通过业务流程整合提升数据安全性与完整性,以技术类知识产权机构管理一体化司法应用为抓手,加强文化、规范、程序等综合保障,推进我国知识产权审判体系与审判能力现代化转型。
数据治理 知识产权 法治建设 智慧法院
继工业化、电气化、信息化时代后,全球已进入数字化时代。伴随着新一轮科技革命和产业革命,5G、人工智能、云计算、大数据、区块链等日益与人们的生活融为一体,“软件嵌入世界”转变为“世界嵌入软件”。在数字化、网络化、智能化的时代特征下,数据被喻为“21世纪的石油”,成为新一轮技术革命和社会变革的核心动力,是与土地、劳动力、资本、技术并列的重要生产要素。经过数年高速发展,大数据时代从上半场的收集数据转向下半场的数据治理、数据驱动和数据变现。随着在线成为常态,数据呈现爆发式增长,各级法院所积累的数量庞大的案件信息、裁判文书、电子卷宗、庭审录像等数据,形成了一座司法大数据“富矿”。只有实现数据治理的优化,紧紧抓住大数据深入挖掘应用的牛鼻子,推动司法大数据资源在智慧法院建设过程中的广泛运用,才能更好地推进“智审、智执、智服、智管”,提升服务经济社会发展大局的能力,推动治理体系和治理能力现代化视野下的法治建设。当前法院数据治理尚处于起步阶段,海量的数据、复杂的数据环境、潜在的数据质量缺陷阻碍了信息集成和深度利用,成为制约智能化发展的瓶颈。法院在数据整合、共享、深度运用、隐私和安全等方面存在短板。数据治理是法院智能化转型的基础,也是审判体系和审判能力现代化的重要抓手,应以有效的数据治理实现数据价值的释放,驱动智慧法院现代化的跃迁。基于技术类知识产权审判具有集中管辖的特点,其本身信息化水平较高、机构联动性较强,在数据治理研究中具有典型性,作者结合工作实际,借鉴有关资料,对全国76家有技术类知识产权案件管辖权的一审法院(法庭)开展了问卷调查,并对负责人民法院大数据管理和服务平台的H软件公司项目服务总监进行了访谈。通过对司法数据应用的实证调查,发现问题集中于数据采集方式落后、质量低、开发利用无序等方面,进而以系统科学与现代化的融贯为逻辑展开,以技术类知识产权数据应用为实证样本,结合文献研究、比较研究等方法,探索数据治理的可操作性路径,以期补齐数据治理短板、充分释放数据潜能、提升数据治理成熟度,在保证数据质量和安全的基础上深挖数据应用价值,实现数据对审判执行和政务管理的驱动,为中国的“数字正义”提供助益。
一、问题的提出:司法应用中数据治理欠缺成因溯源
“欲思其利,必虑其害”。由于认知水平落后、理论供给匮乏、治理手段缺位、技术能力不足等原因,导致数据从产生到应用过程中暴露出一系列严重问题和隐患,大大掣肘了数据价值的释放。
(一)司法数据治理现状与问题
1.数据统计多头管理
对“贵单位在有统计分析需求时,一般是对接哪个具体部门?”,44家对接审管办,26家对接业务部门,20家对接信息中心,11家系统自动抓取,另有5家对接研究室(图1)。数据统计由多个部门负责,造成数据来源不统一,不利于数据规范管理和有效利用。
图1 数据统计管理部门
2.数据统计智能化不足
对“贵单位目前统计数据获取的时效性和自动化程度如何?”,76家受访单位只有1家“所有统计需求可以获得自动产生的成表,并自动汇总和报送”,20家“大部分统计需求都可以获得自动产生的成表”,32家“有一定的自动统计结果,但是需要分支机构进行手工确认调整再进行手工汇总”,17家“大部分统计需求都可以获得自动生成的汇总值,但需要整理成表”,另有6家法院“几乎没有自动统计结果,所有统计都要基于业务明细统计”(图2)。
图2 数据统计智能化情况
可见,绝大部分机构都没有实现全自动收集、智能统计,有72.37%受访单位需要人工介入信息录入和司法统计。针对区域整理(表1),西南和华中地区部分自动统计且手工汇总非常明显,占50%以上。统计方式落后导致数据不能自动校验,数据真实性和准确性无法保障,业务协同程度低,数据再利用率不高。
表1 各区域智能化统计数据
3.数据统计存在偏差
(1)统计区间不一致。在我国,有些地区一般以每月15日为结案限期,而有些地区则以每月月底为结案限期。从本质上来讲,从上月15日到本月15日为一个统计期间的月报表并非某一个完整月的报表,而各地基层法院汇总到高院平台的司法数据统计多采用报表形式,统计区间不一致导致数据偏差。
(2)统计内容不一致。以当事人为法人为例,立案时必填信息项有当事人名称,当事人诉讼地位,法人性质(是否为兵团单位法人),法定代表人姓名和身份证号、联系方式、主要办事机构所在地、送达地址,员工须有劳动合同、是否来自法院内部等(图3)。由于不同法院必填项差异较大,给数据分析造成困难。
图3 立案时必填信息项(法人)分布情况
(3)统计口径不一致。数据标准与数据管理融合度不够。例如,部分一审法院(法庭)将涉技术秘密案件笼统归为涉商业秘密纠纷,而有些商业秘密如经营秘密纠纷不属于最高人民法院知识产权法庭管辖范围。技术合同纠纷属于其他类型案件,但一审法院在填报时将技术合同与专利等其他案由混同。必填信息项以立案信息为准和以结案信息为准的受访单位各占50%,在确定结案案由时,47%受访单位根据裁判文书所载案由确定案由,33%受访单位根据案件审理实际情况确定案由。由于法标更新滞后于审判实践,导致专利行政案件无法按细分案由统计等问题。
(4)存在数据不合理值。如传票时间点设置、开庭公告时间点设置等未遵守相关阈值规则,数据标准化程度低,权威性不够,主数据和参考数据依据不足,数据之间相互矛盾等影响了数据的高效应用。
4.数据缺乏系统融合
当前统计多在结案后进行数据汇总,缺少审理过程中有效录入和控制,只能反映某个案件的立案、审理、结案属性,缺少归类分析,故难以达到类似案件分析预测的延伸效果。不同系统具有不同特征,存在数据壁垒,由于开发商业务限制,很多数据无法即时共享。例如大数据管理和服务平台知产分平台按照最高人民法院知识产权法庭挂牌前的需求完成,研发时没有标识,统计分析不含该庭案件数据。
5.数据深度应用不足
对司法大数据的运用局限于司法决策或审判质效评估领域,所涉及的数据也以结构化数据为主,数据价值尚未充分挖掘。通过技术手段读取识别文书信息有可能出现偏差,导致对裁判文书和电子卷宗等非结构化内容分析远未达到预期,例如无法统计专利侵权损害赔偿金额,导致不能进行趋势分析。尽管根据专利号特征要素识别专利类型等信息在技术上可以实现,但实践中尚未推行。数据在转化为产品、服务公众和经济社会大局方面严重不足。
(二)司法数据治理欠缺的原因
1.理念认知落后
对数据概念、本质特征和价值认识不清。存在分析案件收案趋势、结案均衡情况、审判质效及态势的思维定式,对数据资源的价值和交互效应认知不足,对数据权属存在模糊认识,对数据权利、隐私保护、数据安全等方面不够重视,40%受访单位大部分人员不知道数据标准。
2.制度规范缺失
数据秩序规则、管理模式不完善。《数据安全法》《个人信息保护法》尚未出台,草案规范也较为笼统。数据管理和监督评价体制机制不健全,标准体系亟待完善。30%受访单位没有制定数据治理相关规范,32%受访单位没有数据生命周期管理的制度/流程/办法(表2)。
表2 数据规范制定情况
3.流程存在漏洞
如有些案件在立案审查之后被撤销,如果收案当月退回,则司法统计员可以直接删除相关数据。但如果是收案第二个月或其后退回,则司法统计员不能对已经登记收案案件本身做处理,只能采用其他案件填补漏洞,这就导致了收案的不确定性。
4.技术保障不足
55%受访单位在数据分级保密方面不完善,只有7%的机构运用数据挖掘进行深度分析。人工智能技术与法院工作的融合处于起步阶段,算法仍需要突破和创新。数据处理能力与数据资源规模之间产生显著“剪刀差”,并呈持续扩大趋势。
5.责任划分不明
12%受访单位各部门都没有承担数据责任,35%受访单位由IT部门承担责任,业务部门未深度参与,相关责任部门仅仅是配合数据治理,未明确具体负责主体,考核机制不完善,流程不明确,最终导致了部门间协作弱、整体效率低下(图4)。
图4 数据管理责任划分情况
二、理论溯源:探寻系统科学指引的数据治理原理
“万物得其本者生,百事得其道者成。”随着大数据在各个行业领域应用的不断深入,数据作为基础性战略资源的地位日益凸显,数据标准化、数据确权、数据质量、数据安全、隐私保护、数据流通管控、数据共享开放等问题越来越受到国家、行业、企业各个层面的高度关注,这些内容都属于数据治理的范畴。因此,数据治理的概念就越来越多地受到关注,成为目前大数据产业生态系统中的新热点。
智能化的本质是数据加算法。数据从本质上为人类对新事物或复杂事物的认知与理解提供了新的方法和思维,通过在较小时间和空间内对现实世界进行数字化处理,展现出虚拟数字映像,对现实世界基本规律进行反映。正如习近平总书记指出:“大数据是信息化发展的新阶段”,“没有信息化就没有现代化”。认识数据可以帮助我们更好地掌握审判规律,从而指导我们更好地开展审判。
(一)数据治理驱动审判能力现代化的原理
大数据不仅是体量巨大的数据集,更是多元数据聚集关联后形成的某个领域的数据全集,能产生价值的是“数据池”,越丰富的数据意味着越精准的预测。“当我们在等待更强大的计算机、更智能的软件、更新的人类技术时,只有数据堆积显然是不够的。”要发挥数据价值,离不开有效的数据治理。
数据治理以“数据”为对象,是指在确保数据安全的前提下,建立健全规则体系,理顺各方参与者在数据流通的各个环节的权责关系,形成多方参与者良性互动、共建共享共治的数据流通模式,从而最大限度地释放数据价值,推动国家治理体系和治理能力现代化。数据治理是智能化的引擎。要实现数据治理的科学化,就要顺应数据治理的内在逻辑,探索并认知数据治理形成和运行的机制和原理。
在20世纪80年代,随着数据随机存储和数据库技术的应用,产业界首次提出了数据管理的概念,这就是数据治理最早的起源。2009年,国际数据管理协会(DAMA)提出了DAMA数据管理理论框架模型,成为目前行业最权威的数据管理理论模型。国际数据管理协会(DAMA)的《数据管理知识体系指南(DMBOK)》将数据治理框架定义为数据控制、数据架构管理、数据开发、数据操作管理、数据安全管理、数据质量管理、参考数据和主数据管理、数据仓库和商务智能管理、文件和内容管理、元数据管理10个方面。
率先大规模开展数据治理工作的是强监管要求下的银行业。国外数据治理研究最早由H. Watson于2004年围绕企业管理提出。2005年之后陆续开展对企业、政府、医院的数据治理研究。国内数据治理的研究自2015年起逐渐兴起,起初围绕国家治理、大数据治理,后大多集中在计算机、行政学以及金融等领域。国内外研究主要围绕数据治理模型、框架、成熟度、保障、具体应用,当前重点集中在要素、标准、技术等方面。
目前,企业数据治理已经形成了一套科学的管理范畴。从技术体系上来看,数据治理位于应用和底层平台中间。数据治理包括两个重要方面:一是数据治理的核心活动职能;二是确保这些活动职能落地实施的保障措施,包括组织架构、制度体系。数据治理在大数据应用体系中,处于承上启下的重要地位。对上支持以价值挖掘为导向的数据应用开发,对下依托大数据平台实现数据全生命周期的管理。2018年5月,银保监会印发《银行业金融机构数据治理指引的通知》,开启了行业数据治理的新趋势,数据治理的概念从传统的银行业走向能源、金融、工业、政务等多种行业。近年来,国内各行业大型企业纷纷发起企业内部数据治理项目,制定数据治理规范,成立专业的数据管理实体团队来开展企业数据治理工作。
随着案件数量的增多,庭审录像、语音信息、图像信息等以高速生成模式呈现。要实现对数据的及时高效处理,应当尊重大数据本身具有的时效性属性。如果我们能够开拓计算机学习在司法数据方面的应用,或许也能提前捕捉和预测到司法制度的变异信号。用密实的算法为支撑来检测模式、趋势及原始数据的相关性。在提出假设、建立模型、输入数据检验模型、根据输入调整假设,最终得到最优模型的这一长串动态过程中,所搜寻的不是确定无疑的答案,而是一个具有更高的拟合优度、更强鲁棒性、更小残差的、更能准确描述事实的“最优假设”。
在法院层面,数据治理体现为实践先行而理论供给匮乏。通过中国知网论文数据库的高级搜索功能,以“主题”为检索条件,以“数据治理”并含“法院”为检索关键词,截至2020年8月5日,仅有6条检索结果。关于司法数据治理少量研究围绕智慧法院的数据融合、数据质量管理和数据仓库系统等专门领域及检察系统数据治理,但均未有体系化的建构。
综合各大权威机构关于数据治理的定义和阐释(表3),数据治理是指将数据作为组织资产围绕数据全生命周期而展开的相关管控活动、绩效和风险管理工作的集合,以保障数据及其应用过程中的合规、风险可控和价值实现。法院数据治理就是对司法数据相关过程进行决策的权利和责任系统,包括组织、规则和过程,以促进司法数据价值的挖掘,并确保数据隐私和安全。
表3 数据治理内涵和框架
实践中,法院大数据包括结构化数据,如当事人信息、案号等;半结构化数据,如文书和证据材料;以及非结构化数据,主要是音视频、图片等。人民法院大数据管理和服务平台实现了对核心数据以每五分钟的频次更新,从各地高院的系统直接传输到平台,全部数据每晚由系统自动传输汇总。在知产分平台,各地知产一审法院(法庭)的数据汇总到对应的高院,由高院统一上传到平台(图5)。大数据平台建设有数据治理体系,但尚处于起步阶段。
图5 大数据管理和服务平台知识产权分平台数据汇聚机制
(二)司法数据治理的价值平衡
当前我国立法区分了隐私权、个人信息和数据,在《民法典》中,个人信息被纳入人格权保护范畴,而数据与虚拟财产一起被规定在总则的民事权利部分。数据的性质国内尚无定论,通说认为可以被视为一种财产性利益。当数据汇聚成为“数据池”,对数据集合相关权利进行确认并平衡其他相关权益是数据治理中较为核心的问题。对数据集合的权利确认有集合性数据池、信托理论和财产规则及责任规则,财产规则有利于保护数据安全,责任规则有利于数据流动和应用。
数据只有通过流动才能释放价值。法院一方面收集诉讼相关数据,另一方面产生业务数据。法院数据治理应在流动与安全中求得平衡,一方面运用政策、法规等手段对数据的集成和应用予以规范,另一方面借鉴IT治理等方法加强数据价值挖掘。法院数据治理的内涵、框架、模式和机制都有待进一步探索,将数据治理与业务流程相融合并综合运用规则和技术实现协作共治是大势所趋。
(三)系统科学的综合集成方法是数据治理的引擎
17世纪以来,机械思维认为所有事物都有确定规律,都可以通过简单公式或语言表达,具有普适性。随着社会经济的不断发展,人们发现事物有很多不确定性,这种不确定性难以用机械思维来解决。在科学领域,培根的还原论方法和贝塔朗菲的整体论方法均遭遇困境,20世纪70年代,钱学森先生提出对还原论和整体论进行有机结合,形成新的系统论。系统可以理解为“多个组成部分相互影响,相互依赖,构成新的有机整体,具备新的功能属性”。系统科学体系包含三个层次、一个桥梁,即系统工程;控制论、运筹学、信息论;系统学,以及作为桥梁的系统论。
1.海量数据构成开放的复杂性巨系统
复杂系统与周围环境会发生能量、物质或信息的交互,包含许多子系统,子系统种类及层次繁多。海量数据正具备上述特征,因此构成开放的复杂巨系统。数据关联汇聚风险识别难,由于数据挖掘、分析、处理技术与数据脱敏技术呈现对抗性发展,数据在多维应用场景下开发利用产生新的数据,从而导致难以控制的未知风险,安全挑战更为严峻。
对开放的复杂巨系统,目前只能用“从定性到定量的综合集成法”来处理,社会科学向系统科学的转换,可以理解为“描述科学”向“精密科学”的转换,其方法就是基于人-机的有效结合,围绕以人为中心的思维模式,实现信息、知识和智慧的综合集成,借助人机有效交互、对比、靠近,由定性到定量,对假设进行验证,再提出新的经验性假设,继续进行定量研究。其实际是各种学科的科学理论和人的经验知识的结合,是将专家群体、数据和各种信息与计算机技术的结合,在定性与定量的演变中完成一次次认识飞跃。
2.数据治理跨学科特性需要系统协同
数据治理本身是一个多学科研究领域,不同学科有各自的研究内容。法学研究数据概念界定、权属问题;经济学研究数据资产化、定价等问题;管理学研究数据资产运营、数据治理体制机制问题;信息资源管理学重点从信息资源管理角度开展研究,数据科学从数据处理、分析和安全等技术实现角度开展研究。以数据权属为例,不能仅从法学部门法和经济学效率角度等单一视角去研究,需要综合各学科视角,结合数据流通的全生命周期实际,分析数据生产方、归集方、运营方、使用方、管理方等不同角色的权责划分,科学界定数据权属问题。
多学科方法的互补与融合是自然、社会和人文学科方法论演化的必然趋势,也是系统科学的精髓。关于数据治理的多学科理论成果数量和质量均不足,理论供给的不充分客观上已成为制约我国数据治理整体水平的重要因素。大多数成果停留在概念界定和现象描述方面,能够真正揭示事物本质的理论阐释既少又不够深刻,从各学科呼吁的多,探寻问题破解之道的少,针对具体机构、行业、问题的呼吁或警示言论多,探索体系性策略路径和整体解决方案的极少。应当根据系统科学指引,开展系统化的跨学科研究。
3.数据治理的跨部门特点需要密切配合
现有数据治理概念较为局限,大都以企业组织为对象,聚焦于数据整合、分析和运用等技术视角,缺乏国家治理和社会治理层面的全局性和系统性认识。实体产生的数据经由各类数据采集终端进入信息系统,构建了一个由0和1组成的数字世界。
数据对应于物理世界各实体的社会活动,也按照一定规则在不同数据主体间流转,数据治理一方面要确保数字世界的数据与物理世界的一致性,以保证物理世界实体的权益,一般针对单一组织,从技术视角解决数据质量、数据管理、数据安全问题;另一方面要透过数据治理优化提升国家治理和社会治理的效率,需要把整个国家和社会作为对象,优化提升整个国家和社会运行的机制,打通数据壁垒,实现“一体式”政务服务,需要社会主体共同参与,应充分运用系统科学的思想和方法,从政策、标准、技术、应用等多个视角考虑问题。
(四)有关技术驱动的数据治理演变与发展
数据治理主要依托计算机与文牍中心实现,将信息实现数字化管理,在文牍中心驱动下处理各种文件。人工智能、区块链等新兴技术对数据治理效果作用巨大。例如,人工智能根据多维度评估原则对数据进行自定义处理,让模型实现量化与成熟,让数据颗粒更加细化,并形成跟进方案。通过监督学习和深度学习,过滤无意义数据,提取有效的数据质量评估指标,改善转换规则和数据质量评估维度,最大化实现数据质量的提升。根据元数据规则设定相应的阈值范围,过滤不符合阈值范围的数据,极大提升数据的识别与筛选。对数据分类分级管理,在保密文件管理、数据防泄露等领域,大大提升安全性。据访谈调查,法院当前已针对部分核心信息项进行一致性比对,通过实体识别等工具对文书和案件结构化数据进行校验以提高数据质量,其他人工智能辅助措施还在继续探索。
区块链分布式账本记录来源路径,使数据无法篡改。查看与验证可分离,由数据主体决定是否授权。最高人民法院建立了司法区块链统一平台,但由于刚刚起步,应用还不成熟。问卷调查中,82%的受访单位表示不知道最高人民法院司法区块链统一平台如何与实际工作结合,多家单位提出希望加强区块链应用的培训。
三、转型进路:数据治理嵌入智能化应用改革实践
数据治理不是一个附加过程,而要并入软件开发方法、数据分析等流程。数据治理体系是指从组织架构、管理制度、IT应用技术、绩效考核等多角度,对数据框架、数据安全、数据生命周期等实施深度梳理、全面建设、持续改进的体系(图6)。
图6 数据治理体系框架
智审系统居于智慧法院核心地位,数据治理体系嵌入智审模式有助于破解困扰智慧法院发展的数据治理难题,提升数据治理工具的易用性。
(一)数据治理体系与智审融合
1.嵌入数据生命周期管理
该功能模块主要是根据数据生命循环过程,对各个环节进行监控管理,从采集数据到共享使用数据都会设定相应的监管措施、监管主体,以保障各个流程数据稳定安全,及时发现异常数据并作出预警处理。在立案、调解、保全、证据提交、庭审、庭后合议、文书写作和送达、归档全流程都融贯了数据生命周期的各个环节(图7)。在技术类知识产权审判中,宜将数据生命周期管理与现有的诉讼服务功能相结合,并嵌入远程庭审、办案平台等机制模块,实现智能化融合。
图7 数据生命周期管理嵌入智审模式
2.嵌入元数据管理
元数据是关于数据的数据,描述了数据定义和属性。主要包括业务元数据、技术元数据和管理元数据。通过将元数据管理嵌入,能够有效厘清元数据之间的关系与脉络,规范元数据设计、实现和运维的全生命周期过程,将技术与业务有效连接,促进系统建设、运维、业务操作、管理分析和数据管控等工作(图8)。
图8 元数据模型
3.嵌入主数据管理
该模块主要针对业务系统中核心数据、主数据等进行管理,通过过滤筛选和丰富补充,将这些主数据传输给相应的应用系统和操作系统。经过处理后的主数据更加安全精准,通过确定人员主数据和案件主数据提升数据治理能力。
最高人民法院知识产权法庭“知己”裁判规则库的建立有力推动了技术类知识产权案件裁判规则的统一,若能将主数据管理与类案管理深度融合,进一步规范类案上传标准,推动类案识别的自动化和系统化,将充分挖掘类案这一数据库的巨大价值,以科技手段落实《最高人民法院关于统一法律适用加强类案检索的指导意见》。
4.嵌入数据质量管理
数据质量是数据开发利用、释放价值的关键指标。立案环节的数据采集应当统一区间,保证质量,统一标准。制订数据质量管理评估方案,并评估数据质量能否满足司法处理的标准,根据相应的管理办法及流程,对相关数据做好质量优化。跨部门共享,把统一的证据指引嵌入数据化的办案程序,如国家知识产权局和最高人民法院的数据联通,将提升专利行政案件审判质效。
5.嵌入数据安全管理
当前已有对数据权限的分级分类,根据用户的角色、法院、部门、领导职务等信息判断数据访问的权限,用不同数据权限来分级分类。未来,建议通过加密、数字签名等身份认证技术对用户进行确认,加强实时监测预警,有效保障数据的安全机密、完整合理。同时植入审计手段,实现闭环监管,从采集、存储、传输、处理、运用等全流程实现安全监管和防护。
(二)以数据治理服务数据中台
中台是一种横向策略,是管理思想、技术架构、产品支撑体系、安全体系、服务体系、组织设计的融合体,用于支撑上层多种多样的业务。中台的关键目标就是将资源和能力更好地以服务的方式输出,支持前台规模化、快速迭代的创新,进而更好地服务用户,使组织真正做到自身能力与用户需求的持续对接。从管理角度看,中台可大大提高各平台协同能力,大幅提高管理效率,中台可在各平台间实现信息、技术等通用需求的共享,避免重复投入,大幅降低成本;中台建立后,组织架构得到精简,流程得到优化。从业务角度看,中台化让各业务平台放弃共性,专注个性,市场敏捷度提高;小业务、新业务能享受大中台所有资源的支撑,创新活力增强;通过中台共享数据、技术等资源,各平台业务能力、协同创新能力提升。中台是一个基础的理念和架构,组织把所有的基础服务、基础资源集中于此,并把这些基础服务、基础资源开放给前台使用,共同支持上端的服务。中台所体现和释放给前台的,是组织沉淀下来的所有可以共享的资源和能力,这样就能迅速提升前台的效率和能力。
业务中台与数据中台共同肩负起了大中台战略。数据中台是一套可持续“让数据用起来”的机制,是一种战略选择和组织形式,是依据主体的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。借鉴商业领域的大中台战略,法院数据中台是全面汇聚法院数据,统一数据标准,统一数据接口,统一数据服务水平,消除数据壁垒,实现法院数据的互联互通和共享融合。法院数据中台的演进目标是数据定义服务,即通过数据归集、治理、共享和开放,从数据中找到定义和编排服务的深层逻辑,让法院干警和当事人的深层需求以数据和数据定义服务的形式呈现,真正开启智慧法院的深层变革。
法院的业务中台则面向诉讼服务领域,采用互联网架构、可落地的业务赋能平台,整合诉讼服务资源,将诉讼服务的业务、经验等模型能力进行沉淀,形成诉讼服务共享能力体系。法院业务中台的演进目标是需求定义服务,即持续沉淀前端的诉讼服务需求,优化、迭代法院业务中台的业务服务。
在当前实际应用中,法院数据中台主要是针对某一类通用业务或专门业务形成一系列数据服务,通过数据共享、插件对接、页面嵌入、直接页面服务等模式向各业务系统提供服务。同时也是一个开放式的平台,针对专门业务,可以向各业务对应厂商开放模型研发,由中台管理模型运行,再将模型数据通过中台提供给对应的业务系统,形成能满足某方面需求的产品。如诉讼服务中心,目前是根据诉讼服务中心提出的指标需求,通过诉讼服务团队按照中台要求完成模型研发,并在中台中运行完成后提供数据给诉讼服务中心,保障诉讼服务指标计算的准确性,同时可提供数据给其他业务庭室和各地高院,从而保证了数据的一致性。
对技术类知识产权审判领域而言,应当根据最高人民法院知识产权法庭提出的指标需求,通过专业团队按照中台要求完成模型研发,并在中台运行完成后提供数据给知产法庭,保障知产指标计算的准确性,同时可提供数据给各地知识产权一审法院(法庭),保证数据的一致性。此外,宜使传统利用数据的方式进化为“数据能”的方式,因地制宜混合运用数据脱敏、差分隐私、可信计算机环境(TEE)、联邦学习、多方安全计算等技术,实现隐私保护、效率与成本的最佳平衡。
四、跃迁之道:制度、技术应用与综合保障之统合
数据治理主要依托计算机与文牍中心实现。人工智能、区块链等新兴技术对数据治理效果作用巨大。数据一体化才能有助于其价值实现,实现技术突破才能全方位提升数据治理效能。建议在技术类知识产权审判领域先行先试,探索可靠的路径。
(一)完善管理体制机制
1.统筹协调的工作机制
在问卷调查中47%的受访者提出上下级法院信息沟通不畅,29%提出要加强业务培训,12%提出匹配相应软件,12%提出要建立统一平台。应当纵向打通最高人民法院向高级人民法院反馈信息的回路,建立上下级法院的信息互联互通和共享机制,完成信息流转闭环。同时横向把知识产权法庭相关业务、管理、督导等工作整合为统一的知产平台,解决数据孤岛,从信息共享到数据通用,推动立审执管的数据协同,通过知产平台统筹管理和指导全国知产业务,搭建一体化数据治理框架。整合并创新信息系统,科学规划数据资源,完善流程链,将静态监管与动态监管融合,保障治理的高效、有效与安全。
2.权责清晰的管理体系
数据带给人们思维的一个转变是从过去的集中流程化向分布协同化转变。互联网为人们构建起了蜂巢结构,人们的判断和决策依靠更高效的数据交互、更全面的数据分析,传统的流程化价值链无法适应创新发展的时代需求。数字时代需要更高效、便捷、扁平化的价值链条,打通数据烟囱,消除数据孤岛,重塑组织架构。
数据治理主要是围绕数据资源展开的,明确数据分类分级标准至关重要。在采集数据过程中,需要根据数据敏感程度、数据来源等做好标识标记,为数据整理提供更多依据,同时方便对数据追溯源头。根据分级分类依据形成对应的管理办法,通过标准定义流程,以使用部门的质量要求为切入,完善组织职责,同时明确责任盲区和多头管理的主责部门,逐一评审主数据标准定义和规则以及代码取值等。
(二)创新技术应用
智能化是信息技术演进的目标之一。早在20世纪50年代,人工智能的概念便被提出,直到近些年,随着算力、算法、数据三要素的汇聚与碰撞,基于数据的智能化创新给人工智能带来新的发展空间。我国各政府部门在新技术应用方面走在行业前列,如政务服务、交通、安防领域已有很多智能技术和产品应用,但总体是基于“点”的,如语音识别、图像识别等智能技术的应用。下一阶段,在平台化、数据化的基础上,基于数据智能的创新将增多,会连点成线、连线成面,通过对大量基于“点”的数据的分析,挖掘其中的内在连接和内在价值,让孤立的“点”涌现出新的价值,推动智慧法院的全面跃升。
表4 技术在数据治理中的应用与拓展
技术在数据治理中大有可为(表4)。用人工智能的多维度评估原则对数据进行自定义处理,让模型实现量化与成熟,让数据颗粒更加细化,并形成跟进方案。通过监督学习和深度学习,过滤无意义数据,提取有效的数据质量评估指标,改善转换规则和数据质量评估维度,最大化实现数据质量的提升。根据元数据规则设定相应的阈值范围,过滤不符合阈值范围的数据,极大提升数据的识别与筛选。据访谈调查,法院当前已针对部分核心信息项进行一致性比对,通过实体识别等工具对文书和案件结构化数据进行校验以提高数据质量,其他人工智能辅助措施还在继续探索。
计算机体系结构以数据为中心的宏观走向和存算一体的微观走向,软件定义方法论广泛采用,云边端融合新型计算模式,区块链技术应用于数据治理,网络通信向宽带、移动、泛在发展,海量数据的快速传输和汇聚带来网络Pb/s级带宽需求,千亿级设备联网带来Gb/s级高密度泛在移动接入需求,都是技术在数据治理中的拓展。
(三)综合保障
数据治理是一项复杂程度高,技术要求高,实时更新快的活动,为保障数据治理的安全有效运行,需要共同构建硬法与软法,完善相应的风险评估机制。应当在现有规章制度基础上创新并优化风险评估方面的制度;明确治理目标、规则体系、权责划分、具体措施;优化元数据管理、数据质量管理、主数据管理、数据生命周期管理等体系,通过业务流程整合提升数据安全性与完整性,并以技术类知识产权机构管理一体化为抓手,加强文化、规范、流程等保障(图9)。在此过程中,电子卷宗随案同步生成是一个重要抓手,是人民法院以生成实时、完整、真实可信的电子卷宗为目标,在案件办理及其前后延伸的过程中,运用审判管理手段,将纸质和电子文件通过平台上传、扫描输入、系统流转等方式收集到办案系统中,实现为当事人、法院、政务部门等提供各种透明、便捷、规范、高效服务的工作机制。当前技术类知识产权审判领域正在深入开展电子卷宗随案同步生成应用与改革,在此过程中探索建立全生命周期管理机制,一揽子解决从“文件”到“档案”全生命,从现行、半现行到非现行全周期运行管理中存在的盲区、漏洞,破解随案生成工作普遍存在的失控、失存、失信、失用和失密等难题,结合法院内设机构改革、智慧法院建设、综合配套改革等工作,还可进一步将行政、人事、调研、宣传等各方面的纸质和电子文件一并纳入管理,为各级法院“管案、管事、管人”提供一站式、智能化服务。数据将成为推进审判体系与审判能力现代化的重要燃料,数据的一体化应用将直接贯通并驱动法院由智能化向智慧化的整体跃迁。
图9 技术类知识产权一体化数据治理三维模型
结 语
“依托技术载体,政治、经济及文化融会贯通形成了一个完整的系统,经过同化、排斥、替代等作用,保障了社会的稳定发展。技术理性正在逐步朝着统治理性跨越和发展。”数据作为信息社会的基石,其对于法治的意义可能仍未被充分发掘。潜藏在法院大厦下的富矿等待更多创造。技术类知识产权审判以创新的方式保护创新,以改革的思维推进改革,以问题的导向解决问题,是实践信息化前沿应用进而推动法治建设的绝佳场域。希冀立足于技术类知识产权智能化建设的嵌入式数据治理能够抛砖引玉,以“数字、数智、数治”的进阶推动我国知识产权审判体系和审判能力现代转型跃迁,为世界法治发展贡献中国司法智慧。
(责任编辑:杨志航)