查看原文
其他

认知智能在税收征管数字化升级和智能化改造中的应用研究——兼论税收智能系统的建构

税务研究 税务研究 2023-09-20



作者:

姚 键(国家税务总局驻北京特派员办事处) 







一、税收信息化发展现状与认知智能在税收领域的应用分析

(一)税收信息化发展现状

纵向来看,我国持续三十多年的税收信息化建设,取得了丰硕成果,税收处理由全手工时代进入信息时代,金税工程规范了税收征管流程,Tips和电子税务局方便了纳税人足不出户办税,电子发票进一步提升了税收治理能力,等等。横向来看,对照2021年经济合作与发展组织(OECD)税收征管论坛(FTA)发布的《数字化转型成熟度模型》中的5个成熟度等级和35个成员单位的自我评估结果,我国税收信息化的成熟度也稳居世界前列。但从国家对整个税收工作的要求看,随着税收在国家治理、经济调控、社会公平等方面发挥的作用越来越突出,税收处理更加复杂,税收信息系统的建设依然任重道远。具体表现在:信息技术在税收管理各领域的应用有待进一步拓展、完善和深化,各系统间的功能需要进一步整合,利用信息技术改造税收工作以加强管理、优化服务的目标还远没有实现。究其原因,信息化处理数据的层次是“信息”,囿于这个固有的属性,扩张软硬件规模已很难从根本上解决上述问题,只有将处理数据的层次从“信息”层提升至“知识”层,方能有“质”的突破。

(二)认知智能及其在税收领域的应用分析

人工智能主要包含三个方向:运算智能、感知智能、认知智能。其中,认知智能是赋予机器知识学习、知识推理和知识应用的能力,使机器能够拥有类似人脑的功能。税收业务处理的核心问题是将经济业务与税收法律法规进行匹配,属于典型的认知智能范畴。认知智能的发展与知识表示和知识推理紧密相关。知识表示包括面向人类理解的符号化表示与面向机器处理的向量化表示,主要包括谓词逻辑法、产生式表示法、语义网络法、案例表示法、本体表示法以及基于图的表示、基于三元组的表示和向量表示或数值表示。2012年,知识图谱由谷歌(Google)推出,迅速成为大数据时代最重要的知识表示方式。近年来,知识图谱的多模态化被认为是实现人类级机器智能的必然关键步骤,并由此提出了多模态知识图谱的概念。知识推理则是从已知的知识出发,经过推理挖掘,从中获取所蕴含的新事实,或者对大量已有知识进行归纳,从个体知识推广到一般性知识的过程。目前,可理解、可信赖的知识推理模型受到越来越多的关注,包括事前可解释推理模型、事后可解释推理模型、局部可解释推理模型和全局可解释推理模型等。

近年来,认知智能在金融、医疗等多个领域得到广泛应用。一夜之间成为顶流的人工智能对话工具ChatGPT 展示了认知智能在通用领域令人生畏的能力和发展速度。聚焦于特定领域,让机器获取特定领域的知识,替代或辅助人类解决某个领域的业务问题,更具有现实可行性。世界上首个应用于税收领域的认知智能系统——“沃森”(Watson)诞生于美国的IBM 公司。沃森是一个多领域应用的认知技术,美国布洛克税务公司雇用并利用“沃森”强大的人工智能系统帮助其准备申报纳税等相关工作。沃森的智能性主要体现在:通过学习消化美国国内收入局的税收代码,吸收布洛克税务公司税务人员与客户之间的对话,分析会话模式以确定纳税人客户是否可能失去节税机会,并在税务师通过文书与客户进行交流时随时跟进,同时检测是否有潜在的扣除项目或信用丧失的风险并及时提醒,以实现为纳税人提供更为合理的纳税方式之目的。基于上述分析,认知智能在税务领域能够实现深度应用主要基于以下因素。

1.税法是确定的、成文的和有限的。税法属于成文法,由国家立法机关制定颁布或由国家立法机关授权国家机关制定公布,以文字符号形式表现出来,具有文体规范、语义明确、逻辑严密的特点。税收法定原则要求税法主体的权利义务必须由法律加以规定,税法的各类构成要素都必须且只能由法律予以明确。税收法规的文字表示、规范明确、总量有限的特点使得税务领域较其他行业更便于机器学习。

2.税收信息化建设基础深厚。我国税收信息化建设起步早、覆盖广、程度深,并始终得到党中央、国务院的高度重视,金税工程被列为我国电子政务工程重点建设的“十二金”工程之一,是重要的国家级信息工程。从金税一期、金税二期,到金税三期的全面推广到位,我国已经基本形成了一个以征管业务系统为主,包括行政管理、外部信息和决策支持在内的四大应用系统软件,在全国范围内实现了统一的信息化税收征管方式。当前,我国已经全面建成了金税三期核心应用、电子发票管理、自然人税收管理、大数据平台等税收信息系统。税务部门不仅收集了数亿纳税人几十年的税收数据,而且构建了规范统一的税务行业标准和业务体系,制定了各类标准规范和征收管理、决策支持、纳税服务等多个业务代码规范,初步形成了税收信息化管理制度和标准规范体系。丰富的税收数据为税收数据知识化夯实了基础。

3.税收信息系统向税收智能系统过渡自然。如果把税收智能系统比作一个人,那么税收信息系统就相当于“耳目手脚”,而负责知识理解与推理任务的功能部件就相当于“脑”,可称为“税务大脑”。“税务大脑”与税收信息系统的关系是相互依赖、相互促进的。税收智能系统的建设不是“另起炉灶”,而是“和风细雨”式的柔性改造和能力升级。在税收智能系统的建设过程中,一方面,“税务大脑”为各类税收信息系统带来认知能力,这种认知能力以一系列认知服务的方式助推各类税收信息系统智能化提升。例如,金税三期的核心征管是以“机器+人”的方式实现税收申报征收流程,引进“税务大脑”的“自动算税”服务后,“人”的部分功能将被“税务大脑”替代,税收申报征收将实现全流程自动化。另一方面,各类信息系统为“税务大脑”提供知识来源和效果反馈。各类税收信息系统在长期使用过程中积累的大量数据和业务知识,是“税务大脑”的重要知识来源,同时,各类信息系统向“税务大脑”反馈认知能力的效果和知识质量。借助“税务大脑”的赋能,各类税收信息系统能够自然地实现数字化升级和智能化改造。


二、实现税收征管数字化升级和智能化改造的现实意义

税收信息化本质上是以“机器+人”的方式,即“机器”分担税收数据的存储、传输和数值运算等低级加工任务,“人”承担税收数据的理解和推理等高级加工任务,实现了税收业务处理的“半自动化”,相较于“全手工”的税收业务处理,提升了税收业务处理流程的规范性和效率。信息化的内在属性决定了机器处理数据的层次较低,只能局限于“信息”层,已经高度信息化的税收仍然需要大量人的脑力。税收智能化最基本的特征就是将机器处理数据的层次从“信息”层提升到“知识”层,赋予机器认知智能,将原来由人承担的税收数据的高级加工任务也由机器来承担,进一步替代或减轻人的脑力工作量,实现税收处理的全自动化,以全新的应用场景,推进税收征管现代化,大幅提高税法遵从度和社会满意度,显著降低征纳成本。这正是实现税收智能化的现实意义所在。

(一)精准理解税法,提升税收确定性

税收确定性是指国家征税必须通过法律形式,事先规定纳税人、课税对象和课征额度。确定的税收政策能够为市场主体的经济活动提供明确的政策指引,使纳税人能够形成稳定、明确的政策预期,进而合理安排未来的经济活动。税收确定性是构建稳定、公平、透明、可预期的税收营商环境的重要内容之一。尽管立法者在立法时对法律条文字斟句酌,但实际执行过程中,税企双方仍难免产生不同的解读。例如,成员企业收到集团财务公司的存款利息收入,是否征收增值税。第一层,如果“税务大脑”的知识库里只有《营业税改征增值税试点有关事项的规定》(财税〔2016〕36号),那么“税务大脑”则根据关键字匹配,把成员企业收到的存款利息视作财税〔2016〕36号文件中不征收增值税项目的“存款利息”。第二层,如果知识库里对财税〔2016〕36号文件中的“存款利息”关联了专门的定义,特指按照《中华人民共和国商业银行法》的规定,经国务院银行业监督管理机构审查批准,具有吸收公众存款业务的金融机构支付的存款利息。而集团财务公司显然不具有吸收公众存款业务,那么成员企业收到的存款利息不属于财税〔2016〕36号文件中的“存款利息”,所以需要征收增值税。第三层,如果知识库里有《企业集团财务公司管理办法》(中国银行业监督管理委员会令2006年第8号)的知识,理解财务公司的业务范围包括“吸收成员单位的存款”,而且“税务大脑”能够推理集团成员单位从财务公司收到的存款利息收入,与公众自商业银行取得的存款利息收入没有本质区别,那么可以推理判定成员企业收到的存款利息收入不需要征收增值税。可见,具有认知能力的“税务大脑”能够精确地理解税收法规的语义,并向所有纳税人和税务人提供统一确定的解释,可以有效提高税收确定性。

(二)自动算税,简化流程节约成本

税收征管流程可分为税务登记、凭证管理、信息披露、申报纳税、税额确认、税款追征、税务检查、法律责任、争议处理等主要环节。税收信息系统支撑下的税收征管流程见图1。在税收信息系统支撑下的税收征管流程图中,上部为税收征纳准备环节,中部为核心环节,下部为保障和救济环节。其中,“1 税务登记”“2 凭证管理”“3 信息披露”以及申报纳税中的“4.2 报税”和“4.3 缴税”环节表示主要机器承担的低级加工,申报纳税中的“4.1 算税”“5 税额确认”环节表示目前需要人工承担的高级加工,“6 税款追征”“7 税务检查”“8 法律责任”“9 争议处理”环节表示暂不适合机器承担。

由图1可见,税收信息系统支撑下的税收征管流程以纳税人主动申报为前提,以税务机关税额确认为中心。申报纳税可以细分为算税、报税和缴税三个子环节。其中,报税是将申报内容以税务机关要求的形式和方式报送给税务机关,缴税是将税款缴到国库。目前,金税三期已经实现了报税、缴税的自动化。算税是整个税收征管流程的“重头戏”,其解决的是一项经济业务是否需要纳税、按什么项目纳税和缴纳多少税的问题,即判别是否属于应税范围、对应哪个应税项目、是否存在优惠政策、税额多少等内容,是整个税收领域对认识能力要求最高的部分,但目前主要依赖专业人员的脑力处理。不仅纳税人在申报纳税时需要第一次算税,税务机关在税额确认时还需要第二次算税(见图1中“5 税额确认”环节)。在税收信息化时代,以现有税务机关的人力难以对全体纳税人的全部经济活动进行税额确认,仅能选择部分纳税人或部分经济业务进行税额确认,即抽样确认。实现税收智能化后,“税务大脑”为金税三期核心信息系统提供认知智能服务,机器能够理解税收法律法规的内涵和外延,自动归类经济活动,通过知识计算,匹配经济活动和税收法律法规。只要提供足够的硬件规模,就可以为每个纳税人自动算税。自动算税的意义主要有以下两点。

1.重新定义征管流程。自动算税将导致征管流程被重新定义,使得税收征管流程大幅简化,纳税人仅需要信息披露即可,算税、报税、缴税将实现全部自动化处理。征纳双方的两次算税由“税务大脑”一次完成,税额确认环节就可以节省了,没必要重复算两次。图2(略)是“税务大脑”赋能税收信息系统后的税收征管流程。征纳双方的工作重点也被改变,纳税人的主要工作量是真实完整地披露信息,税务机关的主要工作量是核实纳税人信息披露的真实性和完整性。2020年,OECD在《税收征管3.0:税收征管的数字化转型》报告中,提出了“将税收征管程序嵌入纳税人日常生活及商业行为中”的愿景,反映了税收征管现代化的动态性和前瞻性,即将税收征管更加深入地建立于纳税人日常生活和各类交易中,实现税收征管多方面的自动化,使征管各环节,如纳税人信息披露环节,趋于无缝衔接和零摩擦,大大减轻税收遵从负担。

2.大幅节约税收成本。征税成本方面,实现自动化后,税额核定环节以及针对该环节的督审和纪检监察都可省去,税务机关至少可以减少50%的人工工作量。自动算税可以大幅减少人工工作量,有效减少税务人员数量,节约征税成本。纳税成本方面,2021年,全国增值税一般纳税人约1238万户。如果实现自动算税,并用信息披露取代纳税申报,那么全体纳税人的纳税成本节约将极为可观。

(三)跨部门数据融合,推进跨部门协同监管

数字经济背景下,生产要素加速流动、扩张和转移,市场主体数字化、多元化趋势加剧,经济管理复杂程度和治理难度超乎以往。因此,要有效运用纳税人整体画像,推进政府部门、市场主体、社会各界等不同主体之间构建“横向耦合”的数字化税收综合治理生态体系,实现市场监管、金融管理、海关、住房建设、土地等治理主体的合作互助,推动政府、市场、社会等不同社会力量共同参与税收治理,进而提升税收治理的整体性、集成性效能,打破信息壁垒,实现数据共享。目前,多地税务机关已与财政、公安、海关、银行、自然资源、生态环境等多部门建立了长期数据共享机制。但各部门信息的组织方式、粒度、口径甚至表示形式等各不相同,人工匹配的工作量巨大,造成数据共享困难。例如,自然资源以图层方式表示土地精准信息,税务部门用地址表示企业的登记地和生产经营地,统计部门用行政区划表示统计范围,在信息层面很难统一。上升到知识层面,则可将三者完全统一。通过构建税收知识图谱,可以融合不同知识体系中的知识,运用实体对齐技术判断出不同实体指向同一物理对象,运用冲突消解技术解决实体属性描述不一致问题。针对本例,可创建“地点”实体统一来自三个部门的不同概念,并将坐标、地址名称和行政区划作为“位置”属性的三种表示形式,从而实现跨部门数据在知识层面的融合,推进跨部门协同监管。


三、税收智能系统的层次结构和构建建议

(一)税收智能系统的层次结构

税收智能系统由“税务大脑”和税收信息系统共同组成。“税务大脑”从各类税收信息系统中接收税收认知请求,运用自身拥有的知识和计算能力进行知识计算,为各类税收信息系统提供认知服务,各类税收信息系统再对用户提供税收服务。图3(略)是税收智能系统的结构层次图。“税务大脑”从知识来源层即数据层提取知识,经知识加工层对知识计算后,在知识应用层发挥效用。“税务大脑”内部分为知识库、知识计算引擎和知识服务组件三层。

1.第一层:知识来源层。知识来源层为上层提供原始材料,其既包括金税三期核心征管数据库、发票电子底账等所有税收信息系统数据库的结构化数据,也包括税收法规库、税收案例库等非结构化的数据,还包括税务专家的经验,以及其他能够采集到的与税收有关的所有数据。

2.第二层:知识加工层。知识加工层实现知识获取、知识加工和知识服务的功能,俗称“税务大脑”,其分为三个子层和一个管理模块,即知识库、知识计算引擎、知识服务组件和知识管理。

(1)知识库。税收知识库子层由基础知识图谱和高级知识表示组成,是“税务大脑”的知识储备。基础知识图谱分为三个域,即本体域、一般域和常识域。本体域知识是税收法律法规的基本概念,是支撑税收法律秩序空间的“四梁八柱”,其构建过程是一个知识数据化的过程,首先从税收法律法规文件自动抽取实体、关系和规则,接着分类列出最基础性的概念、关系和规则。例如,纳税义务人、税种、税目、税率、计税基础等。一般域知识从税收、财务、经济、相关法律四个领域抽取一般性知识,相当庞大。常识域知识可从现成的常识知识图谱裁剪。由于税收历史悠久,积累了丰富的行业经验,形成了大量约定俗成的分类体系和基础性的实体、关系和规则,基础知识图谱可以尽量采用,而不必通过机器学习等方法提取。

高级知识表示存储隐蔽的实体关系、业务经验规则、综合业务模型。税收高级知识表示一般通过对包括各税收信息系统数据库在内的多个数据源进行知识融合,运用各类学习算法发现隐藏在大数据中的高级业务知识。例如,税收风险识别模型、税收收入预测模型、纳税人画像、税务案件画像、经营活动轨迹、发票轨迹等。税收高级知识表示的构建过程是一个数据知识化的过程。组织税收业务专家提供业务经验,再由技术人员翻译后输入知识图谱,是补充税收高级知识表示的另一途径,尤其适用于初建阶段。税收高级知识表示的形式不仅包括知识图谱,还有谓词逻辑、框架、脚本等多种形式。

由基础知识图谱和高级知识表示组成的知识库将为“税务大脑”存储全部现行有效的税收法律法规文件包含的知识、金税三期历年积累的数据和众多税务专家的经验,并持续学习更新,其税收知识之广博、记忆之精准远远超过任何一位人类税务专家。

(2)知识计算引擎。知识计算引擎子层通过存储各种知识加工算法,模拟人脑的思考过程,使“税务大脑”具有理解和推理能力。知识计算引擎可分为基于符号演算和基于数值计算两大类。在通用知识计算引擎的基础上,构建针对税收知识图谱的专用算法工具是必要的,如税收知识搜索、税收知识推理、税收知识推荐、图计算等。税收知识计算引擎更注重可解释性。

(3)知识服务组件。知识服务组件是能够独立完成某项高级税收业务的可复用的功能集。知识服务组件利用税收知识库和税收知识计算引擎,对税收业务中常用的认知需求预制可复用的知识服务组件,以提升“税务大脑”解决问题的效率,如自动算税、税收风险识别、税法概念精确理解、多模态税收知识融合等。

(4)知识管理。知识管理负责对知识库、知识计算引擎以及知识服务组件进行维护更新。知识管理定义“税务大脑”综合认知能力指标知商Q。知商Q=知识计算能力A+知识储备量B×质量系数C。其中:A表示知识计算引擎的理解和推理能力,通过一些实际场景中测试得到;B表示知识库知识的数量;C表示知识质量,与知识的重复率以及缺失率相关。通过得分结果,可以定量地确定“税务大脑”的能力,了解其在知识质量、知识数量、认知能力上的不足之处,以便于在维护优化过程中,有针对性地补足短板。

3.第三层:知识应用层。税收知识应用层由“税务大脑”和各税收信息系统共同组成。“税务大脑”以知识服务的方式为税收信息系统赋能。首先,建立“税务大脑”与税收信息系统之间的接口标准,然后修改信息化流程,将原来需要人工处理的环节重新定向至“税务大脑”,“税务大脑”接收税收信息系统的知识服务请求后,进行知识计算,然后将结果送回税收信息系统,从而实现税收信息系统的智能化改造。税收信息系统根据“税务大脑”认知能力的进化,持续对业务流程实施优化重组。“税务大脑”和各税收信息系统联合就组成了税收智能系统。

(二)构建税收智能系统的建议

如果说从税收手工处理到税收信息化是税收发展史上的第一次飞跃,那么从税收信息化到税收智能化就是税收发展史上的第二次飞跃。比较而言,税收智能系统与税收信息系统存在以下三点不同。

1.目标不同。税收信息系统是以人机结合的方式逐步推进税收业务流程,且以人为主,机器不具有认知智能,是半自动化的;而税收智能系统能够独立完成税收任务,机器具有认知智能,能够代替人,是全自动化的。税收信息系统是面向过程的,关注业务流程;税收智能系统是面向结果的,屏蔽了业务流程。最直接的差异是税收智能系统较税收信息系统替代或减少了纳税人和税务人的脑力劳动量。

2.能力不同。税收信息系统的业务规则是固化的,当外界条件稍有变化,系统无法自动适应,必须人工干预,进行升级改造。税收智能系统的业务规则是可以学习修正和自动调整的,根据外界变化自动适应是智能系统的基本功能。最直接的差异是税收智能系统较税收信息系统大幅减少了系统升级的频率。

3.边界不同。在系统处理数据的高度上,税收信息系统处理数据的层次是信息层,包括信息的传输、存储和展现;税收智能系统处理数据的层次是比信息层更高的知识层,包括知识获取、知识计算和知识运用。在系统处理数据的广度上,税收信息系统的业务边界是从申报表开始到税款入库结束;税收智能系统的业务边界一般从税收法律法规的理解开始到税款入库,税收法律法规的修订和变化在税收智能系统的自适应范围内。最直接的差异是各类税收信息系统的数据上升到知识层面可以更方便地融合共享。

鉴于税收智能系统与税收信息系统在目标、能力和边界上均有不同,因此,构建税收智能系统应注意以下几点。

第一,统一认识、分层推进。与当前“零星、点状”的智能税收应用场景比较,税收智能系统更强调整体性、系统性的智能化。知识的一个核心特点就是越是全局性的知识,越有优势,且价值越大。因此,应当构建一个全国唯一的全景式税收知识库并支撑多个单项业务智能应用,比建多个小知识库分别支撑各个单项业务的智能应用,效益更高、价值更大。构建税收智能系统时不能采取信息系统的规划建设方法(信息系统建设是按业务耦合度进行纵向切分的,形成的是一个个烟囱状的独立的信息系统),而应按照税收智能系统内部的层次关系,横向切分,自底向上,逐层推进。

第二,人机协同、注重实效。虽然税收智能系统能够自动获取知识,但在构建期间,税务专家的干预仍然很有必要。首先,机器需要税务专家赋予税收领域的基本概念框架,如对税收领域本体、税收领域模型的定义;其次,机器需要税务专家标注样本、评判结果。税务专家知识的直接输入要比机器学习获得知识更高效、更准确,召集全国税务专家构造汇聚全部税务专家知识的海量规模、高质量的税收知识库,能大大加快税收智能系统的构建进度。

第三,产研结合、优势互补。税收治理是国家治理体系和治理能力现代化建设的重要内容。认知智能是税收征管数字化升级和智能化改造的基础与核心。认知智能在税收领域的应用不仅是税务部门一家的任务,也是国家科技部门的任务。税务专家拥有税收行业知识、熟悉税收信息化、了解行业需求;而人工智能科学家掌握认知智能研究最新进展、研究方法和应用技术。两者结合,能够实现优势互补,是认知智能在税收领域应用成功的必要条件。目前,科技部以“面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康”为原则,正在开展“十四五”国家重点研发计划任务布局研究工作。在此大背景下,税务部门应尽快把“认知智能在税收领域的应用”纳入科技部“十四五”重点专项,明确难点问题,集中全国科研力量共同攻关,加快税收智能系统的建构步伐,助力税收征管数字化升级和智能化改造,为推进新征程税收现代化、服务中国式现代化贡献智慧和力量。

(本文为节选,原文刊发于《税务研究》2023年第5期。)

欢迎按以下格式引用:

姚键.认知智能在税收征管数字化升级和智能化改造中的应用研究:兼论税收智能系统的建构[J].税务研究,2023(5):68-75.

-END-

中国税务杂志社“调查研究”主题征稿启事

我国跨地区增值税收入分配制度改革:基于欧盟的经验借鉴

增值税改革在制度完善中为经济发展赋动能——新时代十年增值税改革述评

增值税税收与税源背离对我国地区财力均衡的影响

增值税立法的若干问题——基于《中华人民共和国增值税法(草案)》的分析

论增值税纳税人的构成要件与立法完善——基于“经营活动”核心概念的分析

增值税立法:意义重大  影响深远——兼论《中华人民共和国增值税法(草案)》仍需解决的几个问题

构建绿色税制助力建设美丽中国的思考

“双碳”目标下支持打造国家清洁能源产业高地的税收建议

中国式现代化与个人所得税制度优化

我国一般反避税标准的现状、适用与完善

纳税信用管理:现实状况、国际经验和提升路径

减税、增支与宽货币的宏观调控政策效应——基于CGE模型的模拟分析

中国绿色税收指数研究

“数字经济与税收治理”征文启事


点击“阅读原文”快速投稿~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存