张祖增中国政法大学民商经济法学院博士研究生
邸卫佳山西大学法学院硕士研究生
要目
一、问题的提出:ChatGPT模型在数字图书馆建设中的嵌入二、技术赋能:ChatGPT模型在数字图书馆嵌入的功能优势三、技术风险:ChatGPT模型在数字图书馆嵌入的风险挑战四、技术规制:ChatGPT模型在数字图书馆嵌入的法律应对结语
作为凝萃于科技、经济、文化、法律等诸多学科的一体化信息资源存储、整合与输出性数字媒体服务平台,数字图书馆建设在推进我国图书馆治理体系与治理能力现代化过程中扮演着举足轻重的角色。当前,随着ChatGPT这一新型生成式人工智能系统在各领域的广泛适用,充分挖掘该语言模型在新时代数字图书馆建设中的价值作用具有重要实践意义。因应新技术的生成与发展“对善和恶都具有无限的可能性”,为此,在数字图书馆中嵌入ChatGPT系统,势必要处理好技术赋能、技术风险泛化以及技术话语法律驯顺间存在的内在逻辑关系。不可否认,ChatGPT模型能够通过多样化对话,有效促进数字图书馆的亲民性;通过技术的植入,极大提升数字图书馆的高效化;通过创设发达的算法系统,切实增强数字图书馆的智慧性。然而,亦应警惕ChatGPT在数字图书馆中应用可能产生的国家数据安全、公共行政安全以及个人数据安全等数字风险隐患。为避免ChatGPT在数字图书馆中适用引发人工智能系统的失序状态,应以技术规制的道路为遵循,构筑数据调控、责任导向以及权利保障的综合性防范体系,以实现数字图书馆技术之治和规则之治的完美融合。一、问题的提出:ChatGPT模型在数字图书馆建设中的嵌入随着区块链、大数据、算法等计算科学的兴起,数据要素在社会中的地位进一步凸显,信息科技对社会变革的驱动作用已成必然。以党的二十大精神为根本指引,2023年2月27日,中共中央、国务院印发了《数字中国建设整体布局规划》,突出强调了建设数字中国对推进中国式现代化的重要依托作用。数字图书馆作为传统图书馆在现代信息科技飞速发展驱动作用下实现数字化转型的新样态,其既构成数字中国建设的重要面向,同时也是新时代建设服务型、智慧型图书馆,进而实现图书馆治理体系与治理能力现代化的必然选择。
当前,以大型语言模型为内核的ChatGPT系统问世与爆火,其不仅标志着人类向数智化时代又迈近了一步,与此同时,也为我国建设更高水平的数字化图书馆创造了难得的历史性机遇。作为以生成性预训练变换模型为基本载体、具备拟人化能力的人工智能产品,ChatGPT自诞生以来,其以超高参数、海量数据、超强算力、深度交互等一系列优势性能迅速席卷了全球医疗、教育、金融、司法等各个领域,其所彰显出的运行模式与技术优势使得国内外专家学者对其关注热度“一石激起千层浪”。如比尔·盖茨(Gates B)对此评价说:ChatGPT的影响是相当于个人计算机(PC)或者是互联网诞生一样的变革性技术革命。我国部分学者也盛赞“ChatGPT的横空出世有望形成‘思维革命’,其通过替代人类进行创作、创意、解答、客服等改变人类思考和处理问题的方式范式,由此重塑各行业生态乃至整个世界”。在数字中国如火如荼建设的过程中,由美国OpenAI公司研制的生成式人工智能—ChatGPT系统虽然因科技伦理、法律风险等问题尚未正式引进我国,但不可否认的是,大数据时代,未来数字图书馆建设之技术话语体系构建需求与ChatGPT模型之间的融合互动、融贯互通是我们首先必须直面的科学问题。毕竟,作为人工智能系统从“能用”到“好用”的重大技术突破,ChatGPT与传统AI算法有着本质性区别,其在数字图书馆中的嵌入无疑会给新时代图书馆建设带来诸多“意想不到的惊喜”。特别是我国作为信息化技术较为发达的国家之一,有必要积极回应新一代人工智能革命对数字图书馆建设事业带来的时代挑战与范式变革,即在将ChatGPT模型植入我国数字图书馆建设过程中应该对这一形塑国家与社会治理方式的革命性产品形成自己的理性认知与科学判断,既包括ChatGPT赋能我国数字图书馆建设的优势功能有哪些,也包括它的植入会对数字图书馆建设带来哪些未知的风险与挑战以及如何矫正其产生的技术偏误等一系列重大理论与实践问题。基于此,笔者将尝试对以上问题作出系统性回答,以确保ChatGPT模型在合理且合法的轨道上运行,从而实现数字图书馆技术之治和规则之治的完美融合。
二、技术赋能:ChatGPT模型在数字图书馆嵌入的功能优势作为人工智能领域的又一次重大技术性革命,类似于ChatGPT模型的生成式人工智能系统因在动态语境和使用规模方面与传统型人工智能系统存在差别而使其刚一横空出世便自带极强的技术赋能特征,例如强大的语言交互能力、前所未有的数据攫取规模、巨大的算法运力等,其所具有的自我学习和自我迭代的技术优势对于助推数字图书馆智慧化服务进程,进而最大限度实现数字图书馆公共文化服务职能无疑大有裨益。是故,在ChatGPT的应用热情被迅速点燃的时代背景下,将其引入数字图书馆建设过程中,至少能在促进数字图书馆的亲民性、提升数字图书馆的高效化以及增强数字图书馆的智慧性三方面产生积极的治理效能。
算法革新背景下,基于对话内在本性与社会性两个维度内容而建构起的流畅且友好的人机交互系统无疑构成了新时代数字图书馆建设的必然趋向。根源在于,易于理解的技术操控能力、高效的算法运作能力以及便于感知的信息资源获取能力,是任何一项人工智能技术引入数字图书馆建设的基础前提。尽管目前我国数字图书馆在对话系统上已然实现了从“对话智能体”(conversational agent)到“涉身对话智能”(embodied conversational agent)的重大技术性转型,但不可否认的是依托现有技术形成的与涉身对话智能体的交互更多建基于语音命令基础之上,其尚不能保障数字图书馆的人机对话系统在人机之间实现流畅对话的终极目标。这一数字图书馆建设过程中暴露出来的现实困境从用户体验角度加以审视,其导致的结果为诸如区块链、传统人工智能等新型技术即使从表面上赋予了数字图书馆以极大的便捷性、交互性以及感知性,但由于内在“供需链条”结构性失衡,由此一来,建立在现有人机对话系统技术之上的数字图书馆只能为人们提供有限的阅读服务,图书馆数字平台所应具有的亲民性与包容性便无从彰显。相较于当前以涉身对话智能体为内核而生成的数字图书馆因在对话互动方面不能完全达致用户理性预期的弊端,ChatGPT之所以能在语言交互和信息驱动方面释放出无比强大的服务功能主要源于隐藏其背后的“巨无霸”模型——大语言模型(Large Language Model)。该模型通过内置精密化、人性化以及科学性的人工智能语言接收和输出程序,能够通过学习及领悟人类的语言来进行深度对话,且能依循对话的内容进行双向互动,其强大的语言“理解”、搜索及表达能力已经超过90%的人脑机能。以此技术为根本依托,推动ChatGPT技术在数字图书馆建设过程中深度嵌入,可以切实增进人机交互的自然程度与友好程度,进而达致人机之间流畅对话的革命性技术转型。具体而言,ChatGPT模型在数字图书馆嵌入所彰显出的第一层效能主要体现在以下两个维度:第一,实现了人机对话的智能性。相较传统的对话系统更多基于语音命令而不是多模态存在,ChatGPT的运作建立在大量数据训练基础上,其不仅可以完成人类语言行为的同质化表达,而且能根据灵活的对话组件完成类似语言翻译、文本查找、程序代码等各种人机交互任务,该技术有效解决了生成模型的一个核心问题,即如何让人工智能模型的生成内容和人类的常识、认知、需求、价值观保持一致,这对增进民众的数字阅读服务满意度无疑大有裨益。第二,实现了人机对话的艺术性。相比于传统人工智能在数字图书馆方面所呈现出的单调且冰冷的信息传递,ChatGPT以情境式表达为价值依归,其在数字图书馆的引入不仅能保证信息的有用性,而且能够对人类情感需求作出合理性关照,有利于从根本上实现数字图书馆本身所具有的“以人为本”的公益属性。从技术赋能内含的制度逻辑看,ChatGPT作为一项通用人工智能技术,其在数字图书馆中的引入往往会沿着“技术联结—信息驱动”的结构脉络发展演变,二者相辅相成、环环相扣,共同致力于数字图书馆在运行模式、关键技术以及治理效能上实现历史性变革。一方面,ChatGPT能够强化数字图书馆的技术联结能力。作为人工智能技术诞生以来用户增长量最快的应用程序,技术联结能力构成了ChatGPT成功赋能数字图书馆的关键要素。原因在于,ChatGPT作为高度智能化的AI交互系统,由于内置了十分发达的算法系统,对话产出可以被具有一般沟通能力的人理解为媒体(文本、音频、视频),因此极大地降低了成为阅读用户的门槛。并且,在某种程度上,由于ChatGPT在训练时攫取的数据规模之大,使其可以基于各种各样的原因而被使用。由此一来,依托云计算、大数据、物联网、移动终端等构建的“云+网+端”生态,ChatGPT模型便可以充分满足数字图书馆的运行需要,且随着技术联结性的逐渐加强,数字图书馆的治理效能势必会取得更为重大的突破。另一方,ChatGPT的嵌入会极大地促进数字图书馆信息驱动系统的健全与完善。当前正处于一个知识瞬息万变的信息爆炸的时代。相比传统知识信息承载媒介,互联网、人工智能等现代科技构成了海量知识信息的必要无形载体,在“泛在网络”(Ubiquitous Network)基础上形成的“泛在知识环境”(Ubiquitous Knowledge Environment,UKE)正是顺应这一变化而产生的新生事物。泛在知识环境下,社会公众的阅读需求是全方位、智能化的,用户对阅读文献获取后,除了具有深入挖掘相关知识内容及相互逻辑关系的信息需求,还追求“与其他相关或可能相关的内容和对象进行动态链接”,“以帮助自己理解、吸收、应用以及进行知识系统的再造”。然而,囿于现有信息驱动力在信息资源整合、集成等方面存在短板,数字图书馆在知识服务供给方面由此陷入系统性异构障碍,即信息驱动力不足导致数字图书馆无法在新时代为广大面临知识饥渴的用户提供互联互通互享的智能化、个性化阅读服务。ChatGPT作为拥有大型数据处理系统的人工智能模型,其之所以一经问世就能够在人工智能领域掀起一股追捧的热潮,除了源于内置了深度对话的系统设计,还得益于具有强大的信息驱动能力。这一技术优势具体表现在:ChatGPT拥有超3000亿字的训练数据量,其范围涵盖了互联网所能提供的各类内容,从个人数据到公共文件、新闻报道、文学文本和艺术等等。为此,将其嵌入数字图书馆之中,能够最大程度克服数字图书馆系统存在的异构障碍,图书馆数据整合背景下广大用户所期许的知识信息互联互通互享便不再是遥不可及的梦想。国际图书馆协会与机构联合会在2019年刊发的《国际图联趋势报告(2019版)》(IFLA Trend Report 2019 Update)中明确提出“为保障图书馆不断适应技术的发展与时代的变化,需要开发新的技能,提升图书馆的引领力,从而推动数字图书馆在人工智能时代实现智慧化转型这一宏大愿景”。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》在论述“提供智慧便捷的公共服务”有关内容时亦对“智慧图书馆”作出了特殊关照。由此观之,在人工智能技术蓬勃发展的今天,智慧图书馆因适配于新时期、新环境下用户需求的新期待而成为未来图书馆建设事业的重中之重,其代表了图书馆发展的新方向与新样态。相比之下,作为凝萃于科技、经济、文化、法律等诸多学科的一体化信息资源存储、整合与输出性数字媒体服务平台,数字图书馆虽然能将图书馆中不同的信息资源以编码的形式进行加工和存储,从而突破社会公众在图书信息资源检索和利用方面的时空限制,但其毕竟是仅仅依托互联网技术而生成的一种分布式信息服务系统,由于缺乏人的“智慧”以及数字技术的发展局限,其只能刻板而机械地对每一条来自用户的请求和指令作出回应,而难以为社会公众提供深层次、精细化、多样性的信息资源服务。作为给互联网生态带来新一轮革命性冲击的自然语言处理机器学习模型,ChatGPT因内设高度敏捷、韧性与精准的算法系统,其在“PPO算法”的有效支持下,不仅有效集成了物的智能以及人的智慧,而且实现了智能技术与人文智慧的深度融合。在推进国内图书馆由数字图书馆向智慧图书馆转型变革的时代背景下,加快ChatGPT模型在数字图书馆中的嵌入,不仅能够充分释放其在驱动图书馆转型发展过程中所具有的技术动能,而且与智慧图书馆建设所客观依循的“技术驱动、服务主导、能力检验”的基本原则具有内在耦合性,其通过自动抓取、精确识别、自动分类和高度模拟系统,能够对海量信息进行归类和整理,并基于人类反馈的强化学习寻找完成这些任务的最优解,从而使数字图书馆的运行能够即时纠偏,切实增强数字图书馆的智慧性。三、技术风险:ChatGPT模型在数字图书馆嵌入的风险挑战在数字图书馆建设过程中,技术赋能与技术风险无疑是相伴而生的,二者是同一事物的两个面向。依循技术发展演变的客观规律,技术的发展不可避免“对善和恶产生无限的可能性”。在此背景下,ChatGPT模型作为一项尚未经过科技伦理与学术伦理检验的人工智能领域的新兴技术,其在数字图书馆中的引入除了产生诸多方面的正向治理效能,毋庸置疑也存在风险泛在化的可能性。这种风险泛化主要体现为ChatGPT在数字图书馆中应用可能产生的国家数据安全、公共行政安全以及个人知识产权安全三方面。在一切皆可计算的数智化时代,数据、人工智能等信息科技作为提升公共服务效能、优化公共管理的重要战略性资源,其不仅代表数字图书馆未来发展方向、关乎数字图书馆整体运行质量,同时也对国家数据主权安全构成了严峻挑战。其一,作为人工智能发展至今所进行的一次技术性变革,ChatGPT本质为知识信息等所有可公开获取的数据情报的新型智能载体,在国家数据安全上升为影响国家安全重要因子的时代背景下,ChatGPT在数字图书馆中的应用可能对国家数据主权安全构成严重挑战。具言之,因应数字图书馆的持续且稳定运行需要建立在政治、经济、科技、文化、军事等各个领域的重要信息资源基础之上,未来如果将ChatGPT直接应用到我国数字图书馆建设之中,这象征着上述所有关乎国家信息安全的重要信息的采集、加工、处理、储存、传输等各个环节均交由ChatGPT程序操控,稍有不慎,ChatGPT所承载的知识信息就难免沦为对域外情报组织具有巨大吸引力的高敏感、高利用价值的数据资源,进而引发“数据污染”“数据攻击”等威胁国家安全的信息泄露事件。除此之外,ChatGPT所设计的语言交互程序附带着一定的价值导向功能,将其作为技术工具嵌入数字图书馆中,极有可能出于思想价值的抵牾而对我国社会主义核心价值观造成负面影响或产生不良冲击。其二,对我国信息科技主权安全构成潜在挑战。科技是国家强盛之基,创新是民族进步之魂。在大数据开启人类发展新纪元的智能化时代,自主安全可靠的信息科技研发无疑构成了现代社会维护我国信息科技主权安全的必由之路。通过对ChatGPT的研发历程可知,美国OpenAI公司自设立伊始就将其发展目标定位在发展AGI——强人工智能,即通过构建一个通用模型来解决不同领域的差异任务。2015年,OpenAI公司就基于自主研发的近端策略优化算法推出了语言模型GPT-1。2018年,该公司发布了一篇关于通用语言模型的研究,正式提出生成式预训练(Generative Pre-training)概念,其最大特征是不需要进行人工标注。时至今日,OpenAI公司语言模型已经从第一代发展至第四代,ChatGPT即是基于GPT-3.5架构而搭建的优化对话的语言模型,这一人工智能领域的重大技术突破有效解决了生成模型的一个核心问题,即如何让人工智能模型的生成内容和人类的常识、认知、需求、价值观保持一致。如何克服OpenAI公司在芯片研发问题上对我国进行的人工智能语言交互系统的技术垄断与信息封锁,这直接关系到ChatGPT在数字图书馆建设过程中应用前景,从国家战略高度层面,其也对我国信息科技主权安全构成潜在性挑战。根据公共信托理论,行政机关作为国家权力行使的主体,其自不言待地负有提升公共服务水平、增进公共管理效能、维护公共利益福祉的责任与义务。数字图书馆作为促进人类文明进步、满足人民群众精神期许的综合性信息资源服务平台,依循我国的国家行政结构,其在信息科技时代背景下要想实现智慧化转型,以行政权主导的公权力机关无疑在其中扮演着不可或缺的重要作用,即无论数字图书馆发展到何种阶段,公共行政权能始终构成其所依附的价值主线。循此逻辑,ChatGPT在数字图书馆中的嵌入可能在政府层面对行政权的公共属性产生消解或入侵性风险。类似ChatGPT的生成式人工智能系统的问世毋庸置疑对人类思维展现出巨大的重塑价值,但同时其也意味着人类社会正迈入信息科技主导的数字时代。与传统经济资本中的技术力量不同,数字技术本在人工智能时代下掌握着更高的话语主导权以及资源配置权,由此导致数字时代其对社会整体性控制效度也得到前所未有的强化。受数字技术应用过程中产生的异化性逐利价值观影响,ChatGPT这一以开放性和易控制性为典型特征、以规模庞大的训练数据量为基本表征的数字技术资本运用在图书馆的同时,也不可避免对依托公共行政权所建构起来的数字图书馆的公益属性产生一定的消解作用。具言之,数字图书馆作为传统图书馆在信息科技驱动作用下生成的新形态,二者在法律属性上具有同质性,即共同致力于向社会公众传播知识信息服务、传承人类精神文明财富。然而,需要注意的是,随着人工智能技术、数字版权市场等各种资本在数字图书馆建设过程中的不断累积,ChatGPT这一数字技术资本运用可能会削弱数字图书馆内在的公益属性色彩,进而对控制、支配以及影响数字图书馆转型发展的“看得见的手”——公共行政权带来一定的冲击。除此之外,ChatGPT在我国数字图书馆中嵌入使得算法、权力以及责任处于一个高度融合的状态,由此一来,在数字图书馆建设过程中,一旦由于ChatGPT内部算法黑箱、算法偏差等原因引起决策失误或对用户信息造成侵权,以为社会公众提供智能公共服务的行政主体很可能将ChatGPT模型自身运行失误作为自己开脱责任的正当理由。但我们又无法将责任归属到为数字图书进行技术赋能的ChatGPT模型之上,由此导致人工智能在驱动数字图书馆实现智慧转型的同时也面临算法行政责任链条断裂的风险。数字图书馆与智慧图书馆无论是在功能效用还是在内在机理方面,二者都存在根本性区别,智慧图书馆是数字图书馆未来发展演变的方向所在和高级形态。因应ChatGPT模型是智能技术与人文智慧相互融合而成的通用性人工智能系统,其所具有的科技优势由于适配于数字图书馆向智慧图书馆转型变革的秩序期待,在此背景下,将ChatGPT模型嵌入数字图书馆建设过程中便不再停留在一种静态的理论假设方面。然而,科技理性的纯粹化又可能导致风险的泛在化,社会公众在享受数字图书馆所带来的智能化阅读服务的同时,也应时刻警惕数字图书馆建设可能对个人数据权利产生的多元化的知识产权侵害风险,例如信息资源采集的知识产权风险、信息资源传播的知识产权风险等。具体而言,ChatGPT模型嵌入数字图书馆所引发的技术应用与数据权利保障之间的张力主要体现在以下三方面:其一,ChatGPT模型嵌入数字图书馆可能导致信息资源采集的知识产权风险。根据ChatGPT的运行机理可知,生成式人工智能系统之所以能基于各种原因被使用于各种场域,除了其内置了“巨无霸”模型——LLM,另一个重要原因得益于其在训练时攫取的数据规模之大。质言之,ChatGPT的高效运行完全建立在信息数据收集基础之上(例如用户的IP地址、浏览器类型及设置、用户与网站互动的数据等),其一旦离开了庞大数据信息的支持,其所具有的语言交互性以及以生成一切的方式解决公众各种各样实际问题的能力便不复存在。由此来看,ChatGPT模型在数字图书馆中的引入将使得数字图书馆的系统性建设内容变得更加庞大,依托ChatGPT进行的信息资源采集便是其中一个十分重要的内容。而在数据采集过程中,ChatGPT超强的信息捕获能力在保证信息数据成指数倍增长的同时难免会涉及诸多个人敏感数据或者数字版权问题,例如ChatGPT在对最新的网络资源和电子出版物进行采集、整理和加工时,极易触碰到新资源的著作权问题。特别是在数字图书馆所具有的公益属性这层外衣的掩饰下,ChatGPT对个人信息数据、网络资源或电子文献的采集将变得更加有恃无恐,其攫取的数据规模之大、涵盖范围之广以及信息收集能力之强,无疑会使用户的个人隐私权、知识产权等合法权益处在被侵犯的风口浪尖。其二,ChatGPT模型在数字图书馆中应用可能产生个人数据深度整合风险。所谓“数据整合”,指的是“凭借一定的数据转化、数据处理和数据评价技术,将规模庞大、杂乱无章的数据信息转换为具有一定规律可循、逻辑可依的数据处理机制”。诚然,ChatGPT因内置了具有超强自主学习能力的语言处理模型而使得其赋予了数字图书馆具备了专业且高效的数据整合优势,但需要警惕的是,在数字图书馆建设过程中,ChatGPT模型仍存在背离数字图书馆所具有的公益属性初衷的可能性,毕竟算法黑箱的存在使得社会公众虽然能在表面上感知算法的宏观运行,却始终不能追根溯源,对其内部一窥究竟。由此一来,ChatGPT在图书馆管理者和社会公众不知情的境况下,极易将图书馆内的信息数据整合为他用,这无疑会消解数字图书馆内在的公益属性且使用户个人数据信息权利保障陷入被动局面。其三,ChatGPT模型在数字图书馆中应用可能对个人数据信息存储时限构成挑战、对个人数据信息支配产生风险。之于前者,自2022年11月ChatGPT上线运行以来,OpenAI公司并未就其数据存储的保护以及救济等方面内容作出任何说明。这意味着未经用户允许且漫无期限的个人数据存储成为可能。然而,根据我国个人信息保护法第19条规定:“除法律、行政法规另有规定外,个人信息的保存期限应当为实现处理目的所必要的最短时间”。是故,ChatGPT模型未来在我国数字图书馆中的引入,其因缺乏对个人数据信息存储时限以及救济途径的解释说明而存在违法的嫌疑;之于后者,单纯从表面视之,服务于数字图书馆建设的生成式人工智能系统在法律属性上是客观中立般存在,然而在数字资本等商业化需求导向下,以公益性服务著称的ChatGPT模型的中立性便会大打折扣,即其对数字图书馆的智能化服务极易沦为对社会公众个人数据信息进行支配的工具。四、技术规制:ChatGPT模型在数字图书馆嵌入的法律应对作为新一代人工智能技术的典型性代表,ChatGPT模型嵌入社会结构且内生于社会运作。要避免其在社会治理中沦为人性弱点的“放大器”,应实现对技术主义的理性祛魅。依据技术归化的观点,各类技术就必须得到转化,使其从陌生、可能有危险的东西转变成为能够融入社会文化和日常生活之中的驯化之物。映射到ChatGPT模型应用于数字图书馆这一场域,要以技术规制为根本遵循,通过构筑数据调控、责任导向以及权利保障的综合性规制体系,以赋予ChatGPT模型在数字图书馆中应用的良善底色,切实平衡好技术创新与技术安全的逻辑关系。数据调控:建立ChatGPT在数字图书馆中嵌入的数据分类制度“法律是治国之重器,良法是善治之前提”。因应法治体系是国家数据治理体系、治理能力现代化的重要依托,在全面推进依法治国以及有效维护国家安全的时代背景下,ChatGPT在数字图书馆中嵌入这一事关我国数字图书馆转型升级的人工智能技术话语亟待实现法治的转轨,以有效预防其对国家数据主权安全带来的重大风险。追根溯源,ChatGPT在数字图书馆中嵌入之所以能够引发国家层面的数据安全风险,根本病因在于当前尚未从源头建立起规范生成式人工智能系统大规模数据采集的规则或制度体系。从这个层面出发,逐步建立具有预防作用的ChatGPT在数字图书馆中嵌入的数据分类分级制度,无疑构成了数据安全治理背景下技术话语实现法律驯顺的逻辑起点和根本保障。法发生学视野下,数据分类分级制度的生成源于数据安全法创造性提出的数据分类分级战略构想。因应该战略构想凸显了国家对数据安全保护思路发生了重大转变,标志着国家对数据作为基础性战略资源的认识和管理思路的升级,是故数据分类分级制度的创设不亚于网络安全法规定的“网络安全等级保护制度”或者说是受网络和信息系统分类分级保护思路的启发而成,二者最为显著的区别在于:网络安全法规定的数据信息分类主体为网络运营者,而在数据安全法中,数据分类分级的主体却定位为国家。由此可知,法释义学下,所谓数据分类分级指的是“以对国家安全、公共利益或者个人、组织合法权益的影响和重要程度为划分标准,国家将数据要素标注为不同等级和类别的数据保护措施”。循此逻辑,为有效降低ChatGPT在数字图书馆中应用对国家数据主权安全所带来的风险,应数据安全法为规范性支撑,以数据内含的价值属性为客观依循,通过“自上而下”的方式着力构筑ChatGPT在数字图书馆中嵌入的数据分类分级保护制度。一方面,对于高等级数据信息,比如关涉国家主权安全以及个人隐私的数据,应对ChatGPT背后运作的数据获取系统开启“防护墙”,避免上述高等级涉密信息为域外不法组织所俘获。为此,国内数字图书馆在将ChatGPT模型嵌入其中的时候应将这类数据信息的采集排除在外;另一方面,在中等级涉密数据的抓取方面,比如关于企业商业秘密的数据信息,数字图书馆的所有者或建设者应根据“事先知情同意原则”征得数据所有者的信息采集许可。由此不仅能够避免任何存在潜在的偏见、侵犯隐私、非法使用的内容,或者其他数据和模型中的不公平因素渗透到智慧图书馆这一应用场景中,也可以平衡好个人利益与公共利益的关系,确保类似于ChatGPT的生成式人工智能技术在合法轨道内运行,从而实现技术之治与规则之治的完美嵌合;第三,对于低等级、无涉密的信息数据而言,为最大程度释放ChatGPT模型在数字图书馆中应用所呈现出的服务效能,ChatGPT模型有权进行大规模数据采集、整合、分类、加工以及传输等提升数字图书馆知识服务与智慧服务的内容。责任导向:健全ChatGPT在数字图书馆中嵌入的责任承担体系诚然,随着大数据、云计算等信息科技时代的到来,ChatGPT在数字图书馆建设之中的应用为优化图书馆治理流程、增强图书馆治理精度、提升图书馆服务水平创造了绝佳的机遇。但面对随之而来的算法权力异化、算法责任分配不明等现实挑战,我们必须在主体自觉和法律制度建构相结合原则的指引下,以责任分配为导向,通过健全ChatGPT在数字图书馆中嵌入的责任承担体系,以期为化解数字图书馆应用ChatGPT展开治理的风险提供些许制度建言。其一,在宏观规制原则确立方面,面对ChatGPT在数字图书馆中嵌入可能产生的图书馆公益属性的消解风险,应在主体自觉与法律制度建构相结合的原则下予以纾解:一方面,类似于ChatGPT的生成式人工智能系统作为信息科技时代的“舶来品”,保持清醒、审慎的主体自觉构成了我们理性对待其技术优劣并将其转化为融入社会生活驯化之物的根本立足点。对此,美国发布的《为人工智能的未来做好准备》中强调“我们应当鼓励公共机构以及私人强化自我审视,从而明确自己是否有能力以及应当通过何种方式,有担当地利用和发展人工智能以及机器学习”。职是之故,对于将ChatGPT模型嵌入数字图书馆建设中的公权力机关而言,公共行政部门有必要对ChatGPT融入数字图书馆的全过程展开监督,确保其不被数字资本所裹挟与异化;对于国内诸如阿里、腾讯等信息科技研发的巨头而言,其在算法开发或者推进人工智能技术迭代升级的过程中,应一开始就确立“安全”且对全人类福祉有益的目标,努力克服算法设计的私利与偏见,完善算法决策逻辑,确保人工智能模型的生成内容和人类的常识、认知、需求、价值观保持一致,避免在数据创造者不知情、未授权、不承认或者未受补偿的情况下大规模攫取训练数据;对于用户而言,其应主动了解ChatGPT融入数字图书馆的机理及其可能导致的权益损害风险,并且要培养自身的法律素养,当个人数据权利遭受到人工智能技术侵害时,勇于运用法律武器维护已有的合法权益。另一方面,面临日新月异的人工智能技术变革,已有法律制度对于规制ChatGPT可能导致的风险存在一定漏洞,特别是对于ChatGPT在数字图书馆中嵌入可能产生的公共行政权力转移风险、算法黑箱、算法歧视等算法固有风险,现有法律法规的覆盖性、层级性、前瞻性、针对性均应得到进一步优化,以更好地规范ChatGPT参与数字图书馆建设的边界范围,明确ChatGPT参与数字图书馆建设的发展目标,从而避免因技术野蛮生长而导致ChatGPT应用造成的风险泛在化。其二,在具体责任承担机制建构方面,因应类似于ChatGPT的生成式人工智能系统的本质仍未跳出“人造物”的范畴,即便人工智能在某些领域和特定方式上能够实现“反客为主”,但其内在的工具价值属性决定了人类误用或滥用人工智能技术产生的法律责任归责到信息科技自身的做法从逻辑上是讲不通的。为此,对于ChatGPT在数字图书馆中应用导致的算法决策失误或侵犯用户数据权利的责任应回归到ChatGPT模型的引入者和服务提供者身上。之于前者,行政公权机关既是社会利益增进以及人民日益增长美好生活需要的保障者,同时也是决定ChatGPT模型在社会哪些领域应用的操控者,是故出于推动数字图书馆技术转型目的而将ChatGPT引入其中,为用户提供满意阅读服务的行政公权机关无疑肩负着审慎选择(购买)人工智能服务平台、仔细审查特定算法技术安全性以及严格甄别ChatGPT模型在数字图书馆中应用结果的责任。一旦因对人工智能服务平台选择出现纰漏、对特定算法技术安全性审查出现了差错或者对ChatGPT模型在数字图书馆中应用结果的识别出现问题,从而导致公共行政决策出现失误,那么作为赋能数字图书馆建设的实际操控者——行政机关便应该为自己的过错行为“买单”。之于后者,在将ChatGPT模型嵌入数字图书馆过程中,相比行政公权机关所具有的宏观操控/决定者身份,实际参与ChatGPT模型设计、实施或测试的人工智能技术的提供者或供应商无疑直接决定了ChatGPT模型在数字图书馆中的运行过程和结果,即其既能在ChatGPT模型开发阶段控制算法的实际运行状态,也能在ChatGPT运营阶段实时监测算法的训练模型以及语言操作系统。循此逻辑,如果ChatGPT模型在数字图书馆应用过程中产生任何风险或者实然损害,类似于ChatGPT模型的生成式人工智能系统的供应商无疑应承担法律规定的消除危险、排除妨碍或损害赔偿等民事责任。除此之外,依据合同相对性原理,处于委托开发或者购买服务的行政公权机关一方亦有权对ChatGPT模型的服务提供者进行追责,从而健全ChatGPT在数字图书馆中嵌入的责任承担体系。权利保障:完善ChatGPT在数字图书馆中嵌入的立法保障体系对于ChatGPT模型可能对个人数据权利产生的风险隐患,欧盟议会在人工智能法中将生成式人工智能系统的核心风险定义为缺乏真实性,并基于对隐私和创造力造成的风险、并非基于信息的不真实而是自事实错误产生的风险、过度依赖诸如ChatGPT生成的法律知识的风险、缺乏可验证性和易使虚假信息规模扩大的风险等内容的考量对真实性作出了判断。对于这一做法,笔者认为:与其运用预先定义风险的方式来规制ChatGPT模型可能对个人数据权利产生的安全隐患,不如采用系统性风险监测或风险预防的动态性措施来减轻ChatGPT模型可能对个人产生的任何风险。之于前者,应通过立法的形式强化类似于OpenAI公司等超大型在线平台实时监控并消除其研发的算法系统对公民基本权利产生的任何实际或者可以预见的负面影响的义务,以确保人工智能服务供应平台着力提升算法运行的安全性、可靠性。之于后者,为避免弱势一方的合法数据权利遭到人工智能技术不当利用带来的冲击与挑战,应强化立法机关的风险预防义务。在“一切皆可计算”的数智化时代,风险预防义务是国家保护义务在数据权领域的拓展与延伸,其要求国家通过积极完善立法的形式,有效预防第三人对用户数据权的不当侵犯。以此为基础,面对ChatGPT模型在数字图书馆中应用可能对个人数据权利产生的侵害风险,必须制定或完善以保护公民数据权为价值依归的预防性规则,确保将ChatGPT模型在数字图书馆中的应用纳入法治框架予以调控。第一,积极推进公共图书馆法有关规则的立法完善,以保证图书馆法在通用性人工智能时代担负起应有的协调公益与私益以及保护用户数据信息获取权、接收权和利用权的法定职责;第二,加快著作权法中有关网络著作权保护措施的完善立法,包括增设网络型著作权、明确规定信息资源数字化及其传播权的适用范围等,例如数字图书馆出于为用户和读者提供数据信息服务的需要,可以通过网络传播自身收藏的享有使用权限的数字资源;第三,优化个人信息保护法规定的“知情-同意”规则。具言之,“知情-同意”规则的体系化构建与完善应以“明确告知—充分知情—自主自愿—明确同意”逻辑进路为根本遵循。目前,有效防范信息科技对公众数据权利产生侵害风险的关键环节—“明确告知”在法律规定层面尚有诸多漏洞可循。为此,个人信息保护法修订时应对ChatGPT模型在数字图书馆中应用的告知义务予以细化,特别是应以一种透明且通俗的方式向数据权主体作出合理性解释,且数据处理的风险性程度越高,告知规则就越具体。如此,ChatGPT模型在数字图书馆应用过程中,用户基于信息数据权所享有的“数据同意”才能更加真实可靠有保障。ChatGPT模型作为人工智能技术在数智化时代实现的一次质变,在推进中国式图书馆现代化进程中,其承载着引领当代数字图书馆实现创新性发展与技术性变革的历史性使命。全面依法治国背景下,对于ChatGPT模型在数字图书馆中嵌入这一时代命题,既要积极推进、有所作为,又切不可急于求成,唯有立足于科技演变规律与现实发展需求,在技术话语法治转轨的思维指导下将ChatGPT模型嵌入数字图书馆可能带来的技术赋能、技术风险以及技术规制等问题予以统筹考量,才能充分发挥ChatGPT模型对数字图书馆转型升级的驱动作用,确保技术之治与规则之治在数字图书馆建设场域实现完美融合。往期精彩回顾
上海市法学会官网
http://www.sls.org.cn