全国网安标委《生成式人工智能服务安全基本要求》标准全文及概览
前哨按语
3月1日,全国网络安全标准化技术委员会(TC260)发布TC260-003《生成式人工智能服务安全基本要求》。关注前哨,回复“240301”可下载标准PDF版。
《生成式人工智能服务安全基本要求》
主要内容概览
《生成式人工智能服务安全基本要求》(以下简称“标准”),规定了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等。要点概览如下:
一是语料安全要求。标准对语料来源、语料内容、语料标注安全等方面作出规定。其中,在语料来源方面,服务提供者面向特定语料来源进行采集前与后,应对该来源语料进行安全评估或核验,确保相关语料来源含违法不良信息不超过5%。在语料内容方面,服务提供者应对训练语料中的主要知识产权侵权风险进行识别,发现存在知识产权侵权等问题的,服务提供者不应使用相关语料进行训练;使用包含个人信息的语料时,应取得对应个人同意或者符合法律、行政法规规定的其他情形;使用包含敏感个人信息的语料时,应取得对应个人单独同意或者符合法律、行政法规规定的其他情形。
二是模型安全要求。标准对模型生成内容安全、生成内容准确性、生成内容可靠性等方面作出规定。在生成内容准确性方面,服务提供者应采取技术措施提高生成内容响应使用者输入意图的能力,提高生成内容中数据及表述与科学常识及主流认知的符合程度,减少其中的错误内容。
三是安全措施要求。标准对模型适用人群、场合、用途、服务透明度、当收集使用者输入信息用于训练时、图片、视频等内容标识等九个方面做出规定。其中,当收集使用者输入信息用于训练时,服务提供者应为使用者提供关闭其输入信息用于训练的方式,例如为使用者提供选项或语音控制指令;关闭方式应便捷,例如采用选项方式时使用者从服务主界面开始到达该选项所需操作不超过4次点击。
四是其他要求。标准要求服务提供者应当建立和维护关键词库、拒答问题测试题库以覆盖标准附录A1和A2中所列举的17种安全风险,同时应当建立和维护生成内容测试题库和分类模型以覆盖标准附录中所列举的全部31种安全风险。
五是安全评估要求。标准支撑《生成式人工智能服务管理暂行办法》,提出了服务提供者需遵循的安全基本要求。服务提供者在按照有关要求履行备案手续时,按照标准第9部分要求进行安全评估, 并提交评估报告。