查看原文
其他

欧盟委员会:生成式人工智能透明度-识别机器生成的内容

图灵财经 图灵财经
2024-09-16

点击蓝字 关注我们

报告信息


生成式人工智能透明度-识别机器生成的内容

报告来源:欧盟委员会联合研究中心

发布时间:2024年5月


内容简介

GenAI 的应用潜力横跨各个行业,这项技术的创造力和推理能力可能会影响所有知识和艺术职业。尽管 GenAI 为各个领域带来了诸多好处,但其日益强大的能力也引发了人们对人工智能对安全和基本权利带来的独特风险的担忧。GenAI 有可能支持虚假信息宣传并扩大舆论操纵,并使剽窃或冒充行为更难发现和更有效率,以提高欺诈效率。GenAI 也模糊了人类和机器创造的内容之间的界限,引发就业、创造力和版权规则的新范式。

使生成式人工智能更加透明并且能够检测和识别机器生成的内容,对保持数字技术和媒体的信心至关重要,从而增强对欧洲数字生态系统的信任。本简介旨在回顾实现这一目标的四种技术解决方案,它们根据四个理想特性进行评估:

效率:通过检索提供商名称、创建日期或用于身份验证的数字签名等信息,可靠地识别生成的内容。该过程应尽量减少工作量和时间,并随着时间的推移保持一致。

数据完整性:保存内容的完整性,即限制原始数据的退化或失真。

内容更改的稳健性:当内容受到可预见的改变或变更时,能够保持效率,并且不会影响内容的合成性质,也不会改变内容的整体外观或可解释性(例如,图像的亮度或音频的音量)。

防止篡改:能够抵御任何旨在操纵用于识别目的的信息的修改,无论是更改识别元素还是删除信息。

一、生成式人工智能的透明技术

元数据

元数据是嵌入在计算机文件中的数据,提供有关内容的信息,例如版权或所有权详细信息、时间戳、唯一标识符或与内容相关的数字签名评估:(1)识别:读取元数据非常简单,几乎不需要花费任何精力。但是,这种方法需要使用接受元数据的格式,例如 PNG、JPG、MP3 或 PDF。虽然这在生成音频或图像时很常见,但对于返回原始文本的文本生成来说,通常并非如此。(2)数据完整性:元数据不会改变内容,并且是单独存储的。(3)内容更改的稳健性:更改内容不会影响元数据。但是,元数据中的某些信息可能需要更新才能反映变更。(4)防止篡改:元数据很容易被篡改或从文件中删除。加密签名可以保护元数据中的信息免遭未经授权的更改。

水印

水印技术将元数据作为不可见或几乎不可察觉的标记嵌入到内容中。水印可以在媒体内容生成期间进行,也可以在之后作为后处理步骤进行。一些方法还尝试在训练阶段加入水印,以便 GenAI 系统固有地生成带水印的内容。评估:(1)识别:水印需要特定工具来验证真实性、检测篡改或证明所有权。(2)数据完整性:水印技术会改变内容。但是,水印可以设计成对内容质量的影响最小,特别是对于如图像某些形式。(3)对内容更改的稳健性:水印对内容的修改很敏感,这可能会降低或阻止识别。(4)防止篡改:故意篡改数据以删除或更改内容中的水印是可能的,这已在科学著作中得到证实。可以考虑使用额外的保护层(例如加密)来限制这种风险。

指纹识别

在 GenAI 透明度的背景下,指纹识别包括生成并存储在外部数据库中生成内容的唯一标识符,称为指纹或哈希(hash)。评估:(1)识别:识别过程包括计算要识别的生成内容的指纹,并将其与已知指纹列表进行比较。(2)数据完整性:指纹识别不会改变内容,除非它明确地以水印形式存储。(3)内容更改的稳健性:指纹识别对内容的修改非常敏感,这可能会导致不同的指纹和错误的识别。(4)防止篡改:即使内容没有明显变化,故意的修改也可能导致不同的指纹。

检测

基于人工智能的检测工具是使用机器学习分类技术构建的,并针对人造和机器生成的内容进行训练 。只要有足够的示例来训练检测器,它们就可以应用于任何类型的数据。评估:(1)识别:识别过程包括将内容输入检测器。然而,目前检测生成内容的技术误报率很高,可能会误判人工生成的内容。(2)数据完整性:这种方法不需要改变内容。(3)对内容更改的稳健性:检测对内容的修改很敏感,需要不断更新以适应新一代 GenAI。(4)防止篡改:与任何人工智能系统一样,可以构建逃避攻击来误导检测器并使其返回错误的预测。

二、开源

开放性促进了创新文化,使开发人员能够迭代关键想法并逐步开发越来越先进的系统。然而,当 GenAI 模型是开源时,删除元数据、指纹或水印可能就像删除一行代码一样简单,从而为潜在的恶意使用提供了便利。如果使用的任何方法(元数据、指纹、水印或检测)也是开源的,恶意行为者可能会分析代码以找出绕过识别生成内容的机制的方法。

解决问题最有效的方法是将识别机制集成到生成过程中,例如,通过在 GenAI 模型中嵌入水印或通过在训练数据集中的所有图像上添加水印,这样 GenAI 模型本质上就会生成带水印的内容。还可以实现混合开放-封闭方法,其中一端可以开放而另一端保持封闭。例如,开放水印代码和封闭水印检测,反之亦然。

三、讨论

GenAI 的透明度措施受到当前技术水平的限制,并且没有单一的解决方案能够适合所有需要识别稳健且可靠的生成内容的属性。

更好的方法是在特定情况下应用多种技术,同时考虑技术和法律因素,包括模型类型、透明度措施的局限性、提供商的义务、平台的现行做法以及处理潜在生成内容的组织。特别是,依赖数字签名的解决方案需要设置合适的公钥基础设施 (PKI) 以及处理提供商密钥分发所需的组织程序。此外,技术实施可以留给提供商,或者在专用标准中指定以促进互用性。

如何获取报告?

关注本公众号:图灵财经

时间:2024年5月

编辑:田章功


精彩推荐


欧盟理事会最终通过《人工智能法》,全球首部人工智能法案即将生效
图灵奖得主《Science》发文:人工智能飞速进步时代的风险管理
欧盟发布《科研领域负责任使用生成式人工智能指南》
联合国:《以人为本的人工智能治理》
联合国教科文组织发布《教育与研究领域生成式人工智能指南》


更多精彩内容

继续滑动看下一个
图灵财经
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存