查看原文
其他

ProAcoustics丨裸行“人工智能”世界,如何保护您的私人数据和信息。

ProAcoustics Prosynx 2023-02-13

一种新的机器学习模型将“噪音”放入个人图像中,以阻止人工智能程序利用和误用你的数据
 

你可能没有意识到这一点:未经您的同意,你在社交媒体上发布的图像,包括你的个人资料,都会被收集起来,用于训练由机器学习驱动的面部识别系统 — — 一种人工智能(AI:Artificial Intelligence)。


 
有了这些你现在几乎无法控制的数据,这些系统很容易被用来或误用来识别你和你的朋友,例如,从闭路电视录像中。

人们几乎无法控制自己的数据以及数据如何被使用或滥用。图片来源:Jae Rue/Pixabay
 
但是,如果有一种方法可以保护您的数据,同时仍然可以自由使用它,这样您的朋友仍然可以看到您的照片,但 AI 系统却无法利用这些相同的图像呢?
 
一项新的研究表明,我们实际上可以通过使用人工智能对其自身进行最小程度的调整来实现这一点,从而使其有效地“无法被人工智能学习”。
 
研究人员设计了一种基于机器学习的技术,可以识别和改变图像中足够多的像素来混淆人工智能,并将其变成“无法学习”的图像。这种变化非常小,人眼无法察觉,但它在图像中引入了足够的“噪音”干扰,使其对训练 AI 毫无用处。
 
使用这种技术,您可以简单地用不可学习的噪声标记您的数据,以防止它被利用。
 
现代人工智能系统基于人工神经网络,这些网络是受人脑工作方式启发的计算机程序。与人类类似,如果人工智能正在学习识别猫,这些人工神经网络通过反复浏览示例来学习执行任务 — — 比如猫的图像。
 
对于每个示例,程序都会稍微调整其参数以改善结果。这就是“训练”人工智能的含义。研究人员使用术语“深度神经网络”来区分复杂的现代人工神经网络。

现代人工智能系统的灵感来自人脑的工作原理。图片来源:Getty Images
 
这种深度机器学习现在被广泛使用 — — 从驱动搜索引擎到指导医疗手术。
 
训练深度神经网络的一个关键挑战是,这些程序通常需要大量数据来学习。互联网上丰富的“免费”数据为此提供了一个简单的解决方案。
 
庞大的数据集随手可得,例如8000万个小图像集合和ImageNet,但它们带来了严重的隐私和偏见问题。
 
目前此项技术利用了深度机器学习模型的一个关键弱点— —它们是懒惰的学习者。如果模型认为一个例子没有提高它的性能 — — 所以,这是一个它已经学习过的简单例子 — — 它会忽略它。
 
这个弱点激发了模型的设计— —研究人员引入的噪声愚弄了深度神经网络,让他们相信没有什么可以从受保护的图像中学到的。
 
此外,研究人员对噪声设置了约束,以确保人眼无法察觉。通常,一个人不会注意到小于16个像素值的图像的微小变化,但是,这种微小变化足以破坏模型的学习行为。
 
如果有人使用不可学习的数据来训练深度学习模型,该模型的性能就会很差,以至于几乎只是对新数据进行随机猜测。

顶行是研究人员的原始照片,底行被修改为“无法学习”人工智能的图片

 
还应该可以使用类似的技术来保护其他类型的数据。
 
以音频为例,我们可以使用声压级作为衡量原始音频和不可学习音频之间差异的指标。
 
声压级的微小变化对于人类来说是无法区分的,但这种变化会使机器无法学习音频数据。
 
现在还为时尚早,但我们相信这代表了个人数据保护的一个阶段性变化,该技术有几个潜在的应用。例如,您可以在Internet上共享之前创建无法学习的图像,从而保护您自己和您的朋友。
 
当使用您无法学习的在线社交媒体图像和未经修改的图片训练的面部识别模型被图像通信系统捕获时,面部识别系统将不再识别您。
 
在更大范围内,公司可以发布受保护的专有数据,而不必担心这些数据会用于训练深度学习模型。
 
目前此项工作只探索技术挑战并开辟可能性。对于现实世界的应用程序,仍然需要做很多工作,比如开发一个每个人都可以使用的应用程序。
 
但这是可行的。
 
人们拥有控制自己数据的“数字权利”。就像您可以保护您的房屋一样,您应该能够保护您的数据。
 

作者墨尔本大学Sarah Monazam Erfani博士,点击阅读原文查看全文。




● 比翱工程实验室装备指南丨构建材料声学研究高地与实验验证平台

 预见 · 新静界丨P+M 材料声学特性测试与分析系统2021版本亮相

● 比翱工程实验室丨声学材料的表征与建模丨视频教程

● SAPEM 2023丨材料声学技术全球大会将在中国举办

● ProBiot Acoustics丨比翱实验室,加速材料技术革新与工程赋能

● 普信科技受邀出席中国仿真学会人工智能仿真技术专业委员会成立大会

● Fraunhofer IDMT,基于人工智能技术开发声学质量控制软件


免责声明:部分资料来源网络,转载目的在于传递信息及分享,并不意味赞同其观点或其真实性,也不构成其他建议。仅提供交流平台,不为其版权负责。如涉及侵权,请联系我们及时删除。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存