AI (人工智能)正在监视你
信息安全公益宣传,信息安全知识启蒙。
加微信群回复公众号:微信群;QQ群:16004488
加微信群或QQ群可免费索取:学习教程
教程列表见微信公众号底部菜单
人工智能的快速发展,给人们的生活带来了极大的变化,监视系统正是其中之一。传统的监控设备只能充当于法庭上的佐证,且要耗费大量的人力成本,有了基础研究、计算能力和训练数据集等人工智能技术的引入,现在的监视设备应用场景越来越丰富了。本文就以 IC Realtime、Boulder AI 两个项目的实践成果为例,详细阐述了 AI 监视设备的前景、问题及思考等内容。一起来看看吧。
监控摄像机一般被称为数字化的眼睛,人们可以通过它们观看各种视频节目、观看实况视频等等。当然,大多数监控摄像机是被动的——它们被放置在那里作为一种威慑,或者在出现问题时提供证据,比如车被偷了?那就检查闭路电视吧。
但是,现在事情发生了很大的变化,人工智能使得监控摄像机能够与数字大脑相匹配,让它们可以自行分析现场视频,而不需要借助人类的帮助。这对于公共安全来说可能是个好消息,帮助警方和急救人员更容易地发现犯罪和事故,并且能够带来一系列的科学和工业应用。但是这也给未来的隐私问题提出了严重的思考,给社会正义带来了新的风险。
试想一下,当政府可以跟踪大量观看闭路电视的用户信息时、当警察可以通过将你的照片上传到数据库来数字化尾随你的城市动向时、或者当警察不喜欢某个特定人群的表情而在当地商场的摄像机上运行有偏见的算法时......这些情况下,会发生什么?
AI 监视从搜索视频开始
虽然以上这些情景的实现还有一段路要走,但我们已经看到了将人工智能和监控结合起来的第一批应用成果,IC Realtime 就是一个例子。去年 12 月份,IC Realtime 的旗舰产品一经推出便被誉为闭路电视领域中的谷歌。这是一个名为 Ella 的应用程序和网络平台,它使用 AI 来分析视频 Feed 中发生的事情,并且能够即时搜索。Ella 可以识别成千上万的自然语言查询,并为用户提供大量的搜索素材,比如找到特定的剪辑视频、穿着某种颜色衣服的人、甚至个人汽车的品牌和型号等等。
在一次网络演示中,IC Realtime 首席执行官 Matt Sailor 演示了 Ella 的功能,它连接了约 40 个工业园区的监控摄像机,并进行了“一个穿红衣服的男人”、“UPS 货车”、“警车”等各种搜索尝试——所有这些都在几秒钟内返还了相关的镜头。
“假如发生了抢劫,但你还没有意识到事情的发生,” Sailor 表示, “但这时有一辆吉普车恰巧经过,那我们在 Ella 中搜索“吉普车”,屏幕上就会显示不同的吉普车经过的场景——这将是人工智能和闭路电视结合的第一大优势”。Ella 在谷歌云上运行,几乎可以从任何闭路电视系统中搜索镜头。Sailor 认为,这个技术的应用能让你很容易地找到你要找的东西,而不需要在那筛选好几小时的视频。
IC Realtime 已经在亚马逊、Logitech、Netgear、谷歌旗下的 Nest 等公司生产的“智能”家庭安防摄像机市场中获得了巨大的成功。
使用 Ella 搜索穿红色衣服的人
“我们现在在爱达荷地区的识别准确率高达 100%”
虽然 IC Realtime 提供了基于云的分析功能,可以升级现有的傻瓜相机,但其他公司更多采取的是将人工智能直接构建到硬件中——将 AI 集成到设备中的一大优势是,它们不需要互联网连接即可工作,Boulder AI 就是这样一家初创公司,它使用自己的独立 AI 摄像头销售“愿景即服务”,并且可以为个人客户量身打造机器视觉系统。
其创始人 Darren Odom 给出了一个爱达荷州建造水坝的客户例子。为了符合环保法规,他们正在监测鱼类移动的数量。Odom 说:“最开始他们有人坐在窗台上看着有多少鳟鱼游过,后来他们改用了监控视频,由负责的人来远程观察。”最后,他们联系了 Boulder AI ,帮助他们建立了一个定制的人工智能闭路电视系统来识别鱼类。Odom 自豪地说:“我们确实使用计算机视觉确定了鱼类的识别,现在在爱达荷州地区的鳟鱼识别准确率更是高达 100%。”
IC Realtime 代表了通用终端市场,Boulder AI 代表了承包商市场,不过,在这两种情况下,这些公司目前所提供的也仅仅是冰山一角。就像机器学习在识别物体的能力方面取得迅速的进步一样,基础研究、计算能力和训练数据集等创建人工智能的关键组成部分都已到位,分析场景、活动和动作的技能也有望迅速提高。视频分析的两大数据集是由 YouTube 和 Facebook 制作的,他们也希望人工智能能帮助他们在平台上优化更多内容。例如,YouTube 的数据集包含超过 45 万小时的标签视频,希望能够刺激“视频理解的创新和进步”。谷歌、MIT、IBM 和 DeepMind 都参与了类似的项目。
目前,IC Realtime 已经在开发面部识别等高级工具,Boulder AI 也正在探索这种先进的分析技术。
最大的障碍还是:低分辨率的视频
对于监视和人工智能方面的专家来说,这些功能的引入在技术和道德方面都存在一些潜在难题。和 AI 一样,这两个类别是交织在一起的——它是一个技术问题,机器不能像人类那样理解世界,但是当我们让他们为我们做决定时,它就变成了一个道德问题。
尽管近年来人工智能已经使这视频监视领域取得了巨大的进步,但在计算机理解视频方面仍然存在着根本性的挑战。举个例子来说,一个经过训练的神经网络可以分析视频中的人类行为,这些工作是通过将人体细分为多个部分:手臂、腿部、肩部、头部等,然后观察这些小人物从一帧视频到另一帧的变化。从这个角度来看,AI 可以告诉你是否有人在跑步——但这取决于你所拥有的视频分辨率。
这对闭路系统来说是一个大问题,因为摄像机往往暗转的角度往往很怪异。以便利店的照相机为例,这个便利店的目的是收银机,但是它也忽略了面向街道的窗户。如果外面发生抢劫,相机被挡住了,那么 AI 就发挥不了作用了。
由中国公司 SenseTime 构建的人工智能监控系统
同样,虽然人工智能能够很好地识别视频中的相关事件,但仍不能提取重要的上下场景。拿分析人类行为的神经网络为例,可能会看到镜头显示“这个人正在跑步”,但它不能告诉你他们是否真的在跑步,因为他们或许错过了某辆公共汽车,或者是因为他们偷了某人的电话。
这些准确度问题值得我们反思,电脑与人类的洞察力和理解视频所看到的东西相比相差甚远。不过,技术的进步速度很快。使用车牌跟踪车辆,识别汽车和衣物等物品,在多台摄像机之间自动跟踪一个人——这些识别场景已经非常稳固了。
目前仍有很多 AI 监视难题亟待解决
但是,即使这些非常基本的场景应用也可以产生强大的效果。华尔街日报的一份报告称,在中国新疆,传统的监视和民间监控方式与面部识别、牌照扫描仪、虹膜扫描仪以及无处不在的闭路系统相结合,形成了一个“完全监视状态”,能够追踪公共场所中的任何人;在莫斯科,正在组装一个类似的基础设施,将面部识别软件插入一个集中了超过 10 万台高分辨率相机的集中系统,该相机覆盖了该市 90% 以上的公寓入口。
这种情况可能会带来一个良性循环,随着软件越来越好,系统会收集到更多的数据,从而帮助软件变得更好。
这些系统确实正在起作用,但是还有很多问题亟待解决,比如算法偏差。研究表明,机器学习系统能够吸收种族和性别歧视,从对妇女进行厨房的图像识别软件到总是说黑人更容易犯罪的刑事司法系统等都有体现。如果我们使用旧视频来培训人工智能监控系统,比如来自闭路电视或者警察机构的摄像机,那么存在于社会中的偏见很可能会延续下去。
ACLU 高级政策分析师 Jay Stanley 说,即使我们能够解决这些自动化系统中的偏见,也不能使他们变得良性,因为,将闭路电视摄像机从被动转变为主动则可能会对公民社会产生巨大的不利影响。
“我们希望人们不仅是自由的,还要更加自由自在的”
我们希望人们不仅是自由的,还要感到更加自在的。这意味着他们不必去担心未知的、看不见的“观众”来随意解释或曲解他们的每一个动作和话语——也就不会给他们的生活带来负面的后果。
此外,人工智能监控的错误警报也可能导致执法部门和公众之间的矛盾更加激化。比如说,丹佛剃须刀的枪击事件中,一名警察就将用于害虫控制的药丸枪看成了剃须刀,结果导致了误杀。如果一个人可以犯这样的错误,那么电脑又怎么能避免呢?而且,如果监控系统变得自动化了,那么这样的错误只会变得越来越普遍。
当 AI 监督越来越普及,谁来管理这些算法呢?
事实上,我们在这个领域看到的只是人工智能应用趋势的一部分,在这个趋势中,我们使用这些相对粗糙的工具来对人们进行尝试和分类,但是结果的准确性是值得怀疑的。
“令我感到不安的是,许多这样的系统正在应用到我们的核心基础设施之中,但是却没有一个民主的程序来衡量问题的有效性和准确性。”算法确实能够提供基于嵌入文化和历史偏见的数据中提取的模式识别类型,但也不可避免地带来了人工智能监控被滥用的问题。
对于这个问题,IC Realtime 给出了科技行业常见的一个答案:这些技术是价值中立的,因为任何新技术都有可能落入不法之徒的危险之中,这无法避免,但是它所带来的价值绝对是高于它的缺点的。