查看原文
其他

Facebook黑科技,用人工智能让盲人“看”到照片!

2016-04-07 硅谷来信 IT耳朵

在当今的社交网络上,图片是主流大军;Facebook则顺应潮流,推出了一套全新系统:能“读”图,并告诉视力受损者图片上的信息。

互联网正在变化。其最初的信息载体几乎是纯文字,而现在,大量的图片开始取代文字,成为了传达信息的主要媒介。据估计,在Twitter、Instagram 和Facebook这类的社交网站上,用户们每天大概会上传18亿张图片。

对摄影师来说,这无疑是好消息;但对于盲人或是视力受损者来说,这必然是更大的打击——虽然有现代辅助技术,他们还是没法知晓图片上的内容。

但是,Facebook于本周四推出的一项新服务——“人工智能识别图片”,将为盲人及视力受损者打开新世界的大门。

在人工智能领域,识别并描述图像是重要的研究范畴。而新科技和相关软、硬件的出现,得以让我们进行更深度的研究学习,同时可以让我们通过人工神经元网络层对数据进行整理,进而找出它们之间的相关模式。借助于上述技术,人工智能能帮助我们更好地识别图像。

盲人使用电脑,需要借助复杂的导航软件,即所谓的屏幕阅读器。屏幕阅读器可以将电脑屏幕内容转化为语音输出或是盲文输出;但是,其只能识别文字,无法解读图片。

而利用人工智能技术,Facebook的服务器目前已经能够将页面上的图片解码并识别描述,同时可以将图片转换为屏幕阅读器可读模式。比如,网络上有人发了一张“披萨”的照片,Facebook的人工智能算法便会自动将披萨二字作为替换文本加入图片,屏幕阅读器便可以将此信息传递给用户。社交网络上的大部分用户是无法看见该转换信息的,但盲人或视觉受损者可以通过该方法“看到图片”,这对他们来说是巨大的福音。

但是考虑到Facebook的影响范围,识别精确性才是最重要的。

在Facebook, Instagram, Messenger 和WhatsApp上,每天都有将近20亿张图片被分享传阅,因而一个小错误就意味着成千上万个错误的出现。并且,在识别图像时,人工智能系统产生的错误可能会造成严重的后果——在去年,Google’s Photos这一图片识别应用就曾将两个黑人识别为大猩猩;为尽量避免此类错误并保证精确性,Facebook工作人员花了将近十个月的时间,对仅仅100种物体进行了大量的、反复的测试。目前,其准确率是在80%~90%之间。

Facebook表示该软件目前已经能识别80多种日常物品及活动。其会在每张照片下面用替换文本添加描述,并且,它浏览的图片越多,精确度就会越高。

这项新科技目前能识别的物体包括:

  • 交通类——汽车,船,飞机,自行车,火车,道路,摩托车,公共汽车

  • 环境类——户外,山,树,雪,天空,海洋,水,海滩,海浪,太阳,草

  • 运动类——网球,游泳,体育场,篮球,棒球,高尔夫

  • 食品类——冰淇淋,寿司,披萨,甜点,咖啡

  • 外貌——婴儿,眼镜,胡子,微笑,珠宝,鞋子,自拍

这项新技术的研发者是Facebook的一名工程师——Matt King,他因患色素性视网膜炎而失明。

“在Facebook,大部分事物都是视觉化的;因而作为盲人,就能切身体会到那种在谈话中被忽略的感受,就好像你不在这个集体当中,”King说。

King和他的团队在这项新技术的研发过程中运用了Facebook内部的物象识别软件来破译图片中包含的内容。该软件被用于训练识别一系列物品,诸如食物、汽车之类。

“我们的人工智能技术已经到了新阶段——让电脑以有意义的方式传递图片信息已成为可能。这项技术仍处于起步阶段,但它给了我们前进的方向,我们的目标是让每个想加入谈话的人都能加入其中。”

目前,该系统只能以很基础的语言对图片进行描述,例如:“这张图中有两个人,他们在微笑。”

Facebook可以从中识别到:披萨、食物等信息

上个月,Twitter也推出了相似的功能——用户可以手动为图片添加描述性的文本。这样的描述或许更准确,但是它需要用户主动添加文字内容,而Facebook的新系统则可以为每张照片自动贴标签。

King和Facebook想要走的更远,他们希望借助于自身的用户数据库,使用人脸识别来鉴别图片中的人物;但是有人出于隐私考虑对此发出抵制。

Jeff Wieland是Facebook可访问性项目组的负责人。他表示当前社交网络正对可访问性研究大力投资,并针对不同人群制定不同策略,以便让各类型用户都能在社交网络上获得相对完整的用户体验。并且,将有专门的团队进行此方面的研究,希望能让所有人群都参与到社交网络中。从另一层面看,这也有利于促进平等。

这些设想的实现和对未来的憧憬都依赖于人工智能的进一步发展,而人工智能的发展取决于人类的需要,毕竟其最终目的是服务人类,便捷我们的生活。借助于人工智能,人类将走的越来越远。

[硅谷来信]是IT耳朵外媒编译团开辟的新栏目,旨在传播最新最热的海外智能硬件资讯。本期来信作者:叶飞扬,题图来自:IBTimes


往期文章

闪充闪放 360双涡轮引擎移动电源使用体验

谷歌人工智能计划:解剖智慧,然后解决一切

360 F4手机测评:治愈强迫症,对称感十足



往期周报

【耳朵周报】聊天机器人Tay刚上线就学坏了,会讲脏话和种族歧视(无文字版)

【耳朵周报】谷歌将敦促美国国会为无人驾驶汽车开绿灯(语音版)

【耳朵周报】三星S7/edge发布但不够惊艳(语音版)

寻求报道/测评请加微信:onetyl,商务合作请加微信:15210097277

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存