查看原文
其他

从Pixel 3a到Android Q,一份谷歌AI能力的“成绩单” | Google I/O全程回顾

琥珀 AI科技大本营 2019-05-25


作者 | 琥珀

出品 | AI科技大本营(ID:rgznai100)


当地时间 5 月 7 日上午(北京时间 5 月 8 日凌晨一点),一年一度的 Google I/O 开发者大会如期而至。今年也是 Google 旗帜鲜明推行 “AI First” 战略的第四个年头。


让我们不妨先来盘点下从 2016 年起过去三年间 Google  I/O 开发者大会亮相的重磅 AI 产品:


  • 2016 年:Google Assistant(智能语音助手)、Google Home(智能音箱)、TPU 1.0(为机器学习而设计的专用芯片)。


  • 2017 年:Google Assistant(升级版)、Google Home(升级版)、TPU 2.0、TensorFlow Lite(深度学习框架,针对移动和嵌入式设备)、Google Lens(图像识别 OCR)、Google Photos。


  • 2018 年:Google Assistant(升级版,使用 Duplex 技术)、Google Maps(融入 AI 技术)、Google Lens(升级版,可关联场景)、TPU 3.0、Google News(个性化推荐消息)、Gmail(智能补充邮件)、Waymo(无人驾驶技术持续进展)。


实际上,在每年开发者大会结束之后,Google 并非结束了新产品、新功能、新技术的持续迭代和升级,相反,几乎每过一段时间我们都能看到 Google 研发团队在人工智能等新技术上的突破。例如,AI 科技大本营此前报道的“Google 最强 NLP 模型 BERT”、“开源机强化学习框架‘多巴胺’”、“让数百万台手机训练同一个模型的 TFF、“降低机器学习门槛的 Cloud AutoML”、“将 AI 芯片装进 IoT 设备的 Edge TPU”。


说了这么多,在营长苦守近两小时的 Google I/O 现场中,我们再来看看 2019 年 Google I/O 又将带给我们怎样的“惊喜”呢?



Build a more helpful mode for everyone.(“让谷歌更好地为大家服务。”)有意无意地,Google CEO Sundar Pichai 对外透露了 Google 在全力投入 AI 后希望做的事情。 


Android Q


截止目前,已有将近 25 亿台基于 Android 操作系统的设备,其中,智能手机已经成为了人们生活中不可获取的一部分。Android Q Beta 3 将在本次大会上推出,Google 也将面向包括中国企业华为、小米、OPPO 等在内的 12 个第三方手机制造商的 21 款设备推出 Android Q 的测试版。今年晚些时候,这一数字还会翻倍。



Google 目前将从两个方向的新技术进行创新:一是可折叠屏,帮助用户处理多事物,这将改变移动的未来;二是 5G 技术的提升,带来融入式的体验改变。


当然,除了硬件创新,在软件层面也将引入机器学习技术,主要应用以下几个方面:


一是 Live Caption,可实时语音识别,并生成字幕。



二是 Smart Reply,可智能预测用户行为,并进行消息回复。(可本地学习,保护用户隐私。)


三是 Dark Theme,即暗模式,不仅省电,还能延长电池寿命。



四是 Focus Mode,即专注模式,既适用于 Android Q,也适用于 Android P。


此外,还将针对性提供 50 多项专注于提高安全和隐私的保护的功能,如地图隐身模式,以及低端设备的 TLSV3 加密。当然,Google 表示这是一种“在设备上进行的机器学习”,用户本身可以控制隐私信息的流向。在 Gartner 最新安全报告中,Android 在 30 个类别中,拿下了 26 个类别的最高分。


Pixel 3a


实际上,关于 Google 自家产品 Pixel 3a 已经不是秘密了。


Pixel 3a 将推出白色、黑色、浅紫色三款手机色调,电池续航时间为 30 小时,充电时间仅为 15 分钟,充电时间为 7 小时。Pixel 3a 目前售价为 229 美元。



不过,重要的不是以上这些,而是该款机型将是首批提供 AR 地图模型的设备之一,即利用手机屏幕、摄像头和 GPS 组件为现实世界提供方位标记。此外,还将利用 NLP 等深度学习技术过滤骚扰电话。



拍摄画面对比,必然免不了吐槽下友商苹果。



Nest Hub Max


为了能给用户 “建立一个真正能帮助你的家”,Google 也是操碎了心,放弃了之前智能音箱“Google Home” 的称呼方式,而改叫做 “Nest Hub Max” 这款新产品,意味着对用户安全隐私的承诺。



特征上来看,大摄像头,10 英寸显示屏,是典型标志。而内置的 Nest Cam 广角镜头安全摄像头,有人猜测不是因为隐私,而是成本削减的考虑。


例如,用户进行视频通话时,可直接通过切断该设备背后的滑块实现对摄像头和麦克风的关闭,或者通过一个简单的手势就可以暂停,以保护隐私。目前该设备售价 229 美元,将在今年夏天上市。


Google Assistant


接下来,备受争议和瞩目的 Duplex 来了。去年的 Google Assistant 因为 Duplex 而大出风头,今年又会带来怎样的惊喜呢?

 

除了在手机上外,目前 Google Assistant 还可以在网页上使用。


谷歌一直尝试压缩和简化 Google Assistant 在处理语音命令时从云端访问 AI 时所占用的空间。因为每个语音请求都要通过三个独立的模型进行处理,以便正确理解语音命令,谷歌则将原来的 100GB 压缩到仅为 0.5GB 的存储空间。在这个基础之上,将降低语音请求和用户触发执行任务之间的延迟,真正做到“实时”。



而它也将应用在驾驶模式中,用户通过声音便可安全控制导航等车内环境,任何装有 Android 操作系统的软件都可以应用。


今年晚些时候将会推出。


Google Lens


利用图像识别将相机中的图像转变为用户可以直接获取的信息,即“看图说话”。GoogleLens 可集成到 GoogleAssistant 和 GooglePhotos 中。



现场演示了 Pichai 演示了 Google Lens 现有的能力:根据已有地图数据,Google Lens 可以向用户推荐餐厅菜单。


对隐私安全的保护措施


关于用户隐私安全的防护,不仅是 Pichai 包括在场的几乎每一位演讲嘉宾都提到这个词,并从技术上进行了改进。


一是 TCAV。



Pichai 概述了一系列人工智能增强功能,并将更多的机器学习模型应用于设备上,但对于开发人员和数据科学家来说,更大的收获可能就是 TCAV。TCAV 是“使用概念激活向量进行测试”(Testing with Concept Activation Vectors)的简称。简而言之,TCAV 是一种可解释性方法,用于了解神经网络模型用于预测的信号。


对谷歌来说,机器学习的透明度很重要,这其中就会涉及到语音助手 Google Assistant。


二是隐身模式 Incofnito Mode。


这可以保障用户搜索过或导航过的位置数据不会泄露。


三是联邦学习 Federated Learning。



值得一提的是,Google Brain 负责人 Jeff Dean 最后上场,他主要分享了团队利用 AI 在医疗领域的尝试和工作。


Dean 举例说明了对泰国和印度数千名患者进行糖尿病并发症的筛选工作,此外还有预测洪水,模拟洪水发生的情况,以提高模型的准确度。


总结


实际上,这一年,我们经历过了 Google 痛失几员 AI 大将,先是谷歌云人工智能专家、谷歌 AI 中国中心的两位核心人物李飞飞、李佳出走,后又是前搜索兼 AI 高级副总裁 John Giannandrea 被苹果挖角,直到不久前 GANs 之父 Ian Goodfellow 被爆离开。很难想象,在痛失如此之多人工智能专家的同时,包括Google 自身在内,其掌舵者 Sundar Pichai 也遭遇不少的内外质疑,Google 在 “AI First” 道路上依然充满着挑战。


不过,在全球科技媒体界的全体高潮的同时,是否可以冷静下来思考,每逢 Google I/O 开发者大会,究竟能为我们的技术关注着、开发者、甚至是消费者带来哪些真正的价值呢?


对此,你对今年的Google I/O 开发者大会又是怎么看待的呢?如果你正身在美国加州山景城的大会现场,也欢迎参与到更多我们的互动中。


(本文为 AI科技大本营原创文章,转载请联系原作者)


CTA核心技术及应用峰会


5月25-27日,由中国IT社区CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会将在杭州国际博览中心隆重召开,峰会将围绕人工智能领域,邀请技术领航者,与开发者共同探讨机器学习和知识图谱的前沿研究及应用。


更多重磅嘉宾请识别海报二维码查看,目前会议早鸟票发售中(原票价1099元),点击阅读原文即刻抢购。添加小助手微信15101014297,备注“CTA”,了解票务以及会务详情。



推荐阅读

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存