查看原文
其他

【兴业计算机袁煜明团队】乌镇人工智能高峰论坛现场纪要

兴业计算机团队 2022-07-03

作者:袁煜明/蒋佳霖/徐聪/雷雳/陈冠呈/洪依真

介绍


我们有幸参加了5月24日在乌镇进行的人工智能高峰论坛,聆听了包括Alphabet董事长Eric Schmidt、Deepmind CEO Hassabis,以及众多优秀创业公司高管的精彩分享。分享分为上下午两部分。

分享要点包括:

1. Google认为AI是其最重要的方向;

2. Google认为AI目前最有价值能起来的应用领域是医疗,已经做了很多针对性工作,下一步是临床试验;

3. Google很想推销他的TPU和tensorflow,感觉核心是通过TPU和谷歌云变现;

4. Deepmind最自豪的Alphago的能力是创造力;

5. 这次的AlphaGo是单机版,40层卷积网络(李世石版12层),而且的确是自我对弈版本,可以让李世石版本3子。

上午场:

DeepMind CEO Demis Hassabis

AlphaGo团队负责人&首席科学家Dave Silver

Alphabet 董事长 Eric shmidt

谷歌翻译 软件工程师 陈智峰

Google Brain 资深研究员 Jeff Dean

 

圆桌论坛:

浙江大学计算机学院副院长 陈刚

Google Brain 资深研究员 Jeff Dean

北京邮电大学计算机围棋研究所所长 刘知青

谷歌Cloud&AI 研发主管 李佳

主持人:第一财经传媒集团CEO 周健工


下午场:

元趣科技 CEO 吴义坚

出门问问 产品副总裁 林宜立

吉利汽车研究院只能驾驶开发中心总监 李博

旷视Face++ 副总裁 谢忆楠

Deepmind 联合创始人 Mustafa Suleyman

谷歌研究产品经理 彭浩怡

清华大学生医系博士生 李哲 廖方舟

流利说 创始人 王翌

 

乌镇智库秘书长 李小鸣:《全球人工智能发展报告2017》

上午场

分享者:DeepMind CEO Demis Hassabis

Deepmind于 2010年成立,2014年卖给谷歌。

我们做的是通用型人工智能,或者说强人工智能。这和市场上很多别的不太一样,像IBM开发的打败国际象棋世界冠军的深蓝是预设好的程序,并没有自己学习决策,是弱人工智能。

智能体有个特定的目标,通过传感器(视觉、语音、触觉等)去观察环境,对环境进行建模,当然很多时候没法全面观察;然后针对环境觉得采取什么行动能完成目标,而且这里的一个问题是行动有可能改变环境。

我们的第一个智能体是雅达利智能体,我们用的是深度强化学习,我们没有教机器如何玩游戏,提供的只有控制器、显示器和得分规则,机器就自己学会了玩雅达利的游戏并能取得高分。这发生3年前,然后就开始研发AlphaGo下围棋。

一、AlphaGo的难点和意义

为什么计算机下围棋非常困难?因其复杂程度让穷举搜索难以解决。围棋不像象棋等游戏是靠计算机的,而是靠直觉的。其中两项难题:不可能写出评估程序决定谁赢;搜索空间太过庞大。

为什么围棋比象棋难下?围棋中任何棋子都一样,没法把不同棋子来做好坏评估;象棋最开始棋盘是满的,后面化繁为简,围棋最开始棋盘是空的,后面越来越复杂。围棋中一个棋子可能撼动全局,这也是象棋没有的。

去年和李世石的比赛非常成功,万人空巷,当时有28亿观众观看这个比赛,3.5万报道,围棋在西方也有了很多的普及,棋盘的销量有了10倍的增长。和李世石比赛第二局的37步5路肩冲,是我们最喜欢的,说明AlphaGo也很有创造力,后面的50手也受到了37手的影响。李世石也受到了很大的启发,第4局时绝伦的78手,可以看出李世石的天赋。

从结果看AlphaGo具备了直觉和创造力,直觉无法表达但可以通过行动来验证对错,创造力已经具备了,虽然领域还有限。

今年Master的60局也很精彩,表现出了很多创造力,和辜梓豪的比赛里点三三,和朴廷桓的比赛里在二路爬了很多手。

吴清源曾经开创了围棋的新时代,AlphaGo有可能带来围棋新的战略,给人们带来新的启示。

我刚读完了卡斯帕罗夫的书,其中写到深蓝已经结束,AlphaGo才刚开始。我觉得他说得不错。我们在Nature发表了论文,很高兴其他公司,包括很多中国公司把这些技术应用到AI里,已经水平很不错了。

人机合作,可以实现1+1>2.人工智能,AlphaGo都是工具,就像望远镜,可以推进我们的文明。

二、未来的应用:

1. 研发上:材料设计、新药研制。这些都有很多排列组合的方式,AlphaGo的创造力很有用。

2. 现实应用:医疗、教育、智能手机。我们已经用来做数据中心优化,节省15%的电能,进而节约40%的冷却资源

建立人工智能将有助于我们更好的理解人脑的奥秘。作为神经科学科学家,我也对人脑的奥秘很感兴趣。

最后,我也要警告一句,人工智能要被恰当的应用。

 

分享者:AlphaGo团队负责人&首席科学家 Dave Silver

为什么选择围棋?围棋是人类历史上最古老、研究最深入的游戏,是构建和理解运算的最佳试验台,对于围棋人工智能面临巨大挑战,没法进行穷举搜索。

AlphaGo用卷积神经网络,可以摄取棋局图像,从而来进行判断,因此会有全局观。

李世石版本的AlphaGo有12层的神经网络,现在的版本有40层神经网络。

一、网络分类

1. 策略网络:保证能选择最好的一步,用策略网络会减少甘特图的宽度(剪枝),选择相对有可能的选项。

2. 价值网络:评估这个局面下谁输谁赢,价值网络来减少甘特图的深度。我们用甘特图来演示棋盘某个局面下接下来的可能局势,如果采用穷举搜索选择太多,没有哪个电脑能完成。

二、学习方法

AlphaGo把两类学习放在一起:

1. 监督式学习:人类专家棋谱的数据库,包括比赛棋谱和网上棋谱,来调整策略网络,从而可以走出和人类大师相似的一步。

2. 强化学习:自我对弈几百万盘,就能形成价值网络,能预测每走一步,未来谁会赢。

搜索到一定深度,就会思考出谁赢谁输,就不用搜到底了。

这样就构成了AlphaGo的树搜索。这种搜索会几百上千次,直到AlphaGo判断出哪个着法赢棋概率最高。

三、版本对比

1.去年的版本:在谷歌云有50个TPUs在运作,在每一步思考未来50步,每秒可以搜索一万个位置。不要觉得这个数字很大,深蓝每秒可以搜索1亿个位置,AlphaGo更聪明,所以可以搜索得少很多。

2.今年的版本:在单个TPU上进行游戏;成为自己的老师,从自己的搜索里学习,是自学成才,没有利用人的数据,用的是更强大的价值网络和策略网络

四、如何做自我学习?

他自己下的数量足够多,培养自己的经验,形成自己的策略网络;现在策略网络被训练了足够多的数据后,不需要思考运算,就可以给出如何下一步更好的策略。价值网络通过大量试下,得出这步棋赢的可能性。通过反复迭代,使得AlphaGo越来越强大

以前最高水平的是zen,crazy stone,等级分最高也就2000分;和樊晖下的版本等级分接近3000分,比那些强了4个子;和李世石下的版本3700分,比樊晖版强了3个子;最新的Master版本4700分,比李世石版强3个子;看起来好像进步很大,当然实际表现不一定能达到这么强的效果。

我们不是为了围棋而做围棋,而是为了解决人类社会的根本问题。

(这时放了个小视频,3D射击游戏,唯一的输入是像素,让机器自己导航,寻找目标,躲开障碍,这说明这可以用于更广阔的人类社会场景)

 

分享者:Google Brain 资深研究员Jeff Dean

人工智能的想法由来已久,想要创造出智慧的电脑,有很多种机器学习。最近5-10年流行的是神经网络,可以从输入达到我们想要的输出。输入可以是像素,音频,输出可以是识别物体,也可以翻译,转义,描述场景。

一、人工智能近期高速发展

为什么这些年人工智能发展了?其他方法之前发展很快,后来就停滞了;神经网络最开始一般,但现在计算机能力变强了,神经网络能力大幅提升,是很多问题唯一有解决办法的。

比如图像识别,2011年,机器26%的错误,人类5%的错误,2016年机器错误减少到3%,打败了人类。

在谷歌,深度学习的应用量迅猛增长。比如:20%的移动搜索是通过语音完成的,可以智能识别;电子邮件的智能回复,12%的回复是手机发送的,可以智能回复;在拍照时把雨点去除,把围栏去除,在抖的路上拍时可以把图像稳定,在暗处拍照可以把光线变亮;可以向google assistant提问各种问题;包括用在数据中心节能,让机器人模仿人运动;用来判断眼疾;还有些特殊的计算性能的,需要降低精度,可接受的就可以了,就可以用比较低的精度来计算,对神经网络特别适用,科学计算就没法这么来做。

二、谷歌分享的工具:tensorflow和TPU

我们有很多工具,让全世界各地的人分享我们的技术,用我们的开源系统tensorflow,是当前最受欢迎的工具。

谷歌有TPU(Tensor processing Unit),特别设计用于神经网络计算的芯片,第一代是三年前发布的,上周三的google大会上发布了第二代。每秒提供180万亿次浮点运算,有64G的超高带宽存储器。

有个TPU舱室:64台第二代TPU;11.5千万亿次浮点运算;内存四百万兆字节;二维环状多跳网络;4倍快于市面上最好的32台GPU。

今年将向全世界致力于研究开放式机器学习的顶尖研究人员免费开放1000台配有TPU的云虚拟机。

未来可查询的问题示例:

用西班牙语描述这段视频;

请从厨房为我倒一杯茶;

哪一幅眼部图像显示了糖尿病视网膜病变的症状?

帮我找出与机器人强化学习相关的文件,并用中文总结一下?

 

分享者:谷歌软件工程师,google翻译,陈智峰

一、为什么关注翻译:

因为互联网上50%的内容用英文,但只有20%的人口会说英语。

谷歌06年就开始做翻译了,当时是基于短语的机器翻译,是离散型、局部性决策,结果不太好;这几年开始用神经网络机器翻译,可以理解整个句子。

而且会找人类打分,在旧的系统,每年只能提高0.1-0.2分,新的系统英翻中可以提高0.6分,是过去3年才能取得的进步。

二、运作模式:

每一个样本都是中英文对照句,让机器自己学会如何对每个英文编码,机器学了1亿对句子,才能有比较好的效果

发现个有趣的现象,叫0知识的迁移学习,比如机器从来没学过英翻韩,但翻译效果也不错

三、为什么是现在爆发:
计算能力,模型大小,训练数据。

四、现场演示:

即时相机翻译,摄像头拍摄图像,谷歌翻译找到字母,转换成中文,但只演示了路标词语,没有演示句子翻译。

 

对话Alphabet董事长Eric shmidt

人工智能在哪个领域希望最大?

未来5年在医疗健康领域将进步最大,因为人工智能需要数据,而医疗健康领域数据量很多,人工智能将给人类带来巨大的影响。

中国这些年有什么变化?

我25年前第一次来中国,最早的主机在清华,现在的中国,智能手机、光纤都普及了,全世界都很难得有这么快的进步。

在业内这么多年,经历的最大变化是什么?

我这辈子看到最大的变化就是神经网络和人工智能。最早看到的PC是在施乐,在1980年左右,到现在速度虽然快了很多,但其实编程逻辑还是都相似的;而AI和之前的算法都不同,不用再教电脑如何写算法。无论中国还是美国,都会成为AI的领跑者。

有媒体采访,您说犯了个错误,错判了AI的重要性?

在1908年代我就做过人工智能研究,当时大家失败了,我也就放弃了,所以觉得AI没什么前途。今天的机器计算能力变强了,才能支持现在的算法,让机器智商得以提升。像TPU2,体积这么小,计算能力这么强。

现在有海量且碎片化的信息和数据,是否需要用AI工具?

最聪明的科学家也没法读完所有资料,最好的办法就是科学家和人工智能合作,人工智能可以建议他读什么资料。

怎么看中国的互联网公司,如BAT等?

对中国公司我不是专家,BAT的一个优势是中国有海量的用户。他们如果用tensorflow,可以及时掌握用户需求,把对用户的服务做得更好。

在人工智能领域,各家竞争优势不同,亚马逊有很强的自然语言算法,谷歌可视化做得更好,是这样的吗?

每一个公司都在竭尽全力,谷歌有google home,亚马逊也有类似的产品;在中国也是类似的竞争格局。

人工智能是否会走入寻常百姓家,让大多数人受益?

谷歌的革命让每一个人都受益了,百度也是。只要我们的技术是打造的开放的系统,就会让大多数人受益。

人工智能是否会造成很多人失业?

不同意。中国过去几十年里,社会不断老龄化,工作的人的比例在减少,用人工智能可以让更少的人养更多的人。

讨论一下垄断问题,美国的五巨头,中国的BAT是否会垄断整个IT市场?

不这么认为。中国是很有创业精神的国家,每次来中国都可以见到很多创业企业家。美国也是到处可以见到企业家,包括滴滴,uber,netflix等。未来还有很多公司在成长,如无人驾驶、医疗、分布式能源等领域,还有很多商机。

如何才能抓住人工智能的机会?

Deepmind给我的启示,来自不同领域的人结合在一起。在我们行业的核心是积累更多的用户,让他们爱我们产品。

人工智能未来一片大好,对年轻的企业家,学生有什么建议?

如果我现在22岁,我会到deepmind,Google Brain工作。我们现在在做一件大事,现在还是万里长征第一步,会有很多挑战。无论你在哪里,你都可以用tensorflow,都可以帮你提高。比如人工智能帮我们数据中心省了15%的能源。

美国是第一大经济体,中国是第二大,中国是互联网用户最多的国家,从监管角度,有什么建议去保护安全性和隐私性。安全性不是问题,通过加密就可以解决;隐私各个国家都有自己的政策,每个国家都不一样

 

圆桌论坛:

浙江大学计算机学院副院长 陈刚

Google Brain 资深研究员Jeff Dean

北京邮电大学计算机围棋研究所所长 刘知青

谷歌cloud&AI研发主管李佳

主持人:第一财经传媒集团CEO 周健工

 

一、是否相信机器智慧会超过人类智慧?

刘:是两种不同的智慧,不能直接比较。萝卜白菜各有所爱。比如AlphaGo用胜率评估胜负,职业棋手是用目,两种方法各有优劣,可以相互借鉴和帮助。

李:各有各的长处。比如让机器在一张图上找一个坏的点就比人容易,但如写诗就不如人。

陈:人是万物之灵,人的智慧究竟是什么,现在还没明白,可能需要脑科学有突破了才行,但现在脑科学还是在看脑的构造,对于其工作原理都还不明白。

Jeff:人工智能的目标是建立个通用的智能体系,如果能建立起来,会有很大的价值。

二、最近一段时间研究人工智能的最有意思的事情是什么?

刘:已经做计算机围棋十年了,之前还写了本书,说还需要5-15年才可能战胜职业棋手,衷心祝贺deepmind。我们正在试图用国内自主开发来复制乃至超越这些技术,并应用到实际。

这次突破的原因?

刘:主要还是数据的突破。学了人类几十万的棋谱,又通过自我对弈产生新的棋谱。在数据质量上他们还在进一步改善。

李:卷积神经网络也是很多年前就发展了,但这些年大数据发展后能体现其长处。

陈:很早以前就开始做人工智能了,很庆幸当年没有把名字改掉。觉得未来应该70%的精力放在人工智能的应用,包括医学、金融、教育上,30%的精力花在技术算法的研发上,用生物学习的方式其实是知其然不知其所以然。

Jeff:人工智能社区热情很高,大家心态都很开放。我们最近在做的,就是不用人监督,让机器自己学习;其次大型机器学习模型,实现模型路径的多样化。

机器学习如何影响人的学习,会替代人的学习吗?或者在某些方面影响人的学习,乃至影响教育制度?

Jeff:机器学习是让机器解决问题的方式,和人的学习没关系。比如可以让人工智能去帮孩子做定制教育方案,来指导孩子的学习,但不能替代


下午场

分享者:元趣科技CEO 吴义坚

人工智能应用——儿童教育陪护机器人。公司成立三年多,数千万融资,科技和教育相结合的团队。

陪护成长:教育、娱乐、沟通、监控、记录。

为什么选择儿童?

没有口音,发音标准;没有其他的智能终端工。但也存在问题,口齿不清,语法不规范等。

儿童语音识别达到90%以上,其中三四岁的小孩也能做到80%。有针对儿童的语义理解和知识库,能知道用户是否在和它交互。

我们最小的产品只有190g。下周会推出个新品。

 

分享者:出门问问产品副总裁 林宜立

一、做产品的思路

我们的产品包括从最核心的AI算法、到软件应用、操作系统、产品、最终的硬件,我们通过团队的努力都把它付诸实现,为什么要这么做?其实不光是说对于自身核心价值和竞争力的建立,更重要的是我们希望能够直接和用户产生互动,能够知道我们的产品哪些体验做得好,哪些体验做得不好,更重要的是当你知道做好以后你怎么去改?因为我知道在座有很多行业伙伴经常碰到的当你要做一件事,中间需要调用很多第三方服务或者说需要有更多的合作伙伴才能做成的时候,往往这里面的沟通协调成本很多,很多技术接口在早期不明确的沟通成本代价最终都会转化为用户体验的缺失,所以这是我们在做产品的思路。

硬件产品:我们的范围比较广,我手上戴这块Ticwatch目前在国内电商和线下我们销售量仅次于苹果手表;我们也有ticmirror和ticeye两个车载智能硬件,同时今年我们也会发布我们的智能音箱;

软件层面:我们积累了非常深度的对于安卓操作系统的并行开发能力,在穿戴上,ticwear这套功能智能手表操作系统在目前市面上经过广泛用户使用后反馈非常良好;另外我们还有智能车载操作系统会用在智能车载高速机车上,同时出门问问的语音搜索现在也被搭载到华为和摩托罗拉智能手表上,在今年的时候出门问问也发布了vpa(virtual personal assistant)的概念,我们跟市面上其他同类或者类似产品已经有很多不同。

二、多场景虚拟个人助理

我们认为一个好的智能虚拟个人助理它有以下几个特点:一、能交互;第二有海量的内容;第三、能够针对个人做个性的服务;最后、它无数不在。所以这就是所谓的多场景虚拟个人助理概念。

为什么要这么做,价值在哪里?这张图上它展示了一个概念叫做个人虚拟助理多场景,也就是说当AI助手能够在你生命中整个核心的场景都能够出现陪伴了解你的时候,你就会发现它会越来越懂你,并且当未来所有的设备比如说你的手表、车、智能家居都具备联网的能力,当你每天都在和这些设备沟通的时候,其实无形中这就是一张网,这张网能够给你更多的关爱,能够帮助更快速策略、更高效的去完成生活中的各种任务。

三、大众汽车(中国)的战略投资

我们得到了大众汽车中国的战略投资,从现在开始到未来我们会在汽车的智能交互领域投入更多力量,作为一家中国公司我们很自豪。因为熟悉汽车行业的朋友也知道从来只有外国公司在中国买渠道和市场,但是我们可能是第一家公司由外资的国际汽车巨头在中国买技术买团队,他们出sales&marketing市场资源和推广渠道。

四、google官方合作伙伴

同时我们跟google也是有非常紧密的战略合作关系,google也是我们的战略合作方。我们在刚刚结束google I/O上成为google的官方合作伙伴,在今年的下半年可以在海外看到出门问问的硬件搭载google assistant。

问问除了做消费者硬件以外,我们其实也在做一些能够帮助到行业同行创造更好的产品这样的事情,所以我们之前也发布了内测的AI开放合作平台,希望能够做AI智能硬件这样的方式,不管个人开发者还是企业客户大家都可以登录我们的网站去看看,我们也开放了语音交互开发包,我们希望用绵薄之力脚踏实地一步一步的去做产品,能够用开放包容的心态和大家一起构建一个互联互通的产品服务的生态,也就是说问问是具备软硬结合的硬技术和产品开发能力的创业公司。

 

分享者:旷视Face++副总裁 谢忆楠

人工智能的商业化之路分为超人、拟人、类人。

一、超人

前两天大家看到支付宝上刷脸支付,里面应用刷人脸识别技术。在进行人脸识别的时候我们经常会回答三个问题:化妆能不能识别?整容能不能识别?双胞胎能不能识别?所以我们要解决这件事情是去证明为什么机器比一个收银员更靠谱。人类对人脸识别非常擅长,所以人类会说我为什么要运用机器而不是人类。那我们告诉大家其实在很多场景里面机器可能比人类更丰富。

二、拟人:

如果超过了人之后又能怎么样,所以需要讲一个拟人的概念。我们经常会听到比如说人工智能将会在未来多长时间内取代50%左右的人工,这种情况下其实就是找到一个岗位行业里人工智能可以从头到尾解决问题,这时候我们就进入到一个拟人阶段。什么叫拟人阶段?关于今天的比赛对决我之前问了大概十个科学家,10个科学家都跟我讲人类不太可能赢,因为Alpha Go 1.0和2.0已经有很大区别,1.0使用超强计算能力无限模拟人类,2.0已经有了一个自己的套路,2.0每下一步棋都是为了提升自己的胜率,而不是为了更多赢多少子,他每一步的套路都是为了赢棋的目的而走,那么其他领域的拟人化也是一样。

具体到旷视所从事的工作,简单举两个行业:

1.金融行业:互联网进化到现在,有很多互联网金融公司的服务去借钱存钱获得收益。我们看之前银行获得用户的基础是什么,他们所有获得用户的基础是基于所有线下网点,有所有客户的本质的基本需求,银行在线下证明这个人和证件相符的就给你钱。在互联网金融时代,我们每个人的手机相当于银行,如果你的手机没有一个识别功能的话,金融公司不太相信是本人,所以我们做的一件事情是帮支付宝做账户审核的工作和滴滴司机的验证工作,首先我们做的第一件事替代一个简单的东西;第二件事我们做的是风控和数据,这一块偏后期,因为我们需要把所有拟人的东西串联之后才能成为一个标准。

2.安防行业:我们在实际情况中抓到一个嫌犯,如果是人工的话需要从180万的人次里面比对人脸和相片,在这件事来讲AI可以比人类要强很多计算机力。AI会让一个电子警察变成一个火眼金睛的刑警,他不需要180万次就可以在里面就找到他最想找的人。AI要去找一个定位,定位是在一个点上的替代人类,比如这些东西就是我们之前讲的未来有可能替代的领域。

三、类人

AI前时代我们通过互联网把人与人之间的协作合作做得很大,到AI后期 AI可能变成感知网络,在人和机器之间成为了数据转发器,因为机器只能接受数码信息,人只能利用物理世界信息,物理世界和这些数码信息怎么去转化?需要更多一些感官原理感知那些我们原来没法24小时的时候数据。所以到未来的话,AI已经不像现在去替代人类工作,而是说它说创造出更多的结构方式,因为它把数据容量无限的扩大。

 

分享者:吉利汽车研究院只能驾驶开发中心总监 李博

G-Pilot是吉利自动驾驶的一个品牌,对应2014年、2018年、2020年、2024年我们制定了四个阶段的一个方案,整个方案时间十年,对应G-Pilot四个不同的版本。我们现在已经量产的,G-Pilot实际上已经具备了很多功能,比如说ACC巡航,AEB智能紧急制动,这些功能不是说在未来实现,而是现在就可以买到。

G-Pilot 1.0:

吉利2014年末、2015年初推出了G-Pilot1.0,截止到目前我们有四种车型搭载我们的方案。在企业上我们是所有自主品牌里面最早开始的。市场投放量方面我们大概现在已经超过10万,也是中国自主品牌里面市场占有最多的。

G-Pilot 2.0:

我们下一代产品将会是2.0系统,这个系统将出现智能领航、自动泊车这样的概念,它不拘限于单方向,它将实现横向纵向联合,而且还出现多传感器的数据服务,将更多的解决方案连接到体验中。

G-Pilot 3.0:

我们的3.0产品也是我们现在正在投入最大的研发的产品,一个全新的自动驾驶软件的解决方案,具备HAD高度自动驾驶RPA遥控领航泊车功能,我们将解放双手双眼,你不再需要监视整个路面,那时候我们会带来更多价值体验,也不局限车辆本身能够提供,而将会运用更多云端,与云进行沟通,去协助车辆进行定位,协助去了解前方情况。

G-Pilot 4.0: 

我们的目标是在2024年将实现的也不局限于刚才提到的这两部分,接下来将出现解放大脑,也就是说你可以去休息、去阅读,汽车会根据平时的驾驶体验、价值观去调整驾驶,我们会上一个新的台阶,过程中我们会面对很多未知的探索、很多困难和挑战,也是我们继续去实现的。

 

分享者:Deepmind联合创始人 Mustafa Suleyman

世界上有8亿人无法获得干净的水,未来会增加到18亿。世界上有8亿人营养不良,但每年有30%的粮食被浪费了。如果世界上每一个人的消费水平都和英国一样高,那么需要3.1个地球才能养活这些人。现在温室气体浓度比过去80万年间的任何时期都要高。

Deepmind是一个复合型组织,其中包括:

一、Deepmind 能源

数据中心消耗了全球能源的3%,deepmind将google用于给数据中心降温的能源消耗减少了40%。既要能源消耗最大化,也要保证安全,包括如何把可再生能源最大程度融合进来。

二、Deepmind医疗

50%以上的医疗都不是循证医学。

经常有医疗事故,美国每年25.1万死亡,是第三大死因,仅次于心脏病和癌症

未能提供主动护理,97%以上的急性护理都是应对性的

比如:对致盲性眼病的早期检测。1/4的英国人国胖,而胖的人容易得糖尿病,糖尿病和致盲性眼病有相关性。

用人工智能读取CT扫描,改善癌症的放射治疗

 

分享者:谷歌研究产品经理 彭浩怡

深度学习用于医学影像:

应用一:糖尿病视网膜病变

这是增长最快的失明原因,定期筛检是预防失明的关键。医生会根据拍片进行评估是否病变,但现在医生不足,印度缺少12.7万眼科医生;45%的患者在诊断前饱受视力丧失的折磨。使深度神经网络适合于读取眼底图像。

下一步:临床试验与监督。比如和FDA商谈合作、合作伙伴与设备、和尼康在谈合作。

应用二:癌症活检

每12人就有1位乳腺癌活检可能被误诊;每7位前列线癌有1位被误诊。每幅图像10亿像素,肿瘤定位得分为0.89分(病理学家在不限时的情况下得分0.73)

下一步:临床验证、建立信任、工程流程及用户设计。

 

 

分享者:清华大学生医系博士生 李哲 廖方舟

一、背景:

现在肺癌的早期筛查最好的办法是让所有人在年轻的时候每年都去做了一次体检,根据早期可能的症状尽早处理。这里面非常重要的工具是低剂量CT,它会把我们的胸腔放大扫描给出一个三维的图像,医生会在图像当中寻找可能的病状。让一位医生去仔细做一个检查要花十分钟,如果每个人都想去做这样的检查对医生来说是不可能的任务,如果我们能让深度学习帮医生干这件事情,一定会是一个非常大的市场,也能帮助大家去帮助这些患者。

为了解决问题,kaggle已经在网站的一个比赛在解决问题,提供了一百万美元的总奖金,我们参加了这次比赛非常幸运拿到第一名,简单跟大家介绍一下模型的结构是什么。

二、模型结构

首先一个CT图像来了以后,我们会模拟一个医生找到一个可能的发病病灶,把里面的发病病灶找出来以后再用深度学习模型去评价发病概率,对于每个病灶给一个恶性概率,把这N个病灶的发病概率结合起来成为一个人的概率。其中重点是一个3D的图片,我们的模型可以同时考虑局部的信息和前期的信息,也就是当一个医生看看某一片黑色的时候,不是只看东西长得怎么样,还要看它的环境,身处什么样的环境。

模型结构能够找出病灶的局部和全局信息,最后模型会输出三个信息:1、病灶的位置;2、对病灶的置信度就是认为百分之多少的概念,这是一个预测;3、数学描述,对病灶的形态作一个数学描述。

比如说这是一个例子,左边的是从上到下扫描的一个CT,右边是我们模型找出来的5个疑似病灶,我们把觉得的五个最为可疑的病灶的数学描述提取出来,把它放到模型的第二部分就是评判模型里面,对它给出了一个恶性的概率。为了防止说有一些病灶对我们的模型漏写,我们在里面还加入了一个假想的未被发现的病灶,总的来说是六个病灶的概率结合起来成为人发病的概率。之所以这样设计,也是因为比赛的一些限制,最理想的条件下让我们知道,比如说每个病灶发病的概率是多少,但是这里面在比较是没有的,只是告诉我们人有没有得病,结果大概是这样:左边是我们的一个结果分布,总的来说正确率大概80%左右,这右边是一个ROC曲线。

三、模型提升空间

第一医生也好不到哪里去,因为本身就非常难做一个判断,他不仅根据图像的信息单位,还要综合病人的病史,种种知识才能得出一个综合的判断,而且也不准。但是我们模型其实还有很大的成长空间,因为这次比赛只提供了约1000个数据,而实际上对于一个工业级的机器学习任务来说,没有数以万计的数据是很难达到一个让人满意的程度,所以我非常有信心把我们模型投到工业应用去,如果拿到数以万计的数据,模型肯定会更好。

第二个可以提升的点是现在只能给出一个概率,就是病人有没有病,但医生很重要的一点是可以给出得了什么种类的病,病灶是什么类型,给出非常详尽的医疗报告,而不是像神经网络一样,这是需要提高的第二点。

四、医疗深度学习在医疗上的展望

总的来说,我们认为对于医疗深度学习在医疗上的展望,我们认为:

第一是非常有必要的,对于广泛的筛查来说,没有AI就不会有广泛的筛查;

第二,我们认为AI跟医生的关系是服务的关系而不是取代的关系,是解放医生的劳动力,让医生投入到更多有价值的工作;

第三我们可以让AI对年轻的医生进行辅助教学,让他们从医学生时代就开始接触AI,从AI学得知识,培养与AI一起协作的习惯;

第四是可以提供给医生一些新的医疗知识,和围棋一样,选手可以从阿尔法狗学到很多新的知识。关于这点其实我自己有一些体会,我虽然不是一个医生,但是我是一个做神经的,以前做一些生物实验。生物实验里面非常头疼的一点就是我们要数细胞的,我自己做了很多很多图片,图片上有很多很多的细胞,我们要统计图片哪个区域有多少细胞,老师教我们是把照片放到大屏幕上,拿着一张纸蒙上去,一手拿着纸,一手拿着计数器,一张图片要按十来分钟,然后换下一个,一天大概可能统计1000-2000个细胞,我就非常不爽说我学了那么多的东西,不是为了做小学生都会做的事情。这件事情我们做了几个月以后就痛定思痛,就开发了一个AI来帮我们处理这件事情,我们解放了大量的时间,后来其他实验室的人也来要,都觉得非常好,所以实际上医生们也是会欢迎这么一个解放劳动力的东西,我们中国绝对不是一个医生过剩的在地方,所以我认为完全不用担心替代医生的问题。

 

分享者:流利说创始人 王翌

一、公司概况:

公司地点:上海。

创始人王翌背景:清华大学电子工程系硕士,在美国普林斯顿大学攻读计算机博士,曾经任职google。

二、国人学英语现状

05年的时候我飞去美国开始我的博士生的求学生涯,我到美国第一顿饭是在麦当劳,大半夜到了机场去麦当劳点餐,进去想单独挑几样东西,我跟服务员聊天,他问我话我也不太清楚,于是最后只能说那就好好,当时心里受到极大的创伤,因为我当时老托福600多分满分情况下我是差十分满分,所以当时觉得我可能学了个假托福,我刚才注意观察一下,有老外在台上演讲的时候看场上大概有30%-40%同学带着同声传译,我相信这些同学很多人都过了四级或者过了六级,所以中国人哑巴英语是很大的问题。

我们看到了中国的教育比较本质的问题当中有不满意的地方,对于创业者来讲对于一个有志于改变的人来讲,都是非常兴奋的结果:

第一,拿学英语这件事来讲,世界上公认的语言学习标准是欧标,他说从完全零基础到可以灵活交流,大概是需要学习100-1200小时,而今天一个中国学生从刚开始接触英语终于可以不用学了需要大概需要2000多小时,中国现在每年新生儿是在2000多万,国民投入时间资源多么巨大,结果是时间花了几乎一倍甚至更多的时间,结果90%是哑巴英语。

第二,中国的教育目前是成本极高。在座有多少人家里有小孩,你们可以回想一下人家钱多少钱花在小孩教育上面。有3/4的家庭养育孩子的成本是花在教育上面,基本上中国家庭整个家庭35%开销花在教育上了。

第三,中国地区教育的发展不公平性极其严重,仅仅拿云南省和黑龙江省举例,他们其实不是中国最偏远最穷的地方,但是云南有70%的地方中小学缺乏英语老师,黑龙江省是50%,等下我给大家看一位老师他们怎么学习英语,大家想想这些问题怎么解决?这些问题不是一天出现,也不可能一天就消失了。

三、流利说起源

第一、行业容量巨大;第二极其碎片化;第三种行业整体的运行效率非常低。我发现一个行业具有这样的特点而且它效率低的时候我觉得特别兴奋,因为这里面有巨大的空间。

四、团队人才技术

刚才李佳博士说人工智能需要有四个要素其中一个就是人才,那么我们团队中林辉博士是我清华的同学,我们一起创业的之前他在google总部做语音识别和数据化的研究科学家,孙毅博士也是我清华的同学,他毕业于世界最顶尖的人工智能实验室之一瑞士的Swiss AI Lab,他是那个实验室毕业的唯一一个中国博士,在工作了四年之后辞职来来带领我们的团队,我们有世界顶尖人工智能专家。

五、流利说过去几年的行动和产品

首先发布了自主强化自我强化的深度学习器。Deepmind是把原先把深度学习和增强学习方式颠覆,流利说把原先的知识图谱的方式给颠覆,我们是世界上唯一不用知识库的方式自身学习,我们更加高效更加个性化给用户提供动态的千人千面的学习。流利说提供让人类非常感兴趣的体验,我们在过去四年收集了中国人说英语的口音数据,我们为什么能做到这一点,因为我们把产品做得特别的有意思,我们是苹果的年度精选,是唯一一个中国大陆在苹果店做展示的产品,苹果公司副总裁在我们那边去参观的时候,我请他试用公司产品,我把多身份口音里面发音的现象把它拿出来,他觉得特别的震撼。通过数据我们打造世界上最精准的定位。

去年7月份公开发布了全球首个基于智能 AI 技术的自适应移动英语课堂叫懂你英语。它从一开始进去的第一步就是每个同学会做一个分级测试,从测试开始就是个性化,不断测试过程中对你就有初步的了解,于是会确定一个适合的起点开始规划个性化的学习,通过听说读写顺序逐步帮你提高,所有技能全都出来了。整个产品体验过程当中没有真人老师,那我们怎么样让用户感兴趣,怎么样持续的学习下去了——把整个学习题给游戏化。而且在整个过程当中,在我们的产品在核心的课程看不到一句中文翻译,改变了以前死背单词死记翻译的模式,我们聘请了美国专家Lance Knowles把他的一套全新的学习理论来指导我们的产品,我认为这套理论是今天在移动端最适合运用技术和数据来指导人类学习的理论,我们花费几乎大半年在全球范围内搜索锁定这套理论,最后我们用很多的数据展示给我们学习让他有直观的一个感受,就像我们猎头给你打分一样,在这里面有很多数据。

今天流利说约有4300万的注册用户,但我们觉得这才是刚刚开始,中国就有超过4亿的人,从数字来看我们只做了十分之一,何况流利说的目标不仅是服务中国学英语的人,而是要走向世界。

六、流利说目前概况

第一,产品和数据。我们在发布产品之前和我的团队说,把数据拿出来,不然我们就不发布产品。我们做了400多个实验,我们使用第三方做验证发现我们可以把欧标建议至少要学习100小时的强度降低到30个小时左右,也就是说你用传统跟着真人老师学习方式需要100小时提升的水平,看我们的AI时间只需要30个小时,我们也是世界上第一个英语培训或者学习产品或服务的公司发布这样学习效率的数据。

第二,到底有多少人学完了。数据告诉我们90%以上的学生可以完成学习。而且每周统计用户的学习时长超过五个小时。

第三,能不能解决成本太高的问题。我们每天少喝一罐可乐,那就是一块钱,价格如此颠覆,我相信它可以从本质上改变中国哑巴英语的现象。有超过80%人平生第一次掏钱开始学习英语,也就是说市场上原先这么多的线上线下的英语没有把这些人吸引进来。

七、怎么解决教育公平的问题

去年6月份我们去了青海最偏远的、经济最不发达的地方叫果洛藏族自治州,在那边有一个藏族的孤儿学校里面有300多个从3岁到15岁全都是藏族孤儿,那边唯一的英文老师是一个广州的白领,辞职去支教,他是流利说的用户,他拿出一个手机说孩子非常喜欢流利说英语,于是我们联合了魅族捐一百台智能手机,我们把人工智能老师完全免费开放出去,还和当地电信公司升级了网络。

周一到周五非英语专业的老师会在本节课开始的时候把手机发下去,过了40分钟把手机收上去了,流利说后台或者数据反馈表象会告诉他们哪些孩子效率高低和进步快慢。今年我们正在和一些非常有爱心的公益组织把效果扩大好多倍。我们从本质上认为中国乃至世界的教育问题,主要要靠科技和人工智能技术,我很高兴流利说的很多科学家和产品运营跨出了非常微小的第一步,他颠覆了必须围绕老师开展的一项服务,我相信在未来会有很多来自于中国AI驱动的教育科技公司真的,能让同学们在高效提升的道路上越来越轻松,越来越有效果。

 

乌镇智库秘书长 李小鸣:《全球人工智能发展报告2017》

一、报告的内容和考量维度

智库的所有的工作只有两个作者,一个数据,一个是机器。我们的工作就是以数据促进社会决策,我们的理念就是知识作为服务,智库有非常强的一个专家团队,专家团队一方面保证了智库所有作品的质量,同时也强化了两方面的特色。

我们进入人工智能这样的技术含量非常高的领域从三个维度来考量:

第一个是人工智能的企业数量;

第二个维度是人工智能企业的投资和融资既包括投资的数量,就包括投融资的频次;

第三个维度是人工智能专利申请数据。

我们围绕报告调用了投融资的数据库、创新科技企业的数据库以及专利的数据库,需要做一个说明的是报告里面的融资排名不包含IPO或者不包含并购这些情况,同时我们这里面也主要以每年新增的创新企业为主要的对象。请大家看一段视频,这段视频反映了全球人工智能企业在全球范围内的分布和发展变化趋势,既有空间上的一个分布规律又有时间这样的一个发展变化趋势,大家看到有不同的颜色,一个颜色的代表2012年之前成立的企业,一个颜色代表2012年之后成立的企业。为什么会有这样的两个颜色?因为根据我们的统计,根据我们的研究发现2012年之后所成立的人工智能企业的数量的总和超过了2012年之前20年成立的人工智能企业总和的两倍,所以我们说2012年是一个非常重要的年份。

二、全球人工智能企业发展情况

在全球哪些国家和地区人工智能企业数目最密集,这里有几个数据:美国最多,超过3000家;中国是1500家;接下来是英国,距离中国的差距要大得多,如果单纯一个国家的话,英国离中国的距离还很远,但如果把欧洲当做一个整体,中美欧实际上是全球领先三驾马车,其中美国比较领先一点,

大家比较关注的,中国在人工智能企业数目的增长速度上面很快,远远超过了美欧, 2011这一年非常重要,这一年开始中国人工智能专利申请数目开始超过美国,之后几年距离越拉越大。

人工智能的发展有个地区不可忽略就是硅谷,通过几个维度的指标来看,无论是在人工智能企业的数量上、在人工智能企业投资上,还是在人工智能企业的公司的投资的频次上,硅谷在全球都是居于一个非常重要非常领先的一个地位,尤其是投融资的额度几乎是全球1/3,下面也把硅谷跟一些美国之外的国家做了一个对比,那么在里面我们发现除了人工智能企业数量之外,在别的指标上硅谷都超过了其他国家,可以说是硅谷在人工智能的资源是富可敌国。

三、中国人工智能企业发展情况

中国在亚洲人工智能的发展方面绝对的是遥遥领先于其他国家,无论是在企业的总量还是投资的总量,还包括投资频次非常明显,这里有两张图,一张是中国新增AI企业的发展,右边展示了中国AI无论是投融资还是频次上的的发展规律。

在中国哪些省市自治区哪些城市在那个领域里面发展最快?第一北京第二杭州第三上海第四浙江。如果从城市来讲,北京第一上海第二甚至第三杭州第四广州第五。今年听说广州在大大力度的做人工智能,他们刚刚出了一个广州共识,我相信可能在未来一两次的人工智能报告里面版本就会有变化。完整的人工智能报告全文会在智库的微信号和合作媒体对外发布。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存