活动回看:颠覆式创新一百年&AI走进社会生活发展前沿追踪 | AI&Society第三期
为了挖掘在AI与社会研究交叉领域有想法的研究者,促进思维碰撞,腾讯研究院S-Tech工作室与集智俱乐部共同打造了“AI&Society”的系列学术沙龙活动。
2017年12月24日,在北京中国技术大厦,腾讯研究院里成功举办了AI&Society系列的第三次活动:围绕“颠覆性创新一百年”这一主题,邀请了来自芝加哥大学、上海交通大学、中国科学院、英特尔中国研究院、DeepBelief.ai、彩云AI、北京师范大学等AI学者和实践者分享了来自大学、公司、与互联网社区的大数据研究实例,并与在场的嘉宾进行了深刻讨论。
主持人:张江
北京师范大学系统科学学院教授
集智俱乐部、集智AI学园创始人
下面,让我们来一起回顾这场学术盛宴,透过前沿科学家的眼睛,学习人类推动技术发展的进程、人工智能在社会领域的应用及优化,机器人的最新发展。解密伴随大数据,社会科学,人工智能发展而来的新问题。
问题1:人类的社会行为如何推动科学与技术的发展创新
问题2:人工智能正在创造怎样的未来
问题3:深度学习在科学研究领域有何新发现与新进展
来自大学、公司、与互联网社区的大数据观察
主讲人:吴令飞
芝加哥大学社会学系博士后,研究兴趣是组织创新与学习。通过使用数学模型和机器学习方法,通过研究来自科学界(例如Web of Science 和 ORCID数据)、工业界(例如美国专利数据)、和互联网众包社区(例如Stack Exchange 和 GitHub)大量团队的人员结构与产出的关系,报告人致力于寻找组织创新与学习的一般规律,促进组织管理和政策制定。
2013年从香港城市大学获得传播学博士学位。博士最后一年曾在百度推荐与个性化部作为算法工程师实习生。在到芝加哥大学前曾在亚利桑那州立大学人类行为、制度与环境研究中心担任博士后研究员两年。
人类科学和技术的发展,需要颠覆性的创造,每一次创造所贡献的知识或者技术,不是沿着既有技术发展,而是冒着巨大风险开辟了新的方向。我们分析了千万条来自大学、公司、与互联网社区的数据,以思考在科学创新过程中,究竟怎样的社会条件,孕育出敢于承担风险,开辟科学新天地的团队,我们发现,团队规模及成员分工对团队创新能力有影响,大团队追逐科学热点,小团队则更具备创造性。
我们首先提出了一种量化“创造性”的方式。焦点论文 i 将会出现三种被其他论文引用的结构,分别用绿、红、蓝色方框表示。绿色为既引用 i 也引用 i 的参考文献 j,红色方框只引用论文 i,蓝色方框只引用参考文献 j 。我们认为,红色与绿色出现的概率之差,即图中的Disruption为量化后的“创造性”,该值越接近于1,论文创新程度越高。
如下图,我们根据创新指标(Disruption),将三篇影响力相似的论文以引文树的形式表现出来,说明创新指标是如何区分不同科技贡献的。树的枝叶高度表示引用该论文的时间,枝叶形状表示不同的引用结构,如果论文既引用了焦点论文也引用了参考文献,则枝叶曲线向下垂,如果只引用了焦点论文,则枝叶曲线向上翻。可以看出A与C的论文创新度更高。B图更多的是发展性,而非颠覆性的创新工作。树的根部越长,引用参考文献越老,根部的形状展示引文引用结构。
进而,我们追踪了各个领域的团队。如下图,红色的曲线表示引文的热度随团队规模大小变化,绿色的曲线是引文历史长度随团队规模的波动,大团队偏向引用新文献,捕捉流行的研究。小团队在研究过程中,对过去的文献追溯更深,思考深入,更擅长提出新想法。
通过以上的研究,我们发现,团队规模与其在知识生产过程中扮演的角色有关联,小团队创造问题,大团队回答问题,在已有的基础上,把研究变得更好。接下来,我们思考这样一个问题,究竟是什么原因导致了大团队和小团队产生了差异,我们选取PANS中5000多篇文章进行分析。
首先观察团队的组成结构对创新有无影响。将团队中的人分为两类,一类为团队的“脑”,灵魂人物,提出思想撰写了文章,另一类为团队的“肌肉”,激发“脑”人物的灵感,辅助文章的创作。下图展示了我们的研究结果:随着脑人物的增多,团队创新能力越强,“脑”人物不会随着团队规模的增加显著增加。
其次,我们认为团队成员的时间对创新性有影响。研究发现,成员1年内写的文章越多,精力越分散,论文的创新性越低,所以,创新需要时间。
我们尝试分析任职时间长短对创新的影响,我们发现,团队平均年龄越低的团队,创新能力越高,随着年龄增长,创造力不断下降。
考虑学者在学术社区中的与社群的连接程度对创新的影响,研究显示,学者在学术圈中的连接程度越高,学者的创新能力越低。 由此,我认同这样一个观点,创新的本意就是要离潮流有点距离,才会更容易产生下一个潮流。
【小结】以上是我们通过大规模论文数据研究社会中创新现象的例子。研究揭示了小团队与大团队之间的关系。一是,小团队的创新性研究供养了大团队,小团队创造新的研究方向,大团队发展这些研究方向,当小团队的研究获得公众认可与赞赏时,该研究类别的大团队比例显著增加;二是小团队的研究特征在于创新,大团队的研究特征在于投入大量的资源发展,小团队的研究更容易不被社会认可,其起步成功过程更加艰难。进一步的,我们讨论了影响创新能力的因素,个人的时间精力,年龄、与社群的连接将会影响团队的思考能力,创新能力。
相关文献:
Large Teams Have Developed Science and Technology; Small Teams Have Disrupted It(Lingfei Wu,Dashun Wang , James A. Evans)
上海交通大学 副研究员
近年来,中国政府非常强调科研在驱动创新和经济增长中的重要性,在技术研究领域投入巨大,中国正在成为一个技术强国。我们根据中国10多年的论文发表数据,深刻的分析了中国的创新现状。下图中,中国学者发表论文的数量在2003年之后呈现平稳的增长,到2011年已经跃居全球第二,尽管与美国的霸主地位还有很长的距离。从论文数量来看,中国的创新程度与创新热情突飞猛进。
进而,我们对各个学科的论文发表数量进行分析,化学领域与工程技术领域的论文发表数量都有了很大的增长,尤其是化学领域,在2007年后,论文增长速度飞快,已经非常接近美国化学领域的创新数量。工程技术领域,中国AI全
球的论文发表数量与AI人才都居全球第二。
然而,我们的论文总量虽为全球第二,但事实上国际上对中国创新的认可程度却不高。第一个表现为,平均的引用增长小,在国际顶尖的杂志,高影响因子的论文中,对中国论文的引用比例更小,而我们也证明了,仅仅因为是中国人而不引用论文的现象显著存在。第二个表现为,国际普遍认为中国存在学术造假现象,由此对中国论文始终抱有怀疑心理,但实际上,从下图中关于各个国家论文撤回率的曲线中,我们看到,中国论文的撤回率一直比较低。最后,与美国的论文相比,美国大部分优秀的论文都来自于公司,中国大部分优秀论文则来自于研究院与学校,从理论到应用还有一段距离。
【小结】中国高水平的学术普遍没有被国际所认可,对于高影响因子的期刊,中国论文的引用率更低,中国虽然有创新,但是世界并不愿意站在中国的肩膀上发展。这中间有中国自身的问题,也有世界对我们的误会,下一步,我们将进行更深一步的研究,去回答世界对我们的误会,去分析我们自身的问题。
人工智能新零售
主讲人:尹相志
DeepBelief.ai首席科学家
现在有很多人谈新零售,我认为重要的一个原因是,之前大家在网络上做销售,网络的机制可以减少中间渠道的销售成本,快速吸收客户,提升利润。由于流量的垄断,网络开店比实体店更贵。但什么是新零售?零售是指,向最终消费者个人或社会集团出售生活消费品及相关服务,以供其最终消费之用的全部活动。零售活动中必须包含四要素——场(景)、货(或服务)、人(或机构)、商店。互联网带来了很多变化,但是零售的本质并没有发生改变,很多人认为新零售是将四个要素以不同的方式重新串联,但是我并不关心这个,我关心的是如何使用数据把四个要素连接起来,运用智能以及数据,使实体店消费者获得和线上消费者一样的体验。
德克士的未来门店无人餐厅,利用这套自助取餐设备,下单、支付、取餐、用餐,全程无需员工介入。这堪称实体门店无人化方面的样板间。
我们目前在做的智能零售的突破是,如何通过人工智能中机器视觉来改进无人零售。目前的无人零售多是基于点击屏幕选择产品,每次只能买一件产品,买完不能退换,等等诸多不便。我们希望通过机器视觉能够使机器更加聪明,更接近普通零售的体验。通过一段小视频,来看我们基于机器视觉的新零售进展。最终,希望人工智能时代可以帮助我们实现不再跟很多很笨的机器交互。
https://v.qq.com/txp/iframe/player.html?vid=z1331k57zmw&width=500&height=375&auto=0
社会机器的社会管理
主讲人:王晓
复杂系统管理与控制国家重点实验室助理研究员
人工智能的蓬勃发展,正在颠覆人类社会现有的形态。一方面,不再是以智人为中心,而是大量的非人主体,包括机器人、人工智能、赛博格等,将把人类从大量传统的行业中推挤出去,包括医学、法律、会计、制造、广告、金融乃至媒体和文学艺术领域。一个真正的“机器社会”正在大步朝我们走来。《社会机器》(Social Machine)我们团队最近在翻译的一本书,书中描述了社会机器的定义及发展,书中认为社会机器是由人和计算机的协同工作创造出的具有惊人能力和复杂性的系统组成的现代系统。下图展示了社会机器的目录。
书中提出这样一个设想,能不能使用机器来管理社会,原因在于,机器的广泛的应用,产生了大量的数据,可以使用这些数据对人类行为进行研究,进一步,对人类的群体行为进行预测。目前,我们的研究和观点是人来做决策,机器来做管理。我们今天讲到的内容以及观点可以在如下三本书中寻到。
机器人的空间智能
主讲人:史雪松
英特尔中国研究院研究员
智能机器人与智能手机、智能音箱等有什么不同?本质区别在于机器人能动。对于智能机器人,必须实现自主移动能力、自主操纵能力和人机交互能力,这些能力都建立在对周围场景进行三维感知和理解的基础上。今天要讲的,就是实现三维场景理解所需的技术,由此产生的智能,我称之为空间智能。
那么,如何构建空间智能呢?首先需要机器人回答两个问题:我在哪里?我周围有什么?也就是机器人的定位与建图。这两个问题互相依赖,因此必须同时求解,学术上称为SLAM(Simultaneous Localization And Mapping)。下方是我们的机器人在同济大学设计学院一处展区分别通过两种SLAM算法建立的地图,左侧是由激光雷达扫描得到的二维地图,可以实现机器人的定位与导航。右侧是通过视觉SLAM建立的三维地图,内容更加丰富。
上面的地图只包含几何信息,而要实现空间智能,我们需要将语义信息融入地图,使机器人知道哪里有什么东西,进而能够通过自然语言接收“把餐桌的杯子拿到厨房”之类的指令,或回答“房间里有几把椅子”之类的问题。
基于深度学习,对图像的语义理解技术近几年有很大进展。只要将其与视觉SLAM相结合,不难得到三维空间的语义地图。实际上,经过更深层次的融合,语义理解可以对SLAM本身带来提升,例如采用语义特征进行定位显然比只采用简单的视觉特征更加稳定。另一方面,SLAM也会提升语义理解的水平。经过多帧图像结果融合的三维语义地图,比单帧图像的结果准确度更高,并且可以通过三维空间中的优化进一步提升准确度。
虽然视觉SLAM与图像语义理解都已经有了巨大的进步,但针对语义SLAM的研究才方兴未艾,仍有诸多问题有待解决,例如如何识别和区分同类物体,如何高效应对物体的移位(被挪动的椅子)和形变(整理过的床铺)。在语义信息的数量和质量上也存在挑战,因为深度学习的训练集永远不可能包含所有物体类别,所以需要设计半监督或自监督学习的算法,充分利用机器人自主运动的能力和不同视角带来的信息冗余提升语义理解水平。最后,语义地图与自然语言交互、任务规划和空间推理的结合,将是更长远的研究课题。
揭秘彩云小译
主讲人:侯月源
彩云AI算法工程师、集智俱乐部志愿者
现在的人工智能时代其实是由2010年深度学习开启的,从2010年仅不过四年,深度学习就打开了自然语言处理的大门,彩云小译就是这一时段的产品。彩云小译是一款,是一款同声传译、实时翻译的移动端产品,主要用于满足人们日常英文对话需求。我这场演讲主要是全景式的介绍彩云小译,包括其背后的翻译原理,后端的架构,以及彩云小易的未来。萌萌哒的彩云小译APP界面,集众家之长,利用国际最新的研究模型,结合中国人的语言思维,输入中文语音,可以准确的识别中文同时输出英文及英文语音,转换快速流畅。
彩云小译的“中英对照”网页翻译功能。跳转到网站页面后,《彩云小译》就会自动进行翻译,并以中英对照的形式排版。整体排版效果还不错哦。
彩云小译背后的翻译原理基于最先进的研究结论。2015年提出的注意力机制,能够用更少的计算量,得到更为机器翻译更加准确。2017年Facebook与Google提出了更先进的翻译方法,新的研究提出用CNN代替了RNN的神经网络,优势在于可以同时翻译很多句子。
为了支持不间断的翻译,不间断的精准翻译,彩云小译在产品后端也做出了非常大的努力,同时管理部署很多台机器不让机器超负荷运行人工智能,让生活变得更美好,彩云现在攻坚翻译问题,未来将会致力于自然语言理解问题。自然语言交互机器和算法,应该理解人类在说什么,在指代什么。我们希望彩云小译成为化解人类语言障碍的神器。
复杂网络嵌入
我们都听说过这么一句话 , “复杂的世界,简单的规则。”一般来说,我们看到的世界确实是很复杂,但是这个简单的规则却不那么容易被找到。下图中这张图是美国的用户在网站上访问点击形成的网络图,图中每个节点都是一个网站,如果单看这张网络图,我们很难发现有什么规则,但是通过网络嵌入(表征学习)可以很好的帮助我们解决这个问题。下面我将介绍什么是网络嵌入,网络嵌入有什么应用。
下边左侧的图就是将美国用户访问形成的网络图进行嵌入形成的,我们可以发现Google.com在整张嵌入图中处于中心的位置,相似的网站相距位置更近,图中红色的区域是教育网站,紫色的区域是成人网站。右侧的图是中国用户访问形成的嵌入图,与美国网站类似,图的中心是百度搜索引擎,中国的网站也出现了聚集性,绿色的点是电商平台,包括天猫,淘宝等网站。
我们不禁要问,网络究竟是如何嵌入的?网络嵌入其实是根据网络的局部以及全局信息为网络中的每一个节点找到一个向量表示。如果我们要对这张图建立一个坐标系,就可以把谷歌放在坐标原点的位置。我们发现网络嵌入可以帮助我们衡量网站的重要性,发现网络社区群体。
可以看出,网络嵌入是一个很神器的工具了,那它可以应用于哪些方面? 我们研究组使用网络嵌入,进行了网络分类实证实验,一个是对1962-2000年每种贸易产品组成的贸易网络进行分类,测试的分类准确率为99%,另外是对复杂网络分类实验偏好依附网络(BA)和小世界网络(WS)分类,分类的错误率为0.1%。很多人提到,计算机在图像分类、语音识别中取得了突破性的进展,我们在尝试如何将其中的深度学习技术运用于网络分类中。结果显示,使用GCN图卷积算法对网络分类,准确率达到了81%,在网络中加入注意力机制后形成新的算法GAT,其网络分类准确率达到了83%。
当前我们的研究组的研究工作是利用网络嵌入对网络状态的演化预测,即根据当前网络的状态,预测网络下一个状态。我们后续将会利用GCN学习链路预测、学习网络传播规律、研究虚拟空间中人类的移动。
我们在放大图片时,会发现这样一种情况,放大的倍数越大,图片越模糊,不能放大时,图片变成了一堆模糊的方块,图片难以识别,下图中女孩的头饰放大后变得模糊。基于深度学习提出了用于解决此类问题的超分辨率技术(Super-Resolution, 简称SR),超分辨率应用很多,具体分为两类,一是从多张低分辨率图像重建出高分辨率图像,二是从单张低分辨率图图像重建出高分辨率图像。基于深度学习的SR,主要是从单张低分辨率图像重建(Single Image Super-Resolution, 简称SISR)。
我们今天会分享多个关于超分辨率的算法,如Super-Resolution Convolutional Neural Network (SRCNN) ,Super-Resolution Using a Generative Adversarial Network (SRGAN)等算法,并介绍我们的算法。下图从左到右展示了几种不同的算法放大后的图像。可以看到除去原图(Ground Truth)第四张最清晰,最真实。
龚同学的分享结束后,张江教授对所有的主讲人及听众表示感谢,同时表明,AI&Society 学术沙龙活动是开放的,在座的嘉宾有相关方面的研究,欢迎和我们一起分享,伴随着嘉宾们的阵阵掌声,本期学术沙龙分享活动圆满结束。
腾讯研究院助理院长
腾讯研究院高级研究员
中国科学院博士
芝加哥大学博士
周子涵
卡内基梅隆大学
郑超月
北京大学
青岛智能产业技术研究院
现场回看
✎AI&Scociety学术沙龙简介
人类已经全面进入了智能社会,以人工智能为代表的新一代技术必将逐步渗透到我们的日常生活之中,并彻底改变我们的社会形态。那么,新一代的人机共生社会需要怎样的社会科学?社会科学的研究成果又如何促进人工智能的发展?人工智能会怎样影响人类社会?社会科学研究又如何借鉴人工智能领域的最新成果?
我们认为挖掘AI与社会领域有想法的年轻学者,促进AI与社会原创思想的交流与碰撞是探索、回答这一系列重大问题的第一步。因此,腾讯研究院S-Tech工作室与集智俱乐部共同打造了“AI&Society”的系列学术沙龙活动。
该系列沙龙以线下实体活动为主,我们将邀请AI与社会领域的交叉研究学者进行公开性的讨论与思想碰撞。沙龙的主题可涵盖但不限于如下的内容和主题:
计算社会科学(Computational Social Sicence)
社会计算(Social Computing)
多主体系统(Multi agent systems)
算法经济学(Algorithm Economy)
人工智能社会学(Artificial Intelligence Sociology)
群体智慧(Swarm Intelligence)
人类计算(Human Computation)
机器学习(Machine Learning)
技术与人类社会(Technology and Human Society)
人工智能与城市科学(Artificial Intelligence and Urban Science)
人工智能社会的憧憬和忧虑——AI&Society第一期活动回顾
AI in Urban Life|网络科学顶级国际大会NetSciX2018
Nature Communications论文解读:复杂的城市,简单的规则
集智QQ群|292641157
商务合作|zhangqian@swarma.org
投稿转载|wangting@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!
点击原文链接可收看直播