—— 青亭网
IBM AI辩手来袭,观点不奇葩,而且有理有据
hi188| 撰文
相信大家还记得2016年3月李世石大战Alpha Go的场景,AI技术从最初“不被看好”,到最后4:1击败人类顶尖棋手,一鸣惊人,此后关于AI的讨论更为广泛。与此同时,各式各样的AI应用也在不断刷新着公众的认知。
目前来看,AI技术的应用多数还是围绕语音、计算机视觉、自然语言处理、自动驾驶等方面展开,甚至也有不少更为深度的应用,例如医疗领域基于计算机视觉即可检测MRI图像中的肿瘤等。
当然,任何AI应用都需要大量的数据来训练, 而科技公司要做的就是训练出这些强大的AI,例如与李世石对战的Alpha Go就是依托1202个CPU和176个GPU的计算系统,同时不间断的去学习与训练才达到的结果。
为了寻找能够训练强大AI的场景,各个巨头们也是煞费苦心,例如谷歌在今年Google I/O大会上展示了Duplex应用,来模拟真实世界中对话沟通,不过目前其仅限于部分特定领域。
前不久,IBM也正式亮相了全新AI研究成果:Project Debater,这是一个AI辩手,该项目最初于2011年由IBM研究院以色列海法实验室提出,2012年开始研发,研发耗时6年,并号称是首个能与人类进行复杂辩论的AI系统。
6月份,IBM组织了一场Project Debater和人类辩手的比赛,两场辩论主题分别是“是否资助太空探索”、“是否增加远程医疗的使用”,而现场专业媒体和分析师认为虽然人类一方表达更好,但AI辩手传递信息量的丰富度要更优秀。
为什么是AI辩手?
AI的魅力就在于应用到各种想不到的应用场景中带来的正面收益。前面提到,寻找到适合训练出强大AI的场景至关重要,而IBM选中“辩论赛的辩手”并非偶然。
IBM在官网中介绍到,AI技术从早期基于文本的电子邮件垃圾分类;到模板化响应式的虚拟助手;再到能够回答开放性问题的阶段,例如Waton;现在来到了AI自由辩论时代,可以有意识的参与主题辩论,例如Project Debater。
众所周知,辩论比赛一般由两组选手分成正反方,就某一话题围绕讨论的知识性竞赛,这种形式能够训练人类的语言表达能力、知识储备能力、思维反应能力、团队协作能力等等。也就是说,辩论考验个人综合能力的项目。对于AI而言,辩论的形式为AI提供了理想的测试基础。
另外,日常生活中很多时候我们都面临着决策难题,现在该不该抛出某支股票等,而其中决策对于辩论而言至关重要,因为辩论时即兴的,难以预测对方观点,而回应过程则直接体现了辩论的经验丰富程度。由此来看,IBM选取辩论赛的辩手作为AI的应用场景也就不足为奇。
而对于IBM而言,Project Debater项目旨在通过公正的辩论散发人类的思维,而背后的AI系统则意在帮助人们在答案不是非黑即白时,做出基于证据的决定。
另外,辩论赛之所以“好看”就是因为辩手能抛出各种观点,很容易联想到《奇葩说》节目的火爆,这对于参观者而言更是一种学习的过程。但对于机器而言,其也试图创建一个能够搜集、分析、整理海量信息的系统,从而训练出一个能够更好的帮助人类做决策的AI。
据青亭网了解,当前Debater中包含了全球商业、法律、学术、政府机构等报纸杂志文章,维基百科等,当前共计多达数亿个有效信息来源。这是我的疑问是,如果当前Debater仅支持英语语言检索和英语的辩论,那么我想说的是,面对中文一语双关、成语复杂词汇的运用,如何做到理解并准确回应呢?要知道,每个地区的语言环境都有不同的特色,这点需要融合进AI里面就非常不容易。甚至我在想,如果机器能读懂N多种文字和语言,那么是不是它就可以随意创造一种新的语言呢?
另外巧合的是,谷歌在9月6日推出了数据集搜索功能,以帮助专业人士快速搜索相关内容,虽然还是只测试版,但联合谷歌Duplex前景不可估量。巨头们的想法总是不谋而合。
Project Debater的特色之处
首先,我们来看一下辩论赛的流程。开始前30分钟,双方拿到命题(事先均未知),收集准备资料,双方各有4分钟陈述自己观点,4分钟反驳对方观点,最后2分钟总结。
也就是说,Debater辩论流程和人类一样,赛前拿到命题、收集资料、准备演说稿,赛中需要实时听取对方观点、回应对方观点的整个过程基本相似。简而言之,Debater厉害之处就是能像人一样辩论,而且比人还快、还好。
是不是好?在之前的比赛中有一组命题中Debater扭转了观众最初的观点,而实际上还需要大量的实验和测试。
是不是快?拿机器和人来比本身就不公平,之前Alpha Go与李世石比赛时就有人觉得不公平,因为机器是多达几十个、数百个线程同时工作,而人类只是单线程,当然IBM并未公布Debater后端的配置。这点,最直观的验证就是给Debater一个命题,看看它最快能在多长时间内准备好,是否可以即时辩论。
对于机器而言,整个过程中难点在以下三方面:1,演说稿的整理和表述形式;2,听力理解能力;3,模拟人类困境,其中每个环节又可以拆分为N多个执行细节。
Project Debater在拿到命题后,首先拆解分析辩论问题,然后在从3亿多、的语料库中搜索(语料库是公开的),基于算法需按照与辩题相关性,整理出逻辑清晰、具有说服力、具备多样性、支持度最高的观点,然后再进行编排整理。
蓝色:能够应用到的行业/职业,紫色:辩论执行细节;绿色:涉及的技术领域
此外,IBM还讲到在此过程中系统会适时的展现出幽默风趣,并且具备一定的自发性。这点实际上无非是让AI更像人,实现起来并不容易。IBM研究员讲到,人类的幽默属性分为原创和复制型两种,而Project Debater只有复制一部分,同时会根据算法计算何时加入幽默因素已达到最佳表述效果,这其中确实存在一定的人为因素。
而听力理解的关键在于,从长达数分钟的连续语音中进行识别,并从中提取观点和要点,以便于后续的辩论。
模拟人类困境是一个复杂的系统,首先需要感知一件事情的好与坏,由于好与坏并非绝对意义上来区分,因此在通过利弊关系进一步分析做出决策。
左,IBM海法研究院-Projetc Debater全球经理 Ranit Aharonov;右:IBM海法研究院-Projetc Debater首席研究员Noam Slonim
其中,IBM研究员提到Debater通过DNN(深层神经网络)技术来提升语言理解能力,通过标签数据培训,并且加入弱监督学习模式,在遇到我认为、我想...等说法时进一步优化,以此来判断。此外,IBM官网透露其还将计划打造一个针对争议内容的搜索引擎。
而辩论比赛的观赏性就在于它不是一个有明确对错/输赢的结果,反而是辩论中双方提出的观点,以及观点之间的碰撞更值得关注。
对于机器而言,IBM研究员认为当前的挑战在于语言逻辑、表达形式等几方面,主要是将信息精准的传递给对方。诚然,即便是人类在日常生活中也经常存在因语言表述形式不同造成意义改变,何况对于机器。
应用领域
有不少AI学者提出,未来很长一段时间人类将会和AI协同工作,甚至部分工作完全被AI取代,虽然场景有些残酷,但迟早要面对,我们要做的事更早的改变观念。
试想,能够将信息精准的通过语言传递给对方,IBM Project Debater并不是一个AI辩手这么简单,虽然其已研发6年,目前依旧处于研发阶段,具体上线时间也未明确,但可以想象到的是它的应用场景极为丰富。
IBM研究员在本次采访中提到,Debater的应用适用于以下几种类型:1,收集分析大量信息类,包括金融顾问、律师等;2,分析决策类,例如新任CEO上任,通过AI拓宽思路、判断新策略可行性、提供基于事实的决策证据以避免人为因素影响等;3,助手类,例如学生可以通过AI提升沟通技巧或改进报告论文等,记者用于提升文章专业性等。
显然,Project Debater给我们描述一个未来新新人类的世界,用IBM研究员一句话总结就是:“挑战才刚刚开始”。
参考:http://www.research.ibm.com/artificial-intelligence/project-debater/research.html
(END)
推荐阅读
—— 青亭网