贝叶斯深度学习正在觉醒
正在觉醒的贝叶斯深度学习是发展具有较强鲁棒性和可解释性的人工智能的一种有效途径,能够有效应对“不确定性、不完全信息和开放环境”。
如果说科技领域也有“明星”的话,那么人工智能一定是其中一个。智能语音助手平台、在世界部分地区已经开始上路测试的无人驾驶汽车都是人工智能的舞台。就连面对人类最后的智慧堡垒——围棋——时,人工智能也能横扫顶尖围棋选手,在黑白两子间占据主动权:2016年初,谷歌公司研发的AlphaGo程序在人机围棋大战中战胜了世界冠军李世石,举世为之震撼;这一事实雄辩地证明具有自主学习能力的智能机器能够在某些方面超越人类。当然,这只是近期人工智能快速发展的一个例子。
实际上,随着大数据的增长、计算能力的提升以及算法的改进,人工智能技术正在与越来越多的领域深度结合,为人们的日常生活提供更多便利,提高生产效率和改善社会福利。自动驾驶、智慧金融乃至智慧生活都是可以预见的人工智能参与的未来。
︾
早期的人工智能方法多数以知识驱动为主,通过构造专家系统将人类知识或者经验进行符号化表示。这一方面最新的典型进展是辛辛那提大学开发的Alpha系统,该系统在2016年6月战胜了美国空军战术教官基纳.李(Gene Lee)上校,而且无一败绩。不过,专家系统虽然具有速度快、运算成本低和可理解性强的优点,但是其缺乏从底层特征形成高层特征的抽象能力,在很大程度上依赖于经验和高层特征,对不完全信息和不规则环境的建模和推理能力也较差。
近年来,以深度学习为代表的新一代人工智能技术在图像识别、语音识别等领域不断取得突破,极大地提高了当前机器学习算法的性能。数据驱动的深度学习方法可以自动地从数据中提取特征和进行抽象,挖掘其中的高阶相关性,但是这类模型的可解释性通常较差,对虚假信息的鉴别力也不足,容易犯关键性错误;同时,目前最好的深度学习系统(如AlphaGo系统)也只能用于具有完全信息的受限环境。
随着应用场景变得越来越复杂,人工智能技术仍面临着众多挑战。首先,由于环境噪声、物理随机过程、数据缺失等因素的存在,大数据中存在普遍的不确定性,这就要求人工智能技术具有不确定性建模和推理的能力。其次,在关键应用领域,由于隐私保护、欺骗、伪装等技术的运用,信息有缺有盈、有真有假是普遍存在的现象,这就要求人工智能系统能够去伪存真,在不完全信息的条件下做出正确的决策。最后,真实应用场景往往是开放的和动态变化的,场景中的概念随着时间可能增加也可能减少,这就要求人工智能系统能够自适应环境变化。为此,目前急需发展能有效处理“不确定性、不完全信息、开放环境”的人工智能理论和方法。
︾
针对这一现状,清华大学的研究团队在国家973计划项目“非结构化环境下的智能感知基础理论与关键技术”子课题“非结构化环境的表征、结构识别与异构推理”的支持下,对贝叶斯方法、大数据机器学习、深度学习等人工智能技术进行了深入研究,提出了多个创新理论和高效算法,并将研究成果应用于图像、视频、文本等数据的分析任务,取得了显著的性能提升。
要理解研究团队的研究,首先要理解贝叶斯定理。经典的贝叶斯定理由18世纪的英国教士托马斯.贝叶斯提出,迄今已有250多年的历史,给整个科学界和统计学界都带来了深远的影响。概括地说,贝叶斯方法是一种计算概率的方法,其前提是假设的先验概率、在给定假设下观察到不同数据的概率以及观察到的数据本身。以收到的邮件为例,假设我们收到垃圾邮件的概率为60%(先验概率),当我们收到一封包含“职称”的邮件时,这封邮件是垃圾邮件的概率(后验概率)有多高呢?这时便可以引入贝叶斯理论。简言之,贝叶斯方法的最终目的是寻找到能够处理不确定性的方法。
正则化贝叶斯为贝叶斯推理提供了第三维自由度,即后验约束
当然,以上只是一个简化的例子,研究团队要面对的问题则要复杂得多。在人工智能领域,经典的贝叶斯方法只能通过先验分布引入领域知识。为了破除这一困局,研究团队基于凸优化理论,提出了正则化贝叶斯,它为贝叶斯推理提供了额外维度,即为贝叶斯推理提供了除先验分布和似然函数外的第三维自由度——后验约束,可以显著提升贝叶斯方法在考虑领域知识和目标驱动优化方面的灵活性。通过后验正则化可以直接优化贝叶斯决策的目标,显著提升其在预测和决策任务上的性能。同时,为了处理大规模数据,研究团队还提出了高效的随机采样和分布式推理算法,在天河2号超级计算机上能够处理亿级文档的主题挖掘与理解。
深度生成模型示意图:其中z是简单的随机变量,通过神经网络变换后得到数据分布的参数(均值和方差)。
为了有效支持贝叶斯深度学习模型的编程实现,降低开发门槛,清华大学的研究团队还研发了ZhuSuan(珠算)平台,它基于谷歌公司的TensorFlow框架,在GPU上有效支持贝叶斯深度学习的模型实现和高效推理。在ZhuSuan平台上,用户可以像使用TensorFlow编写深度神经网络一样便捷,进而构建贝叶斯深度学习模型并实现推理算法。目前,该平台已经在Github上开源(详见https://github.com/thu-ml/zhusuan),受到广泛关注。
基于研究团队在该方向的上述进展,研究团队相信,正在觉醒的贝叶斯深度学习是发展具有较强鲁棒性和可解释性的人工智能的一种有效途径,值得深入研究,未来有望实现对不确定性、不完全信息和开放环境的有效建模和高效推理,推动人工智能在复杂场景下的应用。
致谢:感谢国家973计划项目“非结构化环境下的智能感知基础理论与关键技术”(项目编号:2013CB329400)的支持。
朱军:清华大学长聘副教授
>>>本文为原创,转载请回复。<<<
往期推荐