点击上方“深度学习大讲堂”可订阅哦!深度学习大讲堂是高质量原创内容的平台,邀请学术界、工业界一线专家撰稿,致力于推送人工智能与深度学习最新技术、产品和活动信息! 摘要 CCAI2016大会期间,美国人文与科学院Poggio院士介绍了从脑启发的视觉认知模型H-max到深度学习的变迁,从宏观维度上阐述了神经科学与深度学习研究的紧密联系,并通过介绍CBMM的组织结构与研究目标,展望了神经科学与智能科学研究相互融合的未来。 导读 Tomaso A. Poggio教授任职于MIT麦戈文脑、计算机科学与人工智能实验室,同时他也是美国人文与科学院院士。Poggio院士长期从事脑认知科学方面的研究,他所带领的实验室认为不论从自然角度还是人工角度,学习一直都是解决智能问题的核心。学习是了解大脑运转规律的途径,进而才可能制造智能的机器。故此,该实验室采用多学科融合的方式研究大脑学习的相关问题。目前该实验室的研究重点为大脑运作机制以及如何把该原理结合统计学运用于数学和计算机科学。 本次CCAI2016大会,Poggio院士带来的报告题目是《The Science and The Engineering of Intelligence》,系统阐释了智能科学与智能工程的概念,并提出智能工程的发展依赖于智能科学基础研究的进步。同时他也介绍了MIT CBMM(the MIT Center of Brain, Minds and Machines)的研究目标——促进神经科学、计算机科学、机器学习多领域协同发展。图1. Poggio教授主页上的照片背景回顾:Hubel & Wiesel的发现 回顾历史,今天大红大紫的深度学习模型的神经科学鼻祖可以追溯到 Hubel和Wiesel 于1959年通过研究猫的视觉皮层感受野提出的视觉神经系统的层级结构模型 ,即从简单细胞到复杂细胞、超复杂细胞的层级信息处理结构。图2. Hubel和Wiesel 提出的视觉神经系统层级结构模型Hubel和Wiesel的研究成果在1981年获得诺贝尔生理学或医学奖,获奖理由是“their discoveries concerning information processing in the visual system”, 即他们关于觉系统信息处理机制的发现。图3. Hubel和Wiesel在1981年获得诺贝尔奖之后进行庆祝2 H-MAX与大脑 1999年,在LeCun发明LeNet之后的一年,人工神经网络的研究进入了第二次凛冽的寒冬。Poggio另辟蹊径,提出了大脑皮层中物体识别的层级模型H-max。简单来说,H-max是一个生物启发的计算机视觉模型,一定程度上受到了Hubel & Wiesel模型的启发。 H-max模型的一种实现是将简单细胞S1实现为Gabor滤波器,复杂细胞C1实现为Max-Pooling,组合特征细胞S2实现为加权和,复杂组合特征细胞C2实现为Max-Pooling。图4. H-max模型示意图,摘自http://maxlab.neuro.georgetown.edu/hmax.html实际上,H-max模型的层级结构与大脑中的视觉通路具有一定的相似性。在大脑中存在一个从视网膜到LGN(侧膝体)再到初级视觉皮层最后到高级功能区的一个视觉通路,如下图所示。图5. 大脑视觉通路图解,摘自北京大学黄铁军教授讲座PPT在Poggio院士的讲座中,给出了一张利用大脑中的ventral stream(腹通路,被认为和视觉通路紧密相关)来解释H-max有效性的图示,见下图。需要指出的是,虽然从结构和功能上H-max都和大脑的视觉通路有很多相似性,但是简单的将H-max理解为模拟了大脑的视觉机制并不准确。大脑的结构和机制更加复杂,比如注意力机制、反馈机制、更复杂的神经元连接等,这些都是H-max模型未能建模的。图6. 借助大脑的Ventral Stream机制解释层级的前向视觉模型的有效性从Hubel-Wiesel的发现到深度学习 Poggio院士在讲座中总结了从Hubel-Wiesel的发现到深度学习(主要是卷积网络)的发展历史。领域前辈的智慧在这一页PPT中熠熠发光。这里面代表性的工作有福岛邦彦的神经认知机Neocognitron,有LeCun的LeNet,Poggio的H-max,以及2011年Freeman和Simoncelli发表在Nature上的工作Metamers of the ventral stream等。 图7. 从Hubel-Wiesel的发现到卷积网络 万变不离其宗,Poggio梳理出了视觉皮层、视觉模型与深度学习网络之间的共性:层级结构。图8. 层级结构是H-max和深度学习的共同信仰 CBMM的终极理想 Poggio院士近年来的工作重心放在了CBMM (Center of Brain, Mind and Machine)研究中心。CBMM位于MIT,拥有堪称豪华的研究阵容,研究人员来自Caltech、NYU、MIT、Mobileye和Deepmind等知名研究机构。 图9. 堪称豪华的CBMM研究团队 CBMM的主要使命是推动对智能的理解——理解大脑如何产生心智、大脑如何工作和如何构建智能机器。CBMM的主要目标是在理解智能的科学上取得进步从而更好的进行智能的工程化。Poggio院士的理想和信仰,坐落在神经科学与人工智能融合的王冠之上。图10. CBMM打通神经科学与人工智能的终极理想 致谢:本文作者在此感谢CSDN的赠票和优秀的会议组织,以及深度学习大讲堂的特邀记者邀约。此外,感谢中科院计算所博士生邬书哲对本文技术内容的修订。 参考资料: [1] http://cbcl.mit.edu/people/poggio/poggio-new.htm[2] Riesenhuber, M. & Poggio, T. (1999). Hierarchical Models of Object Recognition in Cortex. Nature Neuroscience 2: 1019-1025.[3] http://cbmm.mit.edu/ 该文章属于“深度学习大讲堂”原创,如需要转载,请联系loveholicguoguo。 作者简介:尚静,毕业于复旦大学金融工程专业,现任紫牛基金投资经理。90后野生动物一只,认知神经科学与人工智能学习者与爱好者,欢迎高智商理工生一起交流,请注明自身特质和兴趣点,微信号jingzi12300。 往期精彩回顾近期GAN的模型和理论发展基于深度学习的视觉实例搜索研究进展【CCF-GAIR特别报道】深度对话周志华教授和颜水成博士【青年学者专栏】递归神经网络(Recurrent Neural Network)学习一箭N雕:多任务深度学习实战天津大学深度学习一线实战研讨班干货总结与资源下载欢迎关注我们!深度学习大讲堂是高质量原创内容的平台,邀请学术界、工业界一线专家撰稿,致力于推送人工智能与深度学习最新技术、产品和活动信息!深度学习大讲堂