其他
仿生眼:机器人视觉崛起 引发新物种大爆炸?
张晓林
中国科学院上海微系统研究员中科院上海微系统与信息技术研究所仿生视觉系统实验室主任入选上海市千人计划 中组部千人计划特聘专家在仿生视觉领域提出了独自的双眼视觉运动控制理论申请中国、日本、美国等各国专利30余项 已有多项研究成果被产品化
https://v.qq.com/txp/iframe/player.html?vid=o032824rehv&width=500&height=375&auto=0▲张晓林在SELF讲坛
在寒武纪时期,发生了著名的生物大爆炸。研究认为,是海洋虫的大脑细胞产生了感光效应,感光细胞慢慢变成了眼睛。正是因为眼睛的形成,生命开始大量诞生。
脊椎动物的眼睛是进化的一个转折点,几乎所有的脊椎动物都有两只眼睛,而且都是可以转动的,但又细分成四种类型。
第一种是食草型动物眼睛,比如说兔子,它有360度的视角,能看到四面八方的事物,但遗憾的是它没有立体感,这与它只需要防止被猎物吃掉而不需要捕食有关。
第二种是食肉型动物眼睛,它需要捕捉动物而且还要精确测量对方的距离,所以它们的眼睛接近于人眼,例如老虎的眼睛。
第三种是鹰眼,单独把鹰眼列出来是因为它比较特殊,我们人类的眼睛只有一个中心凹的结构,而鹰眼有两个中心凹,它在一千多米的高空往下看时用的是深度的中心凹,在发现目标后快接近地面的时候用的是近的中心,所以它抓取猎物又快又准。
而第四种则是人眼。
其中,对个体的感知是人眼最基本的功能——对自身和对象位移的测量,尺寸的测量。而最重要的功能是对自身和对象位置的测量,比如走了多少,转了多少,这是一种对空间环境的感知和判断。
这种相对位置关系我们称之为标准辐辏,它非常精密,并有六个自由度(可以进行上下左右旋转运动),左右眼之间的上下旋转、距离高低,都能轻易地做出判断。
人眼还有三种功能:
第一种功能叫做前庭动眼反射,在人的耳朵里有半规管和耳石,是用来测量头部的旋转和平移运动的,它能控制人眼处于平稳的状态。
第二种功能叫颈眼反射,就是脖子的肌肉对眼睛的控制功能。
第三种功能很重要,叫跳跃性眼动。顾名思义,就是当视线从一个物体转移另一个物体时,眼睛有一个高速的条约,可达到每秒钟800度,在这段跳跃的时间中,所有图像是被切断的,看不见模糊的那一部分,但这恰恰在机器人的身上是难以跨越的一道鸿沟。
要在机器人身上模仿人的眼睛,主要分三大部分:第一是机器人眼球构造,第二是运动控制系统,第三是图像处理。
现在正在做第四代机器人,它把各个眼球运动的功能算法都存在芯片里,与视觉云和互联网相连接,使它不断接近于人眼甚至超过人眼的功能。
▲机器人眼中的世界及运动轨迹
然后是前庭动眼反射,用到了陀螺和加速传感器把信号加载到视觉反馈系统里,即使快速转动视线也不会跑偏,最后是跳跃性眼球,在六、七年的时间里给机器人加上了视觉里程计功能,通过深度的三维重建,能感应到障碍物的远近,可以按照自己的轨迹运动。
在仿生眼达到人眼的基本功能以后,有很多地方它甚至能超越人眼。
比如说仿生眼可以变焦,眼球机构的转角传感器的精度提高能使测量精度精准许多;控制速度上也能远远超越人眼的反应;信息处理上可以同时处理大量数据,这是人脑办不到的。
仿生眼技术的日趋成熟也会惠及到我们的生活中,我们现在的视觉系统用的主要是主动视觉,像雷达放出能量通过反射信号测算距离,广泛地运用于无人驾驶。
但张教授表示今后被动视觉将占有一席之地,单目或双目视觉系统将不再陌生。当然,最典型的应用当属全自动3D摄像,在电影《阿凡达》拍摄之后,大家开始意识到全自动3D摄影的重要性,得益于机器人仿生眼功能的灵感,目前也制作完成了全世界第一个可以自动拍摄3D的系统。
SELF格致论道是中国科学院计算机网络信息中心和中国科学院科学传播局联合主办的公益讲坛,每月一期。SELF是 Science, Education, Life, Future的缩写,提倡以"格物致知"的精神探讨科技、教育、生活、未来的发展,尝试打破过去纯粹以“知识传播”为主的科普形式,专注于思想的传播,力图从思想的源头上促进公众参与科学的积极性,打造具有中国科学院特色的、融合创新、科学与人文关怀并存的公益演讲品牌。
登陆“SELF格致论道”官方网站、关注微信公众号“SELF格致论道讲坛”获取更多信息。本期视频也将陆续在中国科普博览上推出,敬请关注。更多合作与SELF工作组self@cnic.cn联系。
※作品未经授权,禁止转载,转载及合作请联系self@cnic.cn。※
▼▼▼
SELF讲坛往期精选
✔点击左下角“阅读原文”登录SELF官网查看更多演讲视频。
扫描科普博览二维码
关注更多精彩