粉丝新年福利:人类视觉计算理论经典著作,豆瓣评分9.7!(免费赠送关注者)
关注并星标
从此不迷路
计算机视觉研究院公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
作者:Edison_G
除夕即将到临,计算机视觉研究院为了感谢大家的一直支持与关注,今天我们将新出的计算机视觉类书籍免费赠予大家!文末提供了获取方式!
今天给大家介绍一本豆瓣评分高达9.7分、成书于40多年前的神书:
Vision:A Computational Investigation into the Human Representation and Processing of Visual Information!
这是一本影响一代脑、认知、计算机视觉专家的经典著作!
在计算机视觉领域,本书至少做出了两个重大贡献:
1. 提出了视觉研究需要相对独立地考虑包括计算理论、算法和神经实现在内的三个“理解层次”。
2. 提出了视觉计算理论。
两者都对包括计算神经科学和人工智能在内的多个领域产生了深远的影响。其中,“理解层次”这个概念的影响或许更大、也更根本。
在近年深度学习的热潮之中,了解掌握本书介绍的视觉计算理论对于在人工智能和计算机视觉领域内开展进一步探索是至关重要的。
如今,这本伴随着众多技术专家“长大”的经典著作有中文版啦!!!
这本书为什么影响深远
01. 计算机视觉在过去十年的巨大进展,与书中提出的“理解层次”有本质的关联。
在计算机视觉领域,非常重要却又常常被忽视的就是计算理论的进展:计算机视觉究竟要计算什么?
客观地说,在过去十年中,计算机视觉领域内取得最大进展的是语义上的判别任务。这其中又以语义上的图像识别和分类为代表:图中有一条狗还是一只猫?
计算图像分类这样的任务,在今天看来似乎是天经地义的。
其实不然,探索计算的目的是一个漫长的过程。
Marr关注的低层视觉和三维结构的重建在很长一段时间内主导了计算机视觉的研究,而低层视觉和三维重建确实是人类视觉中不可或缺的部分。
除了计算理论的进展,计算机视觉领域过去十年的爆发式进展还应当归功于(以卷积神经网络和反向传播算法为代表的)算法、(以 GPU 为代表的)硬件实现和(以ImageNet 为代表的)数据这几个层次的进展。其中,计算理论、算法和实现三者与Marr 的三个理解层次完全符合。
02. 书中提出的计算理论指导着对AI和CV领域的深入理解。
书中提出的计算理论似乎与当今部分深度学习领袖所强调的“完全从数据中学习”的概念格格不入。
但这里想指出两点。
其一,现有的深度学习架构有其内在的归纳偏置,如卷积神经网络的空间局部性、循环神经网络的时间局部性、Transformer 的自相似性,等等。而本书中讨论的许多基本元素,恰与这些归纳偏置有内在的关联。
其二,如果我们还试图在人工智能和人类智能之间建立联系(这本身也逐渐成为一个有争议的话题),那么任何的偏置是应该被预先设计,还是应该通过学习得到,就与人类认知科学中的先天与后天的概念,以及神经科学的内在机理,产生了千丝万缕的联系。
而这种联系也正是本书作为计算神经科学的教科书,可以长期对人工智能有深刻启发和深远影响的原因所在。
李飞飞同事翻译
本书译者是来自斯坦福大学计算机科学系的助理教授吴佳俊。
其研究方向是计算机视觉、机器学习和计算认知科学。加入斯坦福大学之前,曾是谷歌研究院的访问研究员,并分别在清华大学和麻省理工学院获得了学士和博士学位。
他的研究曾获ACM博士学位论文荣誉提名奖、AAAI/ACM SIGAI博士学位论文奖、麻省理工学院George M. Sprowls人工智能与决策博士学位论文奖,以及2020年三星人工智能年度研究人员奖。
适读人群
心理学、神经科学、计算机科学、人工智能、计算机视觉等相关专业的研究人员、研究生及高年级本科生等学习使用或作为研究参考。
京东满100减50,快快扫码抢购吧!
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
扫码关注
计算机视觉研究院
公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式
往期推荐
🔗