其他
上一期:大脑感知物体的过程伴随着复杂的语义认知。这一期我们一起来了解:计算机是如何认识物体的,又是怎么理解语言的,最后这两者是如何结合到一起?我们都知道,一张图像是由成千上万个像素点组成,不同位置的像素点呈现出不一样的颜色。当这些像素以一定的规则组织在一起的时候,你站在远处看这些单个看来没有含义的颜色,突然就认出来这是一幅梵高的自画像。这仍然是你看到的事物,要让计算机理解它看到的是什么,就需要学习一些计算机视觉的相关知识。计算机视觉解决的基本问题是,计算机怎么样辨别出图像中哪些像素组织在一起是有意义的。这里就产生一个最简单的语言概念——类别(class)。当我们尝试去认识一个事物时,我们通常会用一个名词来指代它,同类型的一事物往往具有相似的外表,或者类似的功能,当然很有可能也是由同样的化学成分组成的。有了类别这个语言概念,计算机就有了目标:把图像展现的物体归类到具体的类别中去,这个过程被称为“分类”(classification)。为了完成分类任务,研究计算机视觉的科学家们定制了一套特征工程的方法:特征提取和特征分类。一幅图像中可以提取的特征:颜色特征、形状特征、纹理特征、空间关系特征,分别从不同的角度来表示图像的特性。在同类别的事物身上,这些特征往往具有一些统计特性,通过一些特征提取的方法,计算机可以提取到视觉上稍有不同的同类事物相似的特征,这些特征经过一个分类器就可以得到特定的类别。经过这个过程,图像最基础的语言概念就诞生了。深度学习统一了机器学习“特征提出,特征分类”两步走的特征工程方法而想要得到更丰富的语义概念,比如让计算机去讲述一幅图像中的内容,我们就不得不借助更强大的工具来实现