图像识别技术的基本原理

Original 21CTO 21CTO 2022-05-25

导读：本文为讲解图像识别的基本原理，可谓言简意赅，值得收藏。

何为图像识别技术

文本识别，人脸识别都是图像识别的应用，但是这只是图像识别的基本应用。先进的技术已经能够识别出猫还是狗来了。

它们是怎样做到的？在专门研究图像识别技术的专家的透露出一些原理，本文就综合给大家。

人类在确定物体之前先确定其轮廓，据此原理，图像识别技术也依此理，首先识别的是图像的轮廓。

美国加利福尼亚大学的Adit Deshpande写过一篇《理解卷积神经网络的初学者指南》的文章。在其中，作者以一种相当容易理解的方式介绍了图像识别算法和基本成因。

计算机会将图像转换为数字形式的数组——因此“图像识别”实际上对数字数组的分析。在通常情况下，开发者可以将图像缩小到49*49像素，并将每个像素的彩色信息转换为灰度值，以获得49*49的矩阵，以排除其它信息。

接下来，从左上角逐一取出一小块数组进行计算。如下图示：

请看如下范例：

左边的图是7x7的灰度矩阵，右边的图是曲线。曲线的边缘灰度值较高，其它位置值全为“0”。

从现在开始尝试进行图像识别，以下是只老鼠的图像：

以左上角块为例，将其转换为灰色矩阵，将矩阵重叠处的数字相乘，得出结果为6600，这是一个很大的数字。

而对老鼠的头部矩阵进行运算，其得出的值为0.

小结

针对于图像扫描的结论是，当计算结果值较大时，图像匹配部分也会很多。通常，需要预先准备很多模式，为每个数组块计算最佳模式，最后再判断整体。

作者：天机
来源：21CTO

关于21CTO
21CTO.com是中国互联网第一技术社交与学习平台。为CTO、技术总监，技术专家，架构师、技术经理，高级研发工程师、PM等提供学习成长，教育培训，工作机会、人脉影响力等高价值的在线教育和社交网站。