OpenCV实现0到9数字识别OCR

From gloomyfish OpenCV学堂 2019-03-29

- 高能预警，结尾有福利! -

使用OpenCV对0到9数字进行识别，实现简单OCR功能，基于CA（轮廓）分析实现特征提取，基于L1距离计算匹配实现数字识别。在排除干扰的基础上，识别精度可以达到98%以上。整个算法分为两个部分，第一部分是特征提取，提取的特征实现了尺度不变性与轻微光照与变形干扰排除，第二部分基于特征数据进行匹配实现了相似性比较，最终识别0到9十个数字。

第一部分详解：

算法的第一部分主要是实现以下功能，提取42个特征向量，用其中40个向量做匹配识别，另外两个向量做辅助检查。比如0跟1的横纵比有明显差别。特征提取的主要步骤如下：

1. 图像去噪声与二值化 2. 轮廓发现与ROI区域分割 3. 水平与垂直投影，提取20个向量，并归一化 4. 网格分割5x4，提取20个向量，并归一化 5. 宽高比与空白比，总计42个向量提取完成

预处理通过高斯模糊去噪声，然后通过全局阈值实现图像二值化，使用轮廓发现提取ROI矩形区域，对每个区域完成3～5步，实现特征提取，其中水平与垂直投影演示如下：

对ROI区域的水平与垂直投影分别分成10个BIN，考虑到浮点数划分，每个BIN长度不一定是整数，这样就通过权重进行按比例分割像素点。完成每个BIN的前景像素点统计。

同样对数字ROI区域实现5x4的网格分割，每个Cell计算前景像素个数，也会借助权重比例进行分割，最终得到归一化之后的20个特征向量。

这样得到的40个特征向量具有放缩不变性与轻微抗干扰变形能力。

第二部分详解：

运行截图：

训练数据：

输入数据：

识别结果：

观察结论

训练数据和识别数据在字体、大小上均有差异，然而根据提取的特征进行匹配，均可识别，充分证明了本识别算法的尺度不变性与局部抗干扰能力。

执行代码

int main(int argc, char** argv) {
Mat src = imread("D:/vcprojects/images/td1.png");
if (src.empty()) {
printf("could not load image...\n");
return -1;
}
namedWindow("input image", CV_WINDOW_AUTOSIZE);
imshow("input image", src);
// 训练
train_data();
// 测试
test_data();
waitKey(0);
return 0;
}

福利 - 视频6折甩卖

6月30日20:00 - 7月2日24:00，

本人视频课程全部6折！

购买课程永久免费答疑，错过又要等一年！

扫描下面二维码即可购买视频课程

源码获取:

购买任意一门课程，关注公众号后发送51CTO学院注册ID与个人邮箱至本公众号，24小时内源码演示程序发送到指定邮箱。

更多原创文章推荐

OpenCV实现图像连通组件标记与分析

基于OpenCV实现手写体数字训练与识别

OpenCV图像噪声与去噪函数方法对比使用介绍

OpenCV学堂-原创精华文章

关注【OpenCV学堂】

长按或者扫码二维码即可关注

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！