如何学习计算OpenCV
如何学习OpenCV
一:学习OpenCV三个阶段
人工智能带火了计算机视觉的人才需求,作为计算机视觉应用开发框架OpenCV也越来越受到欢迎,市场需求大增,很多人听说了之后就迫不及待的想加入这波大军,这其中很多人他可能懂应用编程,但是计算机视觉零基础,一般都是我要识别个什么,而且还有时间限制,一般都是一个月左右时间,急功近利的心态可见一斑,学了几个API之后看到了点效果就觉得OpenCV也没什么嘛,感觉跟我搞应用开发一样啊,很快上手啦,就在这个时候发现应用场景稍微有点改变,之前那一点点的效果也没有了,什么都识别不了,然后又发现还有这么多东西要学,才发现这个算法没听说过、那个算法不知道,甚至连他自己调用的算法API那些参数是什么意思也没搞懂怎么调,于是他们就会抱怨OpenCV做的也太差了,压根不行啊,才发现做计算机视觉好难,其实是他们学习OpenCV的打开方式不对。正确的打开方式应该是这样:首先学习基础,如何知道自己的图像处理与计算机视觉的基础如何呢,很简单如果你能正确回答下面的十个问题,那说明你还是有点图像处理基础的。
1.图像常见的格式有
A.jpg B.tiff, C.png, D.webp
2.常见的图像通道数可能是:
A. 单通道 B.双通道 C. 三通道 D.四通道
3.数字图像中最小数据单元是什么
A. 像素 B.亚像素 C.超像素 D.颜色
4.常说的图像滤波是什么数学原理
A. 傅立叶变换, B.离散余弦变换 C.卷积 D.距离变换
5.常见的图像插值算法有
A. 最近邻 B. 双立方 C. lanczos插值 D.双线性
6.常见的RGB图像每个像素点颜色值范围
A. 0~1 B. 0~256 C.0~255 D.0~180
7.关于RGB色彩的描述下面正确的是:
A.RGB(255,255,255)表示黑色 B.RGB(0,0,255)表示蓝色 C.RGB(255,0,0)表示绿色 D.RGB(0,0,0)表示白色
8.常见的图像色彩空间有:
A. HSL B. HSV C. RGB D. YCrCb
9.常见的图形绘制时候像素渲染方法有
A.四邻域渲染 B.八邻域渲染 C.透明通道混合反锯齿渲染 D.游戏渲染
10.下面关于RGB图像亮度与对比度说法正确的是
A.颜色值越高,亮度越高 B.降低图像亮度会影响图像对比度 C.亮度就是图像对比度 D.图像对比度就是图像直方图
上面10道题是图像处理基础知识考察,其考察目的是检验是否拥有学习OpenCV一些必备的基础知识,如果你一半都没有做对(关注公众号,发送 【答案】两个字,即可查看答案),我觉得暂时你应该先放下你的那些识别、检测的目标,而是老老实实的看视频课程或者图书、博客文章等,厘清这些基本概念,本人根据自己学习图像处理、计算机视觉与OpenCV亲身经历,总结一个学习路线图,仅供大家参考:
大致分为三个阶段,第一个阶段应该是基础,第二个阶段是提升、第三个阶段是应用,而很多初学者一般都看重的是第三部分,素不知前面还有N多东西没学,正所谓“千里之行,始于足下”。只有走好学习OpenCV的第一步我们才能走好剩下的999步。否则就会出现“欲速则不达”的尴尬局面,貌似懂,一做应用什么都不行,调用哪个OpenCV算法函数都无法解决问题的进退维谷之中。
二:做内外兼修的OpenCV开发者
OpenCV3.x中集成了超过1000个算法模块,这些算法如何组合使用,他们的参数意义,算法的原理与适用场景条件等各不相同,要成为一个真正的OpenCV开发高手,必须精通常见的算法原理,各个参数意义,参数使用等,就拿我们最常见的OpenCV中HAAR人脸检测来说吧,整个代码演示我可以做到20行以内实现,但是具体到应用场景,我就听到有人跟我说HAAR级联人脸检测速度太慢了这样的抱怨,原因是他连最基本的各个参数是什么意思都没搞清楚,更谈不上调参数优化啦HAAR级联检测器API调用如下:
void cv::CascadeClassifier::detectMultiScale
(
InputArray image,
std::vector< Rect > & objects,
double scaleFactor = 1.1,
int minNeighbors = 3,
int flags = 0,
Size minSize = Size(),
Size maxSize = Size()
)
第一个参数image是输入图像 第二个参数objects检测到的人脸BOX位置信息 第三个参数是放缩比率,这个参数是用来构建HAAR多尺度用的, 第四个参数是计算人脸BOX的最小相邻个数 第五个参数是标志,在OpenCV3.0以后的版本中已经不再使用,没有任意意义 第六个参数是检测人脸时,可以检出BOX的最小宽高 第七个参数是检测人脸时,可以检出BOX的最大宽高 上述的七个参数,对检测速度与检测结果影响比较大的分别是第三、第四、第六、第七个参数,第六与第七个参数是设置大小,这个很容易理解,比较难理解的是第四个,最小相邻个数,假设最小相邻数目取3、则有下图:
表示在最终红色BOX人脸检测结果是基于HAAR级联检测砖红色、青色、蓝色框的求得平均值得到红色BOX框,理论上3表示至少有三个候选,这个参数值越大,检测结果输出人脸的准确率越高,同样耗时也会越长、还会导致漏检率增加。而很多初学者没有仔细了解该参数的意义,更无从谈起如何优化参数,另外三个参数,如果考虑速度的话,最好设置最大与最小可检测人脸BOX范围,这里有利于减少计算时间,提升实时性能。这里只是通过这个例子来说明OpenCV中的各个算法API参数重要性,要成为OpenCV开发高手,个人认为要做到内外兼修,这里内是指相关数学、算法论文都认真读、仔细的研究,不断加深对相关算法的理解与领悟;外是指要加强动手能力,编程能力,做为OpenCV开发者我们首要职责就是负责让视觉相关应用落地,没有很强悍的工程能力与解决问题能力很难做到这点。结合本人的亲身实践和学习路径,建议在学习OpenCV 编程时搞清楚几点对学习更加有帮助
1.学习API函数时查找相关论文,尝试阅读论文
2.搞清楚学到的每个算法相关数学基础,尝试理解相关参数意义
3.学会看OpenCV官方的文档与代码示例
4.古语云“独学而无有、孤陋则寡闻”,所以多认识一些OpenCV学习者与开发者
5.从最新版本开始学习,OpenCV已经发布了OpenCV3.4.1最新版本,建议学习从OpenCV3.4开始学习,避免学习一些过期的API给自己带来不必要的烦恼与负担。
6.C++还是Python,当前OpenCV SDK支持C++与Python SDK,所以无论选择哪一种语言都可以学习OpenCV。
三:关注业界动态、紧跟技术潮流
如果你成功了经历了前面几个阶段,应该恭喜你是一个真正的OpenCV开发者啦,但是这个时候还有清醒的意识到你只是一个知道和熟悉常见OpenCV中算法、使用它们解决实际问题的开发者而已,要学会关注业界动态,关注OpenCV框架的新发展与新动向、特别是新算法在OpenCV框架中的实现与SDK发布,举例来说DNN模块发布已经快一年了,本人一直跟踪OpenCV的每个Release、深刻感受到它的功能越来越完善与强大,个人观点以后OpenCV的大部分对象检测与识别都可能基于DNN模块实现,这样的好处是对开发者显而易见,即降低了学习门槛,有提高了检测准确性与精度,对于DNN这样的新模块,作为OpenCV开发者的你是否一直在不断跟踪它,另外注意学术界的动态,OpenCV社区会很快把一些最新CVPR上面的论文变成想法算法模块的,所以对一些影响比较大的CVPR的论文有条件要及时跟进阅读与理解。
很多人想学习人工智能相关的热门技术,我觉得OpenCV就是很接地气,也很好的方向选择,也不需要太过深奥的数学知识,即使零基础也可以学会、学好。正如古人所说“假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也,善假于物也”,借助OpenCV这个神兵利器,开发者也会从检测到识别无所不能。
后记:
也许不适合所有人,但是如果能对初学者有一点帮助,也算值得我写下上面几百字的肺腑之言了!
千里之行、始于足下。
关注【OpenCV学堂】
长按或者扫码下面二维码即可关注
+OpenCV识别交流群 657875553
进群暗号:OpenCV