STM32也能玩高大上:实现目标分类
The following article is from 嵌入式案例Show Author 嵌Sir
STM32也能实现目标分类?本文使用的芯片是STM32F103VCT6, 最大工作频率72M,64KB RAM, 256KB FLASH。资源就那么点,这些高大上的基本都是DSP、高级ARM之类芯片玩的,你一个这么点资源的芯片凑什么热闹。但是笔者经过多年在嵌入式方面的经验,成功实现了基于STM32的目标分类,下面把实现的过程和大家分享下。
受限于芯片资源,我们设计的算法不能太复杂,主要体现在几个方面:
1、识别目标的特征不能太多。
2、具体的算法要简单,不然CPU跑不动,不能实现实时性。
基于这两点笔者给大家分享一个在STM32平台上实现用颜色来识别人民币的面额,大家都知道,人民币的每个面额的颜色都不相同,如下图:
从图中可以看出,人民币每个面额颜色都有区别,所以我们可以采集人民币的颜色数据作为识别的特征。在本项目中用到了两组颜色传感器,当纸币经过时,通过AD循环采集纸币的RGB颜色数据,这样就得到了用于计算特征的数据。
目标分类一般有两个步骤:一是提取特征,二是根据设计的分类器对特征数据进行分类,下面就这两部分进行说明。
01
人民币颜色数据的特征提取
这里先给大家讲解下颜色的HIS颜色模型,HSI是指一个数字图像的模型,是美国色彩学家孟塞尔(H.A.Munsell)于1915年提出的,它反映了人的视觉系统感知彩色的方式,以色调、饱和度和亮度三种基本特征量来感知颜色。HSI模型的建立基于两个重要的事实:第一个,分量与图像的彩色信息无关;第二个,H和S分量与人感受颜色的方式是紧密相联的。这些特点使得HSI模型非常适合彩色特性检测与分析。
色调H(Hue):与光波的波长有关,它表示人的感官对不同颜色的感受,如红色、绿色、蓝色等,它也可表示一定范围的颜色,如暖色、冷色等。
饱和度S(Saturation):表示颜色的纯度,纯光谱色是完全饱和的,加入白光会稀释饱和度。饱和度越大,颜色看起来就会越鲜艳,反之亦然。
亮度I(Intensity):对应成像亮度和图像灰度,是颜色的明亮程度。
通过上面的介绍,大家应该明白,我们要把采集到的RGB颜色数据转换HIS模型上,如下图:
具体的转换公式为:
代码如下:
void rgb_to_ish(int r,int g,int b, double *I,double *S,double *H)
{
double R,G,B;
R=(double)r/255.0;
G=(double)g/255.0;
B=(double)b/255.0;
*I=(R+G+B)/3;
if(*I<0.001)
{
*H=0;
*S=0;
return;
}
*S = 1-(min(min(R,G),B)/(*I));
if(*S==0)
{
*H=0;
return;
}
*H=((R-G)+(R-B))/2/sqrt((R-G)*(R-G)+(R-B)*(G-B));
if(G>B)
{
*H=acos(*H);
}
else
{
*H=2*M_PI-acos(*H);
}
*H/=2*M_PI;
}
在转换之前,首先需要对RGB数据进行归一化,调整到同一长度下,代码如下:
void ResizeData(const u8 *pOldData,I32 len,u8 *pNewData, I32 newLen)
{
I32 i,tx,xx,dxi;
I32 t;
for (i = 0; i < newLen; i++)
{
tx = i*1024*(len)/(newLen);
xx = tx>>10;
dxi=tx-xx*1024;
t = ((((I32)pOldData[xx+1]-(I32)pOldData[xx])*dxi)>>10)+(((I32)pOldData[xx]-(I32)pOldData[xx+1])*dxi>>20)+(I32)pOldData[xx];
if (t > 255)
{
t = 255;
}
pNewData[i] = t;
}
}
对提取特征总结下:
1. 对RGB数据进行归一化
2. 转换为HIS模式表示
一张人民币提取到的特征如下:
1 1:360 2:441 3:408 4:430 5:402 6:432 7:411 8:493 9:451 10:476 11:480 12:463 13:468 14:456 15:497
16:458 17:514 18:458 19:519 20:470 21:509 22:467 23:512 24:458 25:520 26:457 27:482 28:451 29:446
30:448 31:427 32:440 33:415 34:428 35:396 36:425 37:398 38:432 39:380 40:452 41:403 42:422 43:444
44:426 45:416 46:385 47:512 48:280 49:316 50:663 51:324 52:464 53:384 54:448 55:406 56:453 57:425
58:492 59:442 60:545 61:440 62:546 63:481 64:527 65:515 66:527 67:534 68:528 69:533 70:520 71:514
72:535 73:503 74:559 75:532 76:544 77:555 78:520 79:544 80:520 81:523 82:505 83:519 84:480 85:528
86:427 87:533 88:330 89:385 90:344 91:320 92:425 93:346 94:473 95:403 96:462 97:446 98:446 99:455
100:468 101:464 102:482 103:491 104:461 105:481 106:451 107:468 108:425 109:455 110:417 111:431
112:367 113:405 114:339 115:347 116:353 117:335 118:372 119:354 120:370 121:346 122:380 123:305
124:444 125:350 126:445 127:414 128:387 129:432 130:354 131:408 132:356 133:345 134:402 135:350
136:407 137:364 138:377 139:337 140:391 141:326 142:429 143:356 144:476 145:456 146:439 147:458
148:441 149:460 150:439 151:456 152:439 153:459 154:443 155:458 156:439 157:469 158:433 159:473
160:433 161:478 162:444 163:469 164:445 165:465 166:437 167:462 168:437 169:464 170:439 171:464
172:443 173:471 174:420 175:467 176:394 177:414 178:392 179:398 180:385 181:401 182:375 183:374
184:427 185:407 186:424 187:432 188:429 189:432 190:404 191:539 192:276 193:387 194:645 195:315
196:440 197:365 198:426 199:384 200:428 201:387 202:419 203:376 204:407 205:363 206:398 207:364
208:407 209:372 210:410 211:372 212:424 213:381 214:473 215:441 216:503 217:493 218:489 219:513
220:448 221:508 222:416 223:471 224:410 225:437 226:411 227:413 228:397 229:410 230:359 231:398
232:324 233:359 234:312 235:327 236:336 237:287 238:383 239:346 240:368 241:360 242:389 243:405
244:336 245:346 246:391 247:385 248:380 249:396 250:382 251:387 252:364 253:373 254:378 255:375
256:352 257:371 258:333 259:355 260:335 261:373 262:342 263:405 264:371 265:355 266:456 267:323
268:431 269:359 270:386 271:382 272:379 273:409 274:349 275:427 276:325 277:327 278:388 279:310
280:370 281:342 282:328 283:297 284:364 285:320 286:376 287:348 288:440
这里提取了288维的特征。
02
基于提取的特征进行目标分类
这里给大家分享一个很著名的分类器liblinear,它是是国立台湾大学的Chih-Jen Lin博士开发的主要是应对large-scale的data classification,因为linear分类器的训练比非线性分类器的训练计算复杂度要低很多,时间也少很多,而且在large scale data上的性能和非线性的分类器性能相当,所以Liblinear是针对大数据而生的。通过笔者的实验,这个分类器在STM32 平台上实现非常容易,而且速度很快,分类主要代码如下:
for (i = 0; i < Class; i++)
{
fvtInt = 0;
for (j = 0; j < 144*2; j++)
{
t0 = (int)pf1[j];
t1 = (int)pFvt[j*Class+i];
fvtInt += t0*t1;
}
fvt = ((double)(fvtInt))/100000;
fvt += ((double)(pFvt[j*Class+i]*200))/100000;
tt = exp(-fvt);
fvt = 1/(1+tt);
if (max_t < fvt)
{
max_t = fvt;
min_i = pNoteClass[i];
}
}
大家看看就这么几段代码就实现了,这里提醒下,在运算过程中尽量使用整型数据,以节省空间。
03
识别步骤
1. 对提取的特征进行训练,训练在PC端实现,得到用于分类的模型文件,部分内容如下图:
2. 将上面得到的模型文件整型化,有利于提高运行速度。
3. 用上面的提供的分类代码就可以实现分类了。
我这边数据的实验结果:
nTotal = 30500, err = 177, 识别率为:0.994197
就这么简单的几个步骤,就可以让STM32立马高大上起来!-!
/ The End /
本文主要介绍了在STM32F103平台上对人民币颜色信息进行识别的算法原理。
如有疑问,欢迎留言讨论。
本文由【嵌入式案例Show】原创出品,未经许可,请勿转载
猜你喜欢:
聊天界面回复关键词:加群。添加小编,加入技术交流群