其他
18M超轻量的全球首个图像识别系统开源!
图1 PP-ShiTu应用于商品识别效果示意(开发者应用展示)
然而实现理想的识别效果并不是一件简单的事:
针对海量数据问题而言,如何实现一个通用的方法在不同的数据集中都有很好的表征能力? 不同物体间的差别可能极其微小,即使是同种物体,也会受到外界干扰呈现不同形态,究竟如何进行有效区分? 识别需求更新频繁,使用单一的分类或者检测模型只能不断增加训练集重训模型,怎样才能降低开发成本,快速跟上迭代步伐?
PP-ShiTu核心技术解读
针对以上技术难点,PaddleClas推出的通用图像识别系统PP-ShiTu均可以完美解决,它不仅有高水平的特征学习能力,对新出现的类别也可以在不用重新训练算法的情况下,直接通过配置检索库的方式实现识别。
主体检测:不同于一般的目标检测,主体检测是将目标物体和背景区分开来,能够有效减少干扰特征。PP-ShiTu中所采用的是目标检测模型PP-PicoDet,不仅预测速度超快,精度上也达到了SOTA,为后续的准确识别打下坚实基础;
特征提取:作为图像识别系统的重点工作,PP-ShiTu是采用CPU级轻量化骨干网络PP-LCNet,并结合度量学习arcmargin算法,对高相似物体的区分效果远超单一模型,不仅准确率超越大模型ResNet50,预测速度还能快3倍!再加上经过18w类数据集打磨的预训练权重,不用再费心选择,一个模型就可以实现多场景覆盖。
向量检索:不同于单一模型直接输出类别信息,对于未知类别只有模型重训一个选择,耗时又耗力。PP-ShiTu引入向量检索,通过计算目标物体和检索库中图像的相似度来输出类别信息,一次训练长期使用,高效又便捷。
升级版PP-ShiTu欢迎使用
升级版PP-ShiTu大小仅18M,完美支持移动端需求
支持基于C++的服务化部署,部署效率大幅提升
支持移动端Paddle Lite部署教程,手机上也能轻松实现图像识别
第一步:下载 Inference 模型
第二步:构建索引
第三步:完成单张/批量图像识别
共建开源生态
自PP-ShiTu发布以来,引起了众多开发者的广泛关注。华东理工大学的高材生颜鑫,也是飞桨领航团的团长,带领团队基于PP-ShiTu开发了一套智能购物平台系统:通过图像即可精准识别顾客购买的商品,并返回完整的购物清单及应付价格,为智能货柜提供了非常好的视觉化解决方案。
往期精彩回顾