查看原文
其他

Google用机器学习简化标注流程,让图片标注速度能快3倍

▲点击上方 AI人工智能产业研究 关注▲

source:paixin.com


基于深度学习的电脑视觉模型已是许多应用不可或缺一环,模型性能又取决于如Open Images类型,越来越大的标记训练数据库可用性,如何获得高质量的训练内容已成为电脑视觉模型发展重要焦点。


对那些需要执行语义分割(Semantic Segmentation)等像素层面预测任务的应用来说,高质量的训练内容又更为关键,象是自动驾驶、机器人或图片搜寻等都是属于相关应用。


在传统手动标签工具使用上,需一个标注者(Annotator)仔细点击图片中每个对象的边界、分类出图片中所有类别,过程不仅繁琐还相当耗时,在COCO+Stuff数据库光是标记单个图片就需19分钟,标记整个数据库估计需花费5.3万个小时。


为了让整个过程能更为简易迅速,Google AI团队开发一种基于机器学习技术的界面,能协助标注者更快标记图片中对象和背景的类别及轮廓,进而将数据库中训练内容的创建速度提高3倍。


此功能被称为“流体标注(Fluid Annotation)”,在强大的语义分割模型协助下,标注者能选择要纠正的内容和顺序,更有效率的将精力集中在机器未知的内容上,进行更快又简单的调整修改。


为了提供使用者图片注释的协助,团队使用预先训练的语义分割模型Mask-RCNN辨识图片,并使其产生约1,000个图片边界、标签与可信度分数。


流体标注会使用最高可信度的内容,作为最初呈现给注释者的标签,此后使用者还是可透过以下4种操作进行调整修改:


(1)从机器产生的待选清单中选择现有标签


(2)增加1个分割内容覆盖机器错过的对象


(3)删除现有对象;(4)改变重叠对象的边界顺序


Google团队表示,流体标注是Google为了提高图片注释效率的第一项探索,未来会朝向改进边界注释的判定努力,期望最后能使机器扩展到能处理以前看不见的分类,协助达成更有效的数据收集。

 

来源:Technews;首图来源:正版图库拍信网


◆ ◆ ◆  ◆ ◆


(星标提示:微信改版啦,三步离AI更近:1.点击“AI人工智能产业研究”  2.点击右上角三点图标  3.选择“设为星标”。)


推荐阅读

PatientSphere使用AI和区块链来制定个性化医疗计划

杭州出现机器人奶茶店,一杯只要90秒节省60%人工成本

空中客车认为其AI可以消除航班延误

一个能与人类正常对话,并且还“看脸色”的机器人你见过吗?




    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存