Google用机器学习简化标注流程，让图片标注速度能快3倍

AI人工智能产业研究 2019-04-21

▲点击上方 AI人工智能产业研究关注▲

source：paixin.com

基于深度学习的电脑视觉模型已是许多应用不可或缺一环，模型性能又取决于如Open Images类型，越来越大的标记训练数据库可用性，如何获得高质量的训练内容已成为电脑视觉模型发展重要焦点。

对那些需要执行语义分割(Semantic Segmentation)等像素层面预测任务的应用来说，高质量的训练内容又更为关键，象是自动驾驶、机器人或图片搜寻等都是属于相关应用。

在传统手动标签工具使用上，需一个标注者(Annotator)仔细点击图片中每个对象的边界、分类出图片中所有类别，过程不仅繁琐还相当耗时，在COCO+Stuff数据库光是标记单个图片就需19分钟，标记整个数据库估计需花费5.3万个小时。

为了让整个过程能更为简易迅速，Google AI团队开发一种基于机器学习技术的界面，能协助标注者更快标记图片中对象和背景的类别及轮廓，进而将数据库中训练内容的创建速度提高3倍。

此功能被称为“流体标注(Fluid Annotation)”，在强大的语义分割模型协助下，标注者能选择要纠正的内容和顺序，更有效率的将精力集中在机器未知的内容上，进行更快又简单的调整修改。

为了提供使用者图片注释的协助，团队使用预先训练的语义分割模型Mask-RCNN辨识图片，并使其产生约1,000个图片边界、标签与可信度分数。

流体标注会使用最高可信度的内容，作为最初呈现给注释者的标签，此后使用者还是可透过以下4种操作进行调整修改：

(1)从机器产生的待选清单中选择现有标签

(2)增加1个分割内容覆盖机器错过的对象

(3)删除现有对象；(4)改变重叠对象的边界顺序

Google团队表示，流体标注是Google为了提高图片注释效率的第一项探索，未来会朝向改进边界注释的判定努力，期望最后能使机器扩展到能处理以前看不见的分类，协助达成更有效的数据收集。

来源：Technews；首图来源：正版图库拍信网

◆ ◆ ◆ ◆ ◆

(星标提示：微信改版啦，三步离AI更近：1.点击“AI人工智能产业研究” 2.点击右上角三点图标 3.选择“设为星标”。)

推荐阅读

PatientSphere使用AI和区块链来制定个性化医疗计划