其他
解读 | 2019 年 10 篇计算机视觉精选论文(上)
关键词:计算机视觉 精选论文
1
•EfficientNets 在 8 个数据集中的 5 个上,获得了最优的精度,平均参数减少了 9.6 倍。•特别是,具有 66M 参数的 EfficientNet 在 ImageNet 上达到了 top-1 准确率 84.4%,top-5 准确率 97-1%,比之前最先进的 CNN - GPipe(参数557M )小了 8 倍,快了 6 倍。
•作者已发布了其 TensorFlow EfficientNet 实现的源代码:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet 。
2
3
本文的核心思想
它包括一个推理导航器,该导航器从自然语言指令和本地视觉场景中学习,以推断出要重点关注的短语以及查找的位置。
该 agent 配备有一个匹配的注释程序,该注释程序根据从中重构原始指令的可能性来评估执行路径。
另外,细粒度的内在奖励信号会鼓励代理更好地理解文本输入,并对选择不符合指令的轨迹进行惩罚。
导航器执行多次滚动,然后由匹配的注释器确定良好的轨迹,随后将其用于导航器模仿。
扫描二维码,加入 AI 讨论群
获得更多优质数据集
了解人工智能落地应用
关注顶会&论文
回复「读者」自动入群