重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

极市平台 2021-09-20

The following article is from 我爱计算机视觉 Author CV君

加入极市专业CV交流群，与6000+来自腾讯，华为，百度，北大，清华，中科院等名企名校视觉开发者互动交流！更有机会与李开复老师等大牛群内互动！
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。点击文末“阅读原文”立刻申请入群~

本文授权转载自我爱计算机视觉，请勿二次转载。

今天要跟大家重磅介绍上午谷歌大脑新出的论文《EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks》，在模型扩展时平衡好深度、宽度、分辨率，取得精度、效率、模型大小的最大化。

借由此简单有效的模型扩展方法，作者在使用神经架构搜索得到的基模型上扩展出一系列EfficientNets模型，达到了更好的精度和效率的平衡，其中EfficientNet-B7模型在ImageNet数据集上达到 state-of-the-art 84.4% top-1 / 97.1% top-5 精度，并且相比目前最好的方法模型size减小8.4倍，速度快6.1倍！！

简直是神级操作！

该文已被ICML 2019录用，这可能是一篇要改变整个深度卷积网络模型设计的论文了。

下面是作者信息：

两位作者均来自谷歌大脑。

下图是作者使用该文方法得到的7个EfficientNets与目前知名的state-of-the-art模型精度-参数量的比较：

可见本文得到的模型在相近模型大小时，精度高于所有之前的竞争对手！

什么是模型扩展？

模型扩展是借由改变深度卷积网络的宽度、深度、分辨率进而寻找更高精度模型，或者寻找精度-计算量-模型size满足一定要求的模型的方法。

下图展示了这一过程：

其中最右为作者提出的方案，即在三个维度（宽度、深度、分辨率）进行复合扩展。

（模型扩展是很常见的操作，只是之前大家总是关注在宽度和深度，作者在这里将分辨率纳入考量）

这是作者做的实验，单一调整一个维度能够获得精度提升，随着参数调的越大，精度增益越平滑，即改进不再明显。

下图为同时调整深度和分辨率获得的模型的结果，可见联合调整能够获得更好的精度增益曲线。

方法

作者就是把深度d、宽度w和分辨率r纳入一个受限的搜索空间，如下：

对于特定的基模型，采用如下两个步骤获得一系列扩展模型，从计算量参数量小精度低到计算量参数量大精度高的一系列模型。

下面是作者用神经网络搜索得到的基模型EfficientNet-B0。

实验结果

实验结果实在是太靓丽了！

这是作者得到的七个模型与现有最好的算法在ImageNet数据集上的比较，在精度超越的同时，计算复杂度和参数量都下降了一个数量级！

下图为在MobileNets和ResNet上与单一维度扩展的比较，计算量相近的情况下，本文方法精度表现出一致性的更高！

在实际的硬件上计算同样验证了理论的结论：

作者用得到的新模型在8个数据集上进行了迁移学习实验，取得了5个state-of-the-art的结果，而且计算量和参数量依旧小一个数量级！

该算法虽然简单，但结果实在是太吸引人了，强烈推荐大家关注！

论文地址：

https://arxiv.org/pdf/1905.11946v1.pdf

开源地址：

https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet

*延伸阅读

点击左下角“阅读原文”，即可申请加入极市目标跟踪、目标检测、工业检测、人脸方向、视觉竞赛等技术交流群，更有每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流，一起来让思想之光照的更远吧~

△长按关注极市平台

觉得有用麻烦给个在看啦~

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

为什么京东员工强烈推荐京东plus会员不要直接在平台上买东西？

别太贪婪，这些技能让你一辈子满足

大哥给我发“N子照片”！知名女主播自爆H弹！被CG拿下大力反击！

重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

什么是模型扩展？

方法

实验结果

不要只关心怎么优化模型，这不是机器学习的全部

旷视提出One-Shot模型搜索框架的新变体

Facebook发布PyTorch 1.1，开源AI模型优化简化工具BoTorch & Ax

常用的模型集成方法介绍：bagging、boosting 、stacking

您可能也对以下帖子感兴趣

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

为什么京东员工强烈推荐京东plus会员不要直接在平台上买东西？

别太贪婪，这些技能让你一辈子满足

大哥给我发“N子照片”！知名女主播自爆H弹！被CG拿下大力反击！

生成图片，分享到微信朋友圈

重磅！谷歌大脑提出EfficientNet平衡模型扩展三个维度，取得精度-效率的最大化！

什么是模型扩展？

方法

实验结果

不要只关心怎么优化模型，这不是机器学习的全部

旷视提出One-Shot模型搜索框架的新变体

Facebook发布PyTorch 1.1，开源AI模型优化简化工具BoTorch & Ax

常用的模型集成方法介绍：bagging、boosting 、stacking

您可能也对以下帖子感兴趣