Pytorch有什么节省内存（显存）的小技巧？

CV开发者都爱看的极市平台 2021-09-20

加入极市专业CV交流群，与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流！
同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总，行业技术交流。关注 极市平台 公众号，回复 加群，立刻申请入群~

问题：在用pytorch实现一个tensorflow project的时候遇到了GPU显存超出 (out of memory) 的问题，有没有什么优化方法？

链接：

https://www.zhihu.com/question/274635237

知乎高质量回答

一、作者：郑哲东

计算机科学博士在读
https://www.zhihu.com/question/274635237/answer/573633662
本文来自知乎问答，回答已获作者授权，著作权归作者所有，禁止二次转载。

在不修改网络结构的情况下, 有如下操作：

1. 同意 @Jiaming，尽可能使用inplace操作，比如relu 可以使用 inplace=True 。一个简单的使用方法，如下：

def inplace_relu(m): classname = m.__class__.__name__ if classname.find('ReLU') != -1: m.inplace=True

model.apply(inplace_relu)

2. 进一步，比如ResNet 和 DenseNet 可以将 batchnorm 和relu打包成inplace，在bp时再重新计算。使用到了pytorch新的checkpoint特性，有以下两个代码。由于需要重新计算bn后的结果，所以会慢一些。

https://github.com/gpleiss/efficient_densenet_pytorch

https://github.com/mapillary/inplace_abn

3. 每次循环结束时删除 loss，可以节约很少显存，但聊胜于无。可见如下issue：

Tensor to Variable and memory freeing best practices：

https://discuss.pytorch.org/t/tensor-to-variable-and-memory-freeing-best-practices/6000/2

4. 使用float16精度混合计算。我用过 @NVIDIA英伟达apex，很好用，可以节约将近50%的显存，但是要小心一些不安全的操作如 mean和sum，溢出fp16。

NVIDIA/apex（https://github.com/NVIDIA/apex）

补充：最近我也尝试在我CVPR19的GAN模型中加入fp16的训练，可以从15G的显存需求降到约10G，这样大多数1080Ti等较为常见的显卡就可以训练了。欢迎大家star一波：

https://github.com/NVlabs/DG-Net

5. 对于不需要bp的forward，如validation 请使用 torch.no_grad , 注意model.eval() 不等于 torch.no_grad() 请看如下讨论：

https://github.com/NVlabs/DG-Net

6. torch.cuda.empty_cache() 这是del的进阶版，使用nvidia-smi 会发现显存有明显的变化。但是训练时最大的显存占用似乎没变。大家可以试试。

How can we release GPU memory cache?

https://discuss.pytorch.org/t/how-can-we-release-gpu-memory-cache/1453

另外，会影响精度的骚操作还有：

把一个batchsize=64分为两个32的batch，两次forward以后，backward一次。但会影响 batchnorm等和batchsize相关的层。

一把短刀，怎么就让他连捅18人？！

听纪委朋友说，有的领导干部在被抽掉鞋带和皮带后，一下就崩溃了，甚至个别胆小者顿时大小便失禁……

上海超市血案：背后缘由让人揪心

为啥一线城市只有广州取消限购？是因为穷吗

野村：牛市可能重蹈2015年的崩盘

Pytorch有什么节省内存（显存）的小技巧？

知乎高质量回答

实践经验分享：在深度学习中喂饱GPU

你见过最差的算法工程师能差到什么程度？

计算机视觉领域如何从别人的论文里获取自己的idea？

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

听纪委朋友说，有的领导干部在被抽掉鞋带和皮带后，一下就崩溃了，甚至个别胆小者顿时大小便失禁……

上海超市血案：背后缘由让人揪心

为啥一线城市只有广州取消限购？是因为穷吗

野村：牛市可能重蹈2015年的崩盘

生成图片，分享到微信朋友圈

Pytorch有什么节省内存（显存）的小技巧？

知乎高质量回答

实践经验分享：在深度学习中喂饱GPU

你见过最差的算法工程师能差到什么程度？

计算机视觉领域如何从别人的论文里获取自己的idea？

您可能也对以下帖子感兴趣