查看原文
其他

如何正确使用MDK-ARM优化功能,以及优化之后带来的影响

strongerHuang strongerHuang 2021-01-31

本文原创首发在我的另外一个公众号『嵌入式专栏』。


原文:MDK-ARM各种优化选项详细说明、实际应用及拓展内容


许多朋友使用MDK-ARM很长时间,却不知它的优化选项到底该有什么用,或者说到底该如何使用。

本文围绕MDK-ARM优化选项,以及相关拓展知识(微库、实际应用、调试)进行讲述,希望对你今后开发项目有所帮助。

1总述

我们所指的优化,主要两方面:

  • 代码大小(Size)

  • 代码性能(运行时间)


在MDK-ARM中,优化相关的配置选项:


当然,如果选择编译器(AC5、AC6)不同,优化选项也有差异(下面讲述)。

举例:
某些项目MCU容量有限时,你除了修改代码(优化开支),同时你有必要使用优化选项。

某些项目(比如某算法)需要高效(最短时间)运行,此时有必要使用优化选项。

2优化选项说明

本节详细讲述优化相关选项,同时,编译器选择AC5和AC6时有差异,下面也会针对AC5和6分别讲述。


1.Use Cross-Module Optimization:使用跨模块优化
使用跨模块优化可以启用链接器反馈文件(进行两次编译),从而允许进一步的代码优化。


提示:
A.不针对库目标执行跨模块优化。
B.跨模块优化将增加构建项目所需的时间,因为会自动执行多个编译和链接步骤。

2.Use MicroLIB:使用微库
它是ISO标准C运行时库的子集(其中一部分),提供了性能和代码大小之间的权衡。

微库并不完全兼容ANSI,但对于大多数小型嵌入式应用程序来说已经足够了。

3.Use Link-Time Code Generation:使用链接时代码生成(优化)
在V5版本之前有这个优化选项,多文件编译,链接时进行优化:
  • 函数跨模块内联

  • 删除未引用的变量和函数

  • 通过重新排列变量优化内存访问

  • 在可能的情况下重用内存


4.Execute-only Code:生成只执行的代码
不包含未使用(函数、变量等)代码段

仅限于:

C、Thumb代码

基于Cortex-M3、M4的处理器

编译器5.04以上


5.Optimize for Time:优化时间
以更大的代码大小为代价,减少执行时间。比如:使用内联函数。

编译器为AC6时,此选项为【Link-Time Optimization】,在链接状态下执行模块间优化。

6.Split Load and Store Multiple:分割加载和多存储
指示编译器将LDM和STM指令拆分为两个或多个LDM或STM指令,以减少延迟,此选项可以提高系统的总体性能。

7.The One ELF Section per Function:每个函数一个ELF段
ELF代码段通常包含许多函数的代码,此选项告诉编译器将所有函数放入它们自己的ELF段,这允许链接器删除未使用的ELF段(而不是未使用的函数)。

8.AC5时:Optimization优化选项
<default>:默认值,以优化性能为主。

Level 0 (-O0):关闭大部分优化,除了一些简单的转换,生成的代码具有最佳的调试视图。

Level 1 (-O1):应用受限优化。
比如:删除未使用的内联函数和静态函数,删除冗余代码和重新排序指令等。生成的代码经过合理优化,具有良好的调试视图。

Level 2 (-O2): 高度优化,目标代码到源代码的映射并不一定对应,因此,不利于调试。

Level 3 (-O3):最大级别优化,级别3与时间优化相结合可能生成比级别2更多的代码。

9.AC6时:Optimization优化选项
当编译器选择AC6时,优化选项有差异(有更多优化选项):


AC6优化选型中前面5项(default、-O0 ~ 3)和AC5的作用基本一样,但AC6多了三个选项。

-Ofast:启用-O3的所有优化,以及其他可能违反语言标准(严格遵守)的优化。

-Os balanced:平衡代码大小与代码速度。默认情况下,编译器执行优化以提高性能,但可能会增加image文件大小。

-Oz image size:优化代码大小。

3如何优化?

本节讲述三种编译优化,使其达到最优(代码最小、性能最好)

  • 代码大小

  • 代码性能(速度)

  • 代码平衡(大小和速度)


1.优化代码大小
针对AC5编译器:
  • Use MicroLIB

  • Use Cross-module optimization

  • Optimization:level 2 (-O2)


针对AC6编译器:
  • Use MicroLIB

  • Optimization:-Oz image size


说明:
A.代码量大(ELF代码段通常包含许多函数的代码),可考虑使用The One ELF Section per Function选项减小代码。

B.AC6编译器改进了优化功能(可以理解为增加的3个选项集成了优化功能)。

代码优化大小(对比):


2.优化代码性能
针对AC5编译器:
  • Use Cross-module optimization

  • Optimization:level 3 (-O3)

  • Optimize for Time


针对AC6编译器:
  • Optimization:-Ofast

  • Link-Time Optimization


代码优化性能(对比):


3.代码平衡
这种情况下,在满足代码大小的同时,我们应尽量满足性能。

这里其实就是一个相关平衡的关系,结合上面两种优化方式根据自己实际情况出发,一般优化考虑如下配置。

针对AC5编译器:
  • Use Cross-module optimization

  • Optimization:level 3 (-O3)

  • Optimize for Time


针对AC6编译器:
  • Optimization:-Os balanced

  • Link-Time Optimization


当然,AC6中-Os balanced优化选项更智能。

4拓展说明

MDK-ARM的优化功能需要结合项目实际情况进行优化。对一些项目能起到很大帮助作用,但优化之后也可能带来一些影响。


1.使用高度优化(-O1以上),可能会影响Debug调试(因为优化之后,编译输出和实际代码不匹配)。


2.指定源文件/文件组优化

有些代码不需要优化,我们优化指定的源文件/文件组就行。


推荐阅读:Keil系列教程

5最后

我的知乎:strongerHuang

我的网站:www.strongerhuang.com


若觉得文章对你有帮助,随手点赞、分享,也是对我的支持和鼓励。

关注公众号『strongerHuang』,在底部菜单中查看更多精彩内容!


长按识别图中二维码关注


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存