查看原文
其他

[笨叔点滴9] GNU GCC扩展2

小笨叔 奔跑吧Linux社区 2019-04-24

 饭店老板算了算饭钱笑着说:小姑凉,一共201块,算你200

小花想了想问道:那我问一下,如果是204块的话,老师你会怎么算?

老板楞了一下:也算你200

小花点点头,那麻烦你再给我一听可乐

老板:???


虽然是个笑话,但是现在国人聪明的人太多,像笨叔这么笨的人已经很少见了。


昨天不少小伙伴问笨叔,为啥没有笨9,直接笨10了?

哈哈,这是小秘密



本次点滴,我们继续GNU GCC扩展吧!


01 GCC扩展吧


 

5)     可变参数宏

GNU C语言中,宏可以接受可变数目的参数,这个主要运用在输出函数里。

 

<include/linux/printk.h>

 

#define pr_debug(fmt, ...)\

     dynamic_pr_debug(fmt, ##__VA_ARGS__)

 

...”代表一个可以变化的参数表,__VA_ARGS__是编译器保留字段,预处理时把参数传递给宏。当宏的调用展开时,实际参数就传递给dynamic_pr_debug函数了。

 

6)     函数属性

GNU C语言允许声明函数属性(Function Attribute)、变量属性(Variable Attribute)和类型属性(Type Attribute),以便编译器进行特定方面的优化和更仔细的代码检查。特殊属性语法格式为:

__attribute__((attribute-list))

 

GNU C语言里定义的函数属性有很多,如noreturnformat以及const等。另外还可以定义一些和处理器体系结构相关的函数属性,如ARM体系结构中可以定义interruptisr等属性,有兴趣的读者可以参阅GCC的相关文档。

 

下面是Linux内核中使用format属性的一个例子。

<drivers/staging/lustru/include/linux/libcfs/>

 

int libcfs_debug_msg(structlibcfs_debug_msg_data *msgdata,

                 const char*format1, ...)

     __attribute__ ((format (printf, 2, 3)));

 

libcfs_debug_msg()函数里声明了一个format函数属性,它会告诉编译器按照printf的参数表的格式规则对该函数参数进行检查。数字2表示第2个参数为格式化字符串,数字3表示参数“...”里的第一个参数在函数参数总数中排在第几个。

 

           noreturn属性通知编译器,该函数从不返回值。这让编译器消除不必要的警告信息。比如die函数,这函数不会返回。

void__attribute__((noreturn)) die(void);

 

const属性会让编译器只调用该函数一次,以后再调用时只需要返回第一次结果就可以了,从而提高效率。

static inline u32__attribute_const__ read_cpuid_cachetype(void)

{

     return read_cpuid(CTR_EL0);

}

 

Linux还有其他一些函数属性,定义在compiler-gcc.h文件中。

#define __pure              __attribute__((pure))

#define __aligned(x)        __attribute__((aligned(x)))

#define __printf(a, b)          __attribute__((format(printf, a, b)))

#define __scanf(a, b)           __attribute__((format(scanf, a, b)))

#define  noinline            __attribute__((noinline))

#define __attribute_const__     __attribute__((__const__))

#define __maybe_unused          __attribute__((unused))

#define __always_unused         __attribute__((unused))

 

7)     变量属性和类型属性

变量属性可以对变量或结构体成员进行属性设置,类型属性常见的属性有alignmentpackedsections等。

alignment属性规定变量或者结构体成员的最小对齐格式,以字节为单位。

struct qib_user_info {

     __u32 spu_userversion;

     __u64 spu_base_info;

} __aligned(8);

           这个例子中,编译器以8字节对齐的方式来分配qib_user_info这个数据结构。

 

         packed属性可以使变量或者结构体成员使用最小的对齐方式,对变量是以字节对齐,对域(field)是以位对齐的。

struct test

{

     char a;

      int x[2] __attribute__ ((packed));

};

           x成员使用了packed属性,它会存储在变量a后面,所以这个结构体一共占用9个字节。

 

8)     内建函数

GNU C语言提供一系列内建函数进行优化,这些内建函数以“_builtin_”作为函数名前缀。下面介绍一些Linux内核常用的内建函数。

__builtin_constant_p(x):判断x是否在编译时就可以确定为常量。如果x为常量,该函数返回1,否则返回0

#define __swab16(x)             \

     (__builtin_constant_p((__u16)(x)) ?    \

     ___constant_swab16(x) :        \

     __fswab16(x))

                                                 

__builtin_expect(exp, c):这里意思是exp==c的概率很大,用来引导GCC编译器进行条件分支预测。开发人员知道最可能执行哪个分支,将最有可能执行的分支告诉编译器,让编译器优化指令序列,使指令尽可能地顺序执行,从而提高CPU预取指令的正确率。

#define LIKELY(x)__builtin_expect(!!(x), 1) //x很可能为真

#define UNLIKELY(x)__builtin_expect(!!(x), 0) //x很可能为假

 

__builtin_prefetch(const void *addr, int rw, int locality):主动进行数据预取,在使用地址addr的值之前就把其值加载到cache中了,减少读取的延迟,从而提高性能。该函数可以接受三个参数,第一个参数addr表示要预取数据的地址;第二个参数rw表示读写属性,1表示可写,0表示只读;第三个参数locality表示数据在cache中的时间局部性,其中0表示读取完addr的之后不用保留在cache中,而1~3表示时间局部性逐渐增强。如下面的prefetch()prefetchw()函数的实现。

 

<include/linux/prefetch.h>

#define prefetch(x)__builtin_prefetch(x)

 

#define prefetchw(x)__builtin_prefetch(x,1)

 

下面是使用prefetch()函数来优化的一个例子。

<mm/page_alloc.c>

 

void __init__free_pages_bootmem(struct page *page, unsigned int order)

{

     unsigned int nr_pages = 1 << order;

     struct page *p = page;

     unsigned int loop;

 

     prefetchw(p);

     for (loop = 0; loop < (nr_pages - 1); loop++, p++) {

         prefetchw(p + 1);

         __ClearPageReserved(p);

         set_page_count(p, 0);

     }

}

在处理struct page数据之前通过prefetchw()来先预取到cache中,从而提升性能。

 

9)     asmlinkage

在标准C语言中,函数的形参在实际传入参数时会涉及到参数存放问题。对于x86,函数参数和局部变量一起分配到函数的局部堆栈里。

 

<arch/x86/include/asm/linkage.h>

 

#define asmlinkageCPP_ASMLINKAGE __attribute__((regparm(0)))

 

__attribute__((regparm(0))):告诉编译器该函数不需要通过任何寄存器来传递参数,只通过堆栈来传递。

 

对于ARM来说,函数参数的传递有一套ATPCS标准,即通过寄存器来传递的。ARM中的R0~R4寄存器存放传入参数,当参数超过5个时多余的参数存放在局部堆栈中。所以,ARM平台没有定义asmlinkage

<include/linux/linkage.h>

 

#define asmlinkageCPP_ASMLINKAGE

#define asmlinkageCPP_ASMLINKAGE

 

10)     UL

Linux内核代码中经常会看到一些数字的定义使用了UL后缀修饰。数字常量会隐形定义为int类型,两个int类型相加的结果可能会发生溢出,因此使用UL强制把int类型数据转换为unsigned long类型,这是为了保证运算过程不会因为int的位数不同而导致溢出。

表示有符号整型数字1

1UL 表示无符号长整型数字1


[往期精彩]

[旗舰篇] 第一季旗舰篇资料汇总

[笨叔点滴10] 中断到“底”来了吗?

[笨叔点滴8] GNU C语言的扩展

[笨叔点滴7] 再也回不去的C语言

[笨叔点滴6] 叔,这个git咋玩啊?

[笨叔点滴5] git rebase和git merge究竟有啥区别?

[笨叔点滴4]“栈”谁便宜了2

[笨叔点滴3] “栈”谁便宜了?

[笨叔点滴2] 为啥子ARM32体系结构中每个处理模式都有一个单独的栈?

[笨叔点滴1] 为什么do_page_fault函数里代码需要判断用户态还是内核态?

LinuxCon 2018北京游记(1)

LinuxCon2018北京笨叔笨游记 2

《奔跑吧linux内核》配套资源迁移到码云上

考点来了:4月18号视频更新

代码导读之如何使用qemu来单步调试head.S

代码导读之内存管理初始化 - 启动汇编

视频更新:内存管理代码框架导读

DMA那些事儿

私密VIP群答疑

高级运维必杀技:如何图形化单步调试RHEL/Centos 7里的内核?

首发:Meltdown漏洞分析与实践

[奔跑吧Linux内核] 故乡

致敬Beyond


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存