浅析 C 语言中一些“令人吃惊”的结构

查看原文

其他

浅析 C 语言中一些“令人吃惊”的结构

CPP开发者 2021-06-06

The following article is from 技术让梦想更伟大 Author 李肖遥

(给CPP开发者加星标，提升C/C++技能)

来源：技术让梦想更伟大-李肖遥

C语言会同意一些"令人震惊"的结构，下面的结构是合法的吗，我们来看看几个例子。

c = a+++b；

以下代码是合法的吗，咋的一看不禁有这样的疑问？

int a = 5, b = 7, c;
c = a+++b;

这个代码确实不咋符合习惯的写法，但是不管你相不相信，上面的例子是完全合乎语法的。问题是编译器如何处理它？

根据最处理原则，编译器应该能够尽可能处理所有合法的用法。因此，上面的代码会被处理成：

c = a++ + b;

我们来测试一下：

#include <stdio.h>
 
int main()
{
  int a = 5, b = 7, c;
  c = a+++b;
  printf("a = %d,b = %d,c = %d",a,b,c);
  return 0;
}

输出结果如下：其执行顺序：

b不变，c = a + b;，则c = 5 + 7 = 12
a++，那么a = 6;

c = a+++++b;

上面那么可能只是开胃菜，那么这个表达式呢，有什么想法？咱们二话不说，直接上代码测试。

#include <stdio.h>
 
int main()
{
  int a = 5, b = 7, c;
  c = a+++++b;
  //c = (a++) + (++b);
  //c = ((a++)++) + b;
  printf("a = %d,b = %d,c = %d",a,b,c);
  return 0;
}

编译结果如下：

虽然一看就知道意思是(a++)+(++b)；，但是编译就通不过，我们把括号加上，c = (a++) + (++b);，编译通过，那么出错信息大概是：括号影响了优先级？我们从侧面以及原理来解析一下。

侧面解析一下

对于a+++++b这一段代码，编译系统从左至右扫描整条语句，先遇到a++，判断出来是一个a的后缀自加运算；

然后接着扫描，遇到一个+，+是一个二目运算符，它的左边已经有一个运算数a++了，系统就向右搜索第二个运算数；

又遇到一个+，++比+的运算级别要高，这时，编译系统就将两个+看成一个整体来处理；

既然是++，编译系统就认定，肯定它的左边或右边有一个变量，编译系统先搜索左边，发现++，不是变量；

再搜索右边，发现+b，+b是什么东西？编译系统是无法搞明白的；

因此它就认为++是一个缺少左值的自增运算符，于是提示错误给用户：lvalue required as increment operand

原理解析一下

C语言在这里遵循词法解析的贪婪匹配原则。优先匹配尽可能多字符的符号，无论是否有语法错误（因为词法分析时还没有语法检查）。

于是a+++++b会被当作a ++ ++ + b，这是非法的表达式，因此产生编译错误。

这个问题在ISO C99标准中直接以示例描述，原文如下：

“
EXAMPLE 2 The program fragment x+++++y is parsed as x ++ ++ + y, which violates a constraint on increment operators, even though the parse x ++ + ++ y might yield a correct expression.

那么，也许是`c = ((a++)++) + b;`这个意思呢？

我们编译结果依然报错，如下：

这涉及到“左值”的问题。百度百科定义如下：

“
左值(lvalue) 是B语言/C语言/C++语言等类C语言中的一类表达式。“左”(left)的原意是指可以放在赋值符号“=”的左边，但其实也表示能作为&和++等操作符的操作数（B语言中已经如此）。而且，现代C/C++中的含义已经不局限于此。lvalue的l被重新解释为location。这也对应于ISO C11/ISO C++11的内存位置(memory location)。

总结：a存在左值，可以有表达式：a++。但是（a++）不存在左值，无法继续执行（a++）++操作，所以最终报错。

怎么样才能编译正确呢？

a+++++b在编译时会报错，那么a++ + ++b呢？来看以下代码：

#include <stdio.h>
 
int main()
{
 int a = 5, b = 7, c;
 c = a++ + ++b;
 printf("a = %d,b = %d,c = %d",a,b,c);
 return 0;
}

结果如下：

其代码与c = (a++) + (++b);结果一样，说明是正确的，其按照下面顺序执行：

先执行b自加，b变为8；相当于：b = b+ 1;
求a与b之和，赋给c；相当于：c = a + b ;//c = 5+8;
执行第二步之后，a自加1：a++;

c=(++a,b++,a++,++b);

这个表达式看着爽不爽？我们知道自增自减运算，表示对自身进行a=a+1或者a=a-1的运算。

++a表示在调用前就a+1，a++表示在调用后+1。

int c=(++a,b++,a++,++b);这个逗号隔开的表示用最后一个式子对C进行赋值，测试如下：

#include <stdio.h>
 
int main()
{
 int a = 5, b = 7, c;

 c=(++a,b++,a++,++b);
 printf("a = %d,b = %d,c = %d",a,b,c);
 return 0;
}

输出的结果如下：

这段执行的顺序如下

先执行++a，a=6；
再执行b++，b=8；
接下来a++，a=7；
再执行++b，b=9；
把最后一个的式子b=9的值赋给c，所以c等于9。如果改成c=(++a,b++,a++,b++); ，那么c就是等于8，因为是调用后再自增。

总结

我们看到这些有趣且不常见的代码的时候，无需怀疑，只需要根据经验一步一步分析，就会发现其中的玄妙之处。在此我总结以下几点。

如果你一看就知道了答案，或猜出正确答案，说明基础做得好，点个赞。
如果你很犹豫，不知道答案，这也是正常的，因为很少见到这样写代码的，但是我们也需要去了解，才能究其根源。
我总结这个问题，是想提起一个关于代码编写风格，代码的可读性，代码的可修改性的话题，这样我们在写代码的时候才能够注意到，更好的编码。

- EOF -

推荐阅读点击标题可跳转

1、C 语言最大难点揭秘：编程的祸根！

2、C语言中的结构体和共用体（联合体）

3、C语言为何不会过时？你需要掌握多少种语言？

看完本文有帮助？请分享给更多人

关注「CPP开发者」加星标，提升C/C++技能

好文章，我在看❤️

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

跟着南通住建局学“朝令夕改”