查看原文
其他

【C进阶】一不小心就被"strlen"给坑了!

bug菌 最后一个bug 2022-07-15

1、聊一聊

    和bug菌同龄的小伙伴在听这首歌的时候,脑海中应该很有画面感吧,转眼间这首歌曲已经有20年了!

    今天主要是跟大家分析一下C语言strlen需要注意的几点,编码的时候稍微不注意就可能掉坑,如果大家还有遇到其他的坑记得文末分享留言!


2、strlen掉坑实例

    就先贴上一个掉坑的例子,然后在跟大家总结分享下原因和避坑指南:

编码目标:

    根据字符串起点打印不同偏移(Offset)到结尾的字符串,如果Offset为负数就向前移动并打印到字符串末尾。

掉坑示例:
1#include <stdio.h>
2#include <string.h> 
3/***************************************
4 * Fuction:sGetStr
5 * Decri  :打印相应位置到末尾的字符串 
6 * Author :(欢迎关注公众号:最后一个bug) 
7 ***************************************/

8int sGetStr(const char * str,int offset)
9{
10   if(offset > strlen(str)) 
11    {
12        printf("offset Over Error!!\n");
13    }
14    else
15    {
16        printf("%s\n",str + offset); 
17    } 
18
19/***************************************
20 * Fuction:main
21 * Decri  :不同起点位置的字符串打印 
22 * Author :(欢迎关注公众号:最后一个bug) 
23 ***************************************/

24int main(int argc, char *argv[]) {
25
26    char * pSrstr = "0123456789";
27
28    sGetStr(pSrstr + 5,0);
29    sGetStr(pSrstr + 5,-2);
30
31    printf("欢迎关注公众号:最后一个bug\n");
32    return 0;
33}
输出结果:


  • 第一次打印能够成功,而第二次采用负数Offset打印直接比较失败,很明显Offset为负数却大于了strlen返回值,基本上我们肯定strlen肯定是正数,那为啥会失败呢?我们还得查查strlen的函数原型。


3、size_t分析

    于是找来了一个strlen的函数声明:


    通过上面的声明我们了解到size_t是一个与系统有关的定义类型,系统为了增强可移植性等等会进行不同的处理,到这里应该会有点想法,难道这个size_t是一个无符号类型?

    因为之前我们也说过整形数据的提升问题<【重磅】“整形数”还真没那么简单(C语言版)>,如果unsigned int与int进行运算会统一提升为无符号来处理,这样也会导致出现上面的结果。


    得找找size_t的具体实现,通过查找C标准库了解到,size_t是一个无符号的整形类型,如下图所示:


上图截取至http://www.cplusplus.com/reference/cstddef/

    总感觉说明虚了一点,还是上代码比较实在点,于是bug菌找来了一个具体实现:


    上图可以看到size_t根据系统位数不同,分别由unsigned int和unsigned long这样的无符号类型来实现,所以与我们的猜测还是相符合的。

    如果还想进一步深究,请看汇编吧!!

处理办法:

    处理办法其实挺多,可以把strlen函数返回值强制类型转化为一个有符号类型,然后再进行有符号类型比较;如果有符号数为负数也可以单独判断符号后处理。

    下面我们就简单的强制类型转化一下看一下结果,之前的代码做如下修改:

1/***************************************
2 * Fuction:sGetStr
3 * Decri  :打印相应位置到末尾的字符串 
4 * Author :(欢迎关注公众号:最后一个bug) 
5 ***************************************/

6int sGetStr(const char * str,int offset)
7{
8   if(offset > (int)strlen(str)) //强制转化为有符号
9    {
10        printf("offset Over Error!!\n");
11    }
12    else
13    {
14        printf("%s\n",str+offset); 
15    } 
16
输出结果:


  • 上图的输出我们获得了正确的结果。

  • 那么对于平时喜欢使用size_t类型或者是一些与size_t有关的标准函数可也要注意了,不然一不小心又掉到坑里去了!

4、最后小结

    本文到这里就结束了,欢迎大家留言分享讨论。

    好了,这里是公众号:“最后一个bug”,一个为大家打造的技术知识提升基地。

推荐好文  点击蓝色字体即可跳转

【收藏】【看门狗软件设计】"喂狗"真那么简单吗?

【经验】bug菌谈单片机编程"十层功力",你练到了第几层?

【MCU】一种单片机节省内存的方法(补充)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存