一个奇怪的链接问题

From 守望先生编程珠玑 2019-04-02

前言

链接是代码生成可执行文件中一个非常重要的过程。我们在使用一些库函数时，有时候需要链接库，有时候又不需要，这是为什么呢？了解一些链接的基本过程，能够帮助我们在编译时解决一些疑难问题。比如，下面就有一种奇怪的现象。

一个奇怪的链接问题

程序功能很简单，计算e的n次方。程序清单如下（代码一）：

#include<stdio.h>
#include<math.h>
int main(int argc,char *argv[])
{
    double a = exp(2);
    printf("%lf\n",a);
    return 0;
}

编译运行：

gcc -o expTest expTest.c
./expTest
7.389056

一切似乎顺理成章，我们再来看下面这种情况，将变量b=2传入exp函数（代码二）：

#include<stdio.h>
#include<math.h>
int main(int argc,char *argv[])
{
    int b = 2;
    double a = exp(b);
    printf("%lf\n",a);
    return 0;
}

编译：

gcc -o expTest expTest.c
/tmp/ccx5lXbS.o：在函数‘main’中：
expTest.c:(.text+0x20)：对‘exp’未定义的引用
collect2: error: ld returned 1 exit status

我们发现，同样的编译方法编译不过了，提示对‘exp’未定义的引用，并且抛出链接出错。

我们通过man命令查看exp函数：

man 3 exp
NAME
       exp, expf, expl - base-e exponential function

SYNOPSIS
       #include <math.h>

       double exp(double x);
       float expf(float x);
       long double expl(long double x);

       Link with -lm.

发现它除了需要包含头文件math.h外，编译时还需要使用-lm链接。
再次编译运行：

gcc -lm -o  expTest expTest.c 
/tmp/ccYT3E65.o：在函数‘main’中：
expTest.c:(.text+0x20)：对‘exp’未定义的引用
collect2: error: ld returned 1 exit status

为什么还是不行呢？我们已经按照帮助手册的只是加了-lm了啊？难道是位置不对？我们换个位置试试：

gcc -o  expTest expTest.c -lm 
./expTest
7.389056

现在终于成功编译并运行。

分析

虽然最后终于成功编译运行，但是不免产生了几个疑问：

两段代码同样都调用了exp函数，为什么一个需要链接，一个不需要链接呢？
到底什么时候需要链接呢？
为什么链接的时候放在前面就不行呢？

我们一一解答。
1.为什么一个需要链接，一个不需要？
我们可以观察到，代码一调用exp传入的参数是常量2，代码二调用exp传入的参数是变量b，那么对于代码一会不会在运行之前就计算好了呢？
我们来看一下它们的汇编代码。
代码一：

.LC1:
        .string "%lf\n"
main:
        push    rbp
        mov     rbp, rsp
        sub     rsp, 32
        mov     DWORD PTR [rbp-20], edi
        mov     QWORD PTR [rbp-32], rsi
        movsd   xmm0, QWORD PTR .LC0[rip]
        movsd   QWORD PTR [rbp-8], xmm0
        movsd   xmm0, QWORD PTR [rbp-8]
        mov     edi, OFFSET FLAT:.LC1
        mov     eax, 1
        call    printf
        mov     eax, 0
        leave
        ret
.LC0:
        .long   3100958126
        .long   1075678820

代码二：

.LC0:
        .string "%lf\n"
main:
        push    rbp
        mov     rbp, rsp
        sub     rsp, 32
        mov     DWORD PTR [rbp-20], edi
        mov     QWORD PTR [rbp-32], rsi
        mov     DWORD PTR [rbp-4], 2
        cvtsi2sd        xmm0, DWORD PTR [rbp-4]
        call    exp
        movq    rax, xmm0
        mov     QWORD PTR [rbp-16], rax
        movsd   xmm0, QWORD PTR [rbp-16]
        mov     edi, OFFSET FLAT:.LC0
        mov     eax, 1
        call    printf
        mov     eax, 0
        leave
        ret

汇编的具体细节我们无需尽知，但是我们可以很明显地看到，第二段代码调用了exp函数（call exp指令），而第一段代码没有看到调用exp的身影。
实际上，通过汇编代码可以看到，当传入参数为常量时，就已经计算好了值（emm0寄存器为浮点运算相关寄存器），最后根本不需要调用exp函数。而对于变量型的参数，其值在运行时确定，因此需要调用。我们还可以通过ldd命令来看它们链接的库有什么不同。
对于代码一：

ldd expTest
    linux-vdso.so.1 =>  (0x00007ffec079d000)
    libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fd327744000)
    /lib64/ld-linux-x86-64.so.2 (0x00007fd327b0e000)

对于代码二：

ldd expTest
    linux-vdso.so.1 =>  (0x00007ffefdfc9000)
    libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f9afcccb000)
    libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f9afc901000)
    /lib64/ld-linux-x86-64.so.2 (0x00007f9afcfd4000)

可以看到，第二段代码编译出来的可执行文件，多依赖了libm.so.6，也就是exp函数所在的库。

2.什么时候需要链接？
事实上，C编译器总是主动传送libc.a或libc.so给链接器，也就是说，对于使用包含在libc.a或libc.so库中的函数，是不需要在编译时手动链接的。而调用函数是否需要链接，可以使用命令“man 3 函数名“查看，如果需要链接库，最后都有说明。

3.为什么链接的时候放在前面就不行呢？
这个就涉及到链接器的工作原理了，在此只简单说明一下：链接过程中，需要进行符号解析，并且是按照顺序解析；如果库链接在前，就可能出现库中的符号不会被需要，链接器不会把它加到未解析的符号集合中，那么后面引用这个符号的目标文件就不能解析该引用，导致最后链接失败。因此链接库的一般准则是将它们放在命令行的结尾。

总结

通过前面的实例和分析，我们总结出以下几点：

调用包含于libc库中的函数不需要链接。
对于传参为常量的数学函数调用，生成可执行文件过程中可能将其优化，而无需调用该函数。
库链接一般放在命令行结尾。
通过man命令查看在调用某个函数时是否需要链接。

| 读书 | 成长 | 技术 |

长按二维码关注公众号

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

小敏感喊话阿哲，出镜抖音！欠钱不还，小白龙再被扒借贷官司！