面试官:断网了,还能 ping 通 127.0.0.1 吗?
可能看到标题,你就知道答案了,但是你了解背后的原因吗?那如果把 127.0.0.1
换成 0.0.0.0
或 localhost
会怎么样呢?你知道这几个IP
有什么区别吗?
以前面试的时候就遇到过这个问题,大家看个动图了解下面试官和我当时的场景,求当时小白的心里阴影面积。
话不多说,我们直接开车。
拔掉网线,断网。
然后在控制台输入ping 127.0.0.1
。
$ ping 127.0.0.1
PING 127.0.0.1 (127.0.0.1): 56 data bytes
64 bytes from 127.0.0.1: icmp_seq=0 ttl=64 time=0.080 ms
64 bytes from 127.0.0.1: icmp_seq=1 ttl=64 time=0.093 ms
64 bytes from 127.0.0.1: icmp_seq=2 ttl=64 time=0.074 ms
64 bytes from 127.0.0.1: icmp_seq=3 ttl=64 time=0.079 ms
64 bytes from 127.0.0.1: icmp_seq=4 ttl=64 time=0.079 ms
^C
--- 127.0.0.1 ping statistics ---
5 packets transmitted, 5 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 0.074/0.081/0.093/0.006 ms
说明,拔了网线,ping 127.0.0.1
是能ping通的。
其实这篇文章看到这里,标题前半个问题已经被回答了。但是我们可以再想深一点。
为什么断网了还能 ping
通 127.0.0.1
呢?
这能说明你不用交网费就能上网吗?
不能。
首先我们需要进入基础科普环节。
不懂的同学看了就懂了,懂的看了就当查漏补缺吧。
什么是127.0.0.1
首先,这是个 IPV4
地址。
IPV4
地址有 32
位,一个字节有 8
位,共 4
个字节。
其中127 开头的都属于回环地址,也是 IPV4
的特殊地址,没什么道理,就是人为规定的。
而127.0.0.1
是众多回环地址中的一个。之所以不是 127.0.0.2
,而是 127.0.0.1
,是因为源码里就是这么定义的,也没什么道理。
/* Address to loopback in software to local host. */
#define INADDR_LOOPBACK 0x7f000001 /* 127.0.0.1 */
IPv4
的地址是 32
位的,2的32次方,大概是40+亿
。地球光人口就76亿了,40亿IP这点量,塞牙缝都不够,实际上IP也确实用完了。
所以就有了IPV6
, IPv6
的地址是 128
位的,大概是2的128次方≈10的38次方。据说地球的沙子数量大概是 10的23次方,所以IPV6的IP可以认为用不完。
IPV4以8位一组,每组之间用 . 号隔开。
IPV6就以16位为一组,每组之间用 : 号隔开。如果全是0,那么可以省略不写。
在IPV4下的回环地址是 127.0.0.1
,在IPV6
下,表达为 ::1
。中间把连续的0给省略了,之所以不是7个 冒号,而是2个冒号: , 是因为一个 IPV6 地址中只允许出现⼀次两个连续的冒号。
多说一句:在IPV4下用的是 ping 127.0.0.1 命令。在IPV6下用的是 ping6 ::1 命令。
什么是 ping
ping 是应用层命令,可以理解为它跟游戏或者聊天软件属于同一层。只不过聊天软件可以收发消息,还能点个赞什么的,有很多复杂的功能。而 ping 作为一个小软件,它的功能比较简单,就是尝试发送一个小小的消息到目标机器上,判断目的机器是否可达,其实也就是判断目标机器网络是否能连通。
ping应用的底层,用的是网络层的ICMP协议。
虽然ICMP协议和IP协议都属于网络层协议,但其实ICMP也是利用了IP协议进行消息的传输。
所以,大家在这里完全可以简单的理解为 ping 某个IP 就是往某个IP地址发个消息。
TCP发数据和ping的区别
一般情况下,我们会使用 TCP 进行网络数据传输,那么我们可以看下它和 ping 的区别。
ping和其他应用层软件都属于应用层。
那么我们横向对比一下,比方说聊天软件,如果用的是TCP的方式去发送消息。
为了发送消息,那就得先知道往哪发。linux里万物皆文件,那你要发消息的目的地,也是个文件,这里就引出了socket 的概念。
要使用 socket
, 那么首先需要创建它。
在 TCP 传输中创建的方式是 socket(AF_INET, SOCK_STREAM, 0);
,其中 AF_INET
表示将使用 IPV4 里 host:port 的方式去解析待会你输入的网络地址。SOCK_STREAM
是指使用面向字节流的 TCP 协议,工作在传输层。
创建好了 socket
之后,就可以愉快的把要传输的数据写到这个文件里。调用 socket 的sendto
接口的过程中进程会从用户态进入到内核态,最后会调用到 sock_sendmsg
方法。
然后进入传输层,带上TCP
头。网络层带上IP
头,数据链路层带上 MAC
头等一系列操作后。进入网卡的发送队列 ring buffer ,顺着网卡就发出去了。
回到 ping
, 整个过程也基本跟 TCP
发数据类似,差异的地方主要在于,创建 socket
的时候用的是 socket(AF_INET,SOCK_RAW,IPPROTO_ICMP)
,SOCK_RAW
是原始套接字 ,工作在网络层, 所以构建ICMP
(网络层协议)的数据,是再合适不过了。ping 在进入内核态后最后也是调用的 sock_sendmsg
方法,进入到网络层后加上ICMP和IP头后,数据链路层加上MAC头,也是顺着网卡发出。因此 本质上ping 跟 普通应用发消息 在程序流程上没太大差别。
这也解释了为什么当你发现怀疑网络有问题的时候,别人第一时间是问你能ping通吗?因为可以简单理解为ping就是自己组了个数据包,让系统按着其他软件发送数据的路径往外发一遍,能通的话说明其他软件发的数据也能通。
为什么断网了还能 ping 通 127.0.0.1
前面提到,有网的情况下,ping 最后是通过网卡将数据发送出去的。
那么断网的情况下,网卡已经不工作了,ping 回环地址却一切正常,我们可以看下这种情况下的工作原理。
从应用层到传输层再到网络层。这段路径跟ping外网的时候是几乎是一样的。到了网络层,系统会根据目的IP,在路由表中获取对应的路由信息,而这其中就包含选择哪个网卡把消息发出。
当发现目标IP是外网IP时,会从"真网卡"发出。
当发现目标IP是回环地址时,就会选择本地网卡。
本地网卡,其实就是个"假网卡",它不像"真网卡"那样有个ring buffer
什么的,"假网卡"会把数据推到一个叫 input_pkt_queue
的 链表 中。这个链表,其实是所有网卡共享的,上面挂着发给本机的各种消息。消息被发送到这个链表后,会再触发一个软中断。
专门处理软中断的工具人"ksoftirqd" (这是个内核线程),它在收到软中断后就会立马去链表里把消息取出,然后顺着数据链路层、网络层等层层往上传递最后给到应用程序。
ping 回环地址和通过TCP等各种协议发送数据到回环地址都是走这条路径。整条路径从发到收,都没有经过"真网卡"。之所以127.0.0.1叫本地回环地址,可以理解为,消息发出到这个地址上的话,就不会出网络,在本机打个转就又回来了。所以断网,依然能 ping
通 127.0.0.1
。
ping回环地址和ping本机地址有什么区别
我们在mac里执行 ifconfig
。
$ ifconfig
lo0: flags=8049<UP,LOOPBACK,RUNNING,MULTICAST> mtu 16384
inet 127.0.0.1 netmask 0xff000000
...
en0: flags=8863<UP,BROADCAST,SMART,RUNNING,SIMPLEX,MULTICAST> mtu 1500
inet 192.168.31.6 netmask 0xffffff00 broadcast 192.168.31.255
...
能看到 lo0,表示本地回环接口,对应的地址,就是我们前面提到的 127.0.0.1 ,也就是回环地址。
和 eth0,表示本机第一块网卡,对应的IP地址是192.168.31.6,管它叫本机IP。
之前一直认为ping本机IP的话会通过"真网卡"出去,然后遇到第一个路由器,再发回来到本机。
为了验证这个说法,可以进行抓包,但结果跟上面的说法并不相同。
可以看到 ping 本机IP 跟 ping 回环地址一样,相关的网络数据,都是走的 lo0,本地回环接口,也就是前面提到的"假网卡"。
只要走了本地回环接口,那数据都不会发送到网络中,在本机网络协议栈中兜一圈,就发回来了。因此 ping回环地址和ping本机地址没有区别。
127.0.0.1 和 localhost 以及 0.0.0.0 有区别吗
回到文章开头动图里的提问,算是面试八股文里的老常客了。
以前第一次用 nginx
的时候,发现用这几个 IP
,都能正常访问到 nginx
的欢迎网页。一度认为这几个 IP
都是一样的。
但本质上还是有些区别的。
首先 localhost
就不叫 IP
,它是一个域名,就跟 "baidu.com"
,是一个形式的东西,只不过默认会把它解析为 127.0.0.1
,当然这可以在 /etc/hosts
文件下进行修改。
所以默认情况下,使用 localhost
跟使用 127.0.0.1
确实是没区别的。
其次就是 0.0.0.0
,执行 ping 0.0.0.0 ,是会失败的,因为它在IPV4
中表示的是无效的目标地址。
$ ping 0.0.0.0
PING 0.0.0.0 (0.0.0.0): 56 data bytes
ping: sendto: No route to host
ping: sendto: No route to host
但它还是很有用处的,回想下,我们启动服务器的时候,一般会 listen
一个 IP 和端口,等待客户端的连接。
如果此时 listen
的是本机的 0.0.0.0
, 那么它表示本机上的所有IPV4地址。
/* Address to accept any incoming messages. */
#define INADDR_ANY ((unsigned long int) 0x00000000) /* 0.0.0.0 */
举个例子。刚刚提到的 127.0.0.1
和 192.168.31.6
,都是本机的IPV4地址,如果监听 0.0.0.0
,那么用上面两个地址,都能访问到这个服务器。
当然, 客户端 connect
时,不能使用 0.0.0.0
。必须指明要连接哪个服务器IP。
总结
127.0.0.1
是回环地址。localhost
是域名,但默认等于127.0.0.1
。ping
回环地址和ping
本机地址,是一样的,走的是lo0 "假网卡",都会经过网络层和数据链路层等逻辑,最后在快要出网卡前狠狠拐了个弯, 将数据插入到一个链表后就软中断通知 ksoftirqd 来进行收数据的逻辑,压根就不出网络。所以断网了也能ping
通回环地址。如果服务器 listen
的是0.0.0.0
,那么此时用127.0.0.1
和本机地址都可以访问到服务。