你女神爱不爱你,你问她,她可能不会告诉你。
但网通不通,你
ping一下就知道了。
可能看到标题,你就知道答案了,但是你了解背后的原因吗?那如果把127.0.0.1换成0.0.0.0或localhost会怎么样呢?你知道这几个IP有什么区别吗?
以前面试的时候就遇到过这个问题,大家看个动图了解下面试官和我当时的场景,求当时小白的心里阴影面积。
话不多说,我们直接开车。
拔掉网线,断网。
然后在控制台输入ping 127.0.0.1。
$ ping 127.0.0.1
PING 127.0.0.1 (127.0.0.1): 56 data bytes
64 bytes from 127.0.0.1: icmp_seq=0 ttl=64 time=0.080 ms
64 bytes from 127.0.0.1: icmp_seq=1 ttl=64 time=0.093 ms
64 bytes from 127.0.0.1: icmp_seq=2 ttl=64 time=0.074 ms
64 bytes from 127.0.0.1: icmp_seq=3 ttl=64 time=0.079 ms
64 bytes from 127.0.0.1: icmp_seq=4 ttl=64 time=0.079 ms
^C
--- 127.0.0.1 ping statistics ---
5 packets transmitted, 5 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 0.074/0.081/0.093/0.006 ms
说明,拔了网线,ping 127.0.0.1是能ping通的。
其实这篇文章看到这里,标题前半个问题已经被回答了。但是我们可以再想深一点。
为什么断网了还能ping通127.0.0.1呢?
这能说明你不用交网费就能上网吗?
不能。
首先我们需要进入基础科普环节。
不懂的同学看了就懂了,懂的看了就当查漏补缺吧。
什么是127.0.0.1
首先,这是个IPV4地址。
IPV4地址有32位,一个字节有8位,共4个字节。
其中127 开头的都属于回环地址,也是IPV4的特殊地址,没什么道理,就是人为规定的。
而127.0.0.1是众多回环地址中的一个。之所以不是127.0.0.2,而是127.0.0.1,是因为源码里就是这么定义的,也没什么道理。
/* Address to loopback in software to local host. */
#define INADDR_LOOPBACK 0x7f000001 /* 127.0.0.1 */
回环地址IPv4的地址是32位的,2的32次方,大概是40 亿。地球光人口就76亿了,40亿IP这点量,塞牙缝都不够,实际上IP也确实用完了。
所以就有了IPV6,IPv6的地址是128位的,大概是2的128次方≈10的38次方。据说地球的沙子数量大概是 10的23次方,所以IPV6的IP可以认为用不完。
IPV4以8位一组,每组之间用 . 号隔开。
IPV6就以16位为一组,每组之间用 : 号隔开。如果全是0,那么可以省略不写。
ipv6回环地址在IPV4下的回环地址是127.0.0.1,在IPV6下,表达为::1。中间把连续的0给省略了,之所以不是7个 冒号,而是2个冒号: , 是因为一个 IPV6 地址中只允许出现⼀次两个连续的冒号。
多说一句:在IPV4下用的是 ping 127.0.0.1 命令。在IPV6下用的是 ping6 ::1 命令。
什么是 ping
ping 是应用层命令,可以理解为它跟游戏或者聊天软件属于同一层。只不过聊天软件可以收发消息,还能点个赞什么的,有很多复杂的功能。而 ping 作为一个小软件,它的功能比较简单,就是尝试发送一个小小的消息到目标机器上,判断目的机器是否可达,其实也就是判断目标机器网络是否能连通。
ping应用的底层,用的是网络层的ICMP协议。
IP和ICMP和Ping所在分层虽然ICMP协议和IP协议都属于网络层协议,但其实ICMP也是利用了IP协议进行消息的传输。
ip和icmp的关系所以,大家在这里完全可以简单的理解为 ping 某个IP 就是往某个IP地址发个消息。
TCP发数据和ping的区别
一般情况下,我们会使用 TCP 进行网络数据传输,那么我们可以看下它和 ping 的区别。
ping和普通发消息的关系ping和其他应用层软件都属于应用层。
那么我们横向对比一下,比方说聊天软件,如果用的是TCP的方式去发送消息。
为了发送消息,那就得先知道往哪发。linux里万物皆文件,那你要发消息的目的地,也是个文件,这里就引出了socket 的概念。
要使用socket, 那么首先需要创建它。
在 TCP 传输中创建的方式是socket(AF_INET, SOCK_STREAM, 0);,其中AF_INET表示将使用 IPV4 里 host:port 的方式去解析待会你输入的网络地址。SOCK_STREAM是指使用面向字节流的 TCP 协议,工作在传输层。
创建好了socket之后,就可以愉快的把要传输的数据写到这个文件里。调用 socket 的sendto接口的过程中进程会从用户态进入到内核态,最后会调用到sock_sendmsg方法。
然后进入传输层,带上TCP头。网络层带上IP头,数据链路层带上MAC头等一系列操作后。进入网卡的发送队列 ring buffer ,顺着网卡就发出去了。
回到ping, 整个过程也基本跟TCP发数据类似,差异的地方主要在于,创建socket的时候用的是socket(AF_INET,SOCK_RAW,IPPROTO_ICMP),SOCK_RAW是原始套接字 ,工作在网络层, 所以构建ICMP(网络层协议)的数据,是再合适不过了。ping 在进入内核态后最后也是调用的sock_sendmsg方法,进入到网络层后加上ICMP和IP头后,数据链路层加上MAC头,也是顺着网卡发出。因此 本质上ping 跟 普通应用发消息 在程序流程上没太大差别。
这也解释了为什么当你发现怀疑网络有问题的时候,别人第一时间是问你能ping通吗?因为可以简单理解为ping就是自己组了个数据包,让系统按着其他软件发送数据的路径往外发一遍,能通的话说明其他软件发的数据也能通。
为什么断网了还能 ping 通 127.0.0.1
前面提到,有网的情况下,ping 最后是通过网卡将数据发送出去的。
那么断网的情况下,网卡已经不工作了,ping 回环地址却一切正常,我们可以看下这种情况下的工作原理。
ping回环地址从应用层到传输层再到网络层。这段路径跟ping外网的时候是几乎是一样的。到了网络层,系统会根据目的IP,在路由表中获取对应的路由信息,而这其中就包含选择哪个网卡把消息发出。
当发现目标IP是外网IP时,会从"真网卡"发出。
当发现目标IP是回环地址时,就会选择本地网卡。
本地网卡,其实就是个"假网卡",它不像"真网卡"那样有个ring buffer什么的,"假网卡"会把数据推到一个叫input_pkt_queue的 链表 中。这个链表,其实是所有网卡共享的,上面挂着发给本机的各种消息。消息被发送到这个链表后,会再触发一个软中断。
专门处理软中断的工具人"ksoftirqd" (这是个内核线程),它在收到软中断后就会立马去链表里把消息取出,然后顺着数据链路层、网络层等层层往上传递最后给到应用程序。
工具人ksoftirqdping 回环地址和通过TCP等各种协议发送数据到回环地址都是走这条路径。整条路径从发到收,都没有经过"真网卡"。之所以127.0.0.1叫本地回环地址,可以理解为,消息发出到这个地址上的话,就不会出网络,在本机打个转就又回来了。所以断网,依然能ping通127.0.0.1。
ping回环地址和ping本机地址有什么区别
我们在mac里执行ifconfig。
$ ifconfig
lo0: flags=8049
mtu 16384
inet 127.0.0.1 netmask 0xff000000
...
en0: flags=8863 mtu 1500
inet 192.168.31.6 netmask 0xffffff00 broadcast 192.168.31.255
...
能看到 lo0,表示本地回环接口,对应的地址,就是我们前面提到的 127.0.0.1 ,也就是回环地址。
和 eth0,表示本机第一块网卡,对应的IP地址是192.168.31.6,管它叫本机IP。
之前一直认为ping本机IP的话会通过"真网卡"出去,然后遇到第一个路由器,再发回来到本机。
为了验证这个说法,可以进行抓包,但结果跟上面的说法并不相同。
ping 127.0.0.1
ping 本机地址可以看到 ping 本机IP 跟 ping 回环地址一样,相关的网络数据,都是走的 lo0,本地回环接口,也就是前面提到的"假网卡"。
只要走了本地回环接口,那数据都不会发送到网络中,在本机网络协议栈中兜一圈,就发回来了。因此 ping回环地址和ping本机地址没有区别。
127.0.0.1 和 localhost 以及 0.0.0.0 有区别吗
回到文章开头动图里的提问,算是面试八股文里的老常客了。
以前第一次用nginx的时候,发现用这几个IP,都能正常访问到nginx的欢迎网页。一度认为这几个IP都是一样的。
访问127.0.0.1:80访问localhost:80访问0.0.0.0:80访问本机的IP地址但本质上还是有些区别的。
首先localhost就不叫IP,它是一个域名,就跟"baidu.com",是一个形式的东西,只不过默认会把它解析为127.0.0.1,当然这可以在/etc/hosts文件下进行修改。
所以默认情况下,使用localhost跟使用127.0.0.1确实是没区别的。
其次就是0.0.0.0,执行 ping 0.0.0.0 ,是会失败的,因为它在IPV4中表示的是无效的目标地址。
$ ping 0.0.0.0
PING 0.0.0.0 (0.0.0.0): 56 data bytes
ping: sendto: No route to host
ping: sendto: No route to host
但它还是很有用处的,回想下,我们启动服务器的时候,一般会listen一个 IP 和端口,等待客户端的连接。
如果此时listen的是本机的0.0.0.0, 那么它表示本机上的所有IPV4地址。
/* Address to accept any incoming messages. */
#define INADDR_ANY ((unsigned long int) 0x00000000) /* 0.0.0.0 */
举个例子。刚刚提到的127.0.0.1和192.168.31.6,都是本机的IPV4地址,如果监听0.0.0.0,那么用上面两个地址,都能访问到这个服务器。
当然, 客户端connect时,不能使用0.0.0.0。必须指明要连接哪个服务器IP。
总结
-
127.0.0.1是回环地址。localhost是域名,但默认等于127.0.0.1。
-
ping回环地址和ping本机地址,是一样的,走的是lo0 "假网卡",都会经过网络层和数据链路层等逻辑,最后在快要出网卡前狠狠拐了个弯, 将数据插入到一个链表后就软中断通知 ksoftirqd 来进行收数据的逻辑,压根就不出网络。所以断网了也能ping通回环地址。
-
如果服务器listen的是0.0.0.0,那么此时用127.0.0.1和本机地址都可以访问到服务。
参考资料
《127.0.0.1 之本机网络通信过程知多少 ?!》
- EOF -
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。