前言这是一篇很长很长的文章,挑战你的忍耐极限! 一、理论五层模型互联网的实现,分为好几层,每一层都有自己特有的功能,而且每一层都靠下一层支持。用户接触到的,只是最上面的一层,我们称为应用层,要理解互联网,必须从最下层开始,自下而上的理解每一层的功能。 我们常见的网络模型,有以下三种:
它们之间的关系如下图所示 其中, 理论五层模型的结构如下图 各层的作用如下:
简单说,越下面的层,越靠近硬件;越上面的层,越靠近用户。 协议是什么每一层都是为了完成某一种功能。为了实现这些功能,需要遵守一些共同的规则,这些规则就是 互联网的每一层,都定义了很多协议。这些协议的总称,叫做 下面的内容中,我们通过每一层的功能的介绍,对每一层中的主要协议所起作用进行讲解。 二、物理层电脑要进行联网,需要把电脑通过各种设备连接进网络,设备有光缆、电缆、双绞线、无限电波等方式。 这就是 三、数据链路层1.定义物理层是用于传输信号的介质,它传输的是 这就是 2.以太网协议早期的时候,每家公司都有自己的电信号分组方式。逐渐地,一种叫做 以太网规定,一组电信号构成一个数据包,叫做
MTU(最大传输单元)MTU是链路层对物理层的限制。
MTU对IP协议的影响由于链路层存在MTU的限制,导致网络层的报文如果超过1500字节,就必要要对其进行分片发送。
MTU对UDP协议的影响
MTU对TCP协议的影响
3.MAC地址上面我们提到,以太网数据包的标头,包含了发送者和接受者的信息。那么,发送者和接受者是如何标识呢? 以太网规定,连入网络的所有设备,都必须具有网卡接口。数据包必须是从一块网卡,传送到另一块网卡。网卡的地址,就是数据包的发送地址和接收地址,这叫做MAC地址。 每块网卡出厂的时候,都有一个全世界独一无二的MAC地址,长度是48个二进制位,通常用12个十六进制数表示。 前6个十六进制数是厂商编号,后6个十六进制数是该厂商的网卡流水号。有了MAC地址,就可以定位网卡和数据包的路径了。 4.广播定义地址只是第一步,后面还有更多的步骤:
上图中,5号计算机向3号计算机发送一个数据包,同一个子网络的1号、2号、3号、4号、6号计算机都会收到这个包。它们读取这个包的标头,找到接收方的MAC地址,然后与自身的MAC地址相比较,如果两者相同,就接收这个包,做进一步处理,否则就丢弃这个包。这种发送方式就叫做广播(broadcasting)。 有了数据包的定义、网卡的MAC地址、广播的发送方式,'链接层'就可以在多台计算机之间传送数据了。 四、网络层1、 网络层的由来以太网协议,依靠MAC地址发送数据。理论上,单单依靠MAC地址,成都的网卡就可以找到休斯顿的网卡了,技术上是可以实现的。 但是,这样做有一个重大的缺点。以太网采用广播方式发送数据包,所有成员人手一包,不仅效率低,而且局限在发送者所在的子网络。也就是说,如果两台计算机不在同一个子网络,广播是传不过去的。这种设计是合理的,否则互联网上每一台计算机都会收到所有包,那会引起灾难。 互联网是无数子网络共同组成的一个巨型网络,很像想象成都和休斯顿的电脑会在同一个子网络,这几乎是不可能的。 因此,必须找到一种方法,能够区分哪些MAC地址属于同一个子网络,哪些不是。如果是同一个子网络,就采用广播方式发送,否则就采用路由方式发送。(路由的意思,就是指如何向不同的子网络分发数据包,这是一个很大的主题,本文不涉及。)遗憾的是,MAC地址本身无法做到这一点。它只与厂商有关,与所处网络无关。 这就导致了网络层的诞生。它的作用是引进一套新的地址,使得我们能够区分不同的计算机是否属于同一个子网络。这套地址就叫做网络地址,简称网址。 于是,网络层出现以后,每台计算机有了两种地址,一种是MAC地址,另一种是网络地址。两种地址之间没有任何联系,MAC地址是绑定在网卡上的,网络地址则是管理员分配的,它们只是随机组合在一起。 网络地址帮助我们确定计算机所在的子网络,MAC地址则将数据包送到该子网络中的目标网卡。因此,从逻辑上可以推断,必定是先处理网络地址,然后再处理MAC地址。 2、IP协议规定网络地址的协议,叫做IP协议。它所定义的地址,就被称为IP地址。目前,广泛采用的是IP协议的第四版和第六版,分别称为IPv4和IPv6。 (1) IPv4
互联网上的每一台计算机,都会分配到一个IP地址。 这个地址分成两个部分,前一部分代表网络,后一部分代表主机。 比如,IP地址14.215.177.39,这是一个32位的地址,假定它的网络部分是前24位(14.215.177),那么主机部分就是后8位(最后的那个1)。处于同一个子网络的电脑,它们IP地址的网络部分必定是相同的,也就是说14.215.177.2应该与14.215.177.1处在同一个子网络。 但是,问题在于单单从IP地址,我们无法判断网络部分。还是以14.215.177.39为例,它的网络部分,到底是前24位,还是前16位,甚至前28位,从IP地址上是看不出来的。那么,怎样才能从IP地址,判断两台计算机是否属于同一个子网络呢?这就要用到另一个参数 子网掩码:
NAT我们知道,IPv4的地址只有32位,地球上网民数量已经远远超出这个数字,那么,为啥至今还没出现地址枯竭呢? 因为我们还有一些技术,可以变相的缓解地址不足,比如NAT技术。
(2) IPv6定义:
IPv6号段划分和前缀表示法IPv6拥有128位巨大的地址空间,对于那么大的空间,也不是随意的划分,而是使用按照bit位进行号段划分。 IPv6地址结构如下图 ![]() 例如RFC4291中定义了n=48, m=16,也就是子网和接口ID与各占64位。 IPv6没有子网掩码mask的概念,它支持的是子网前缀标识方法。 使用IPv6地址/前缀长度表示方法,例如:
可以看到,一个IPv6的地址有子网前缀+接口ID构成,子网前缀由地址分配和管理机构定义和分配,而接口ID可以由各操作系统实现生成。 IPv6优点IPv6是用来解决IPv4地址枯竭问题的,IPv4地址为32位,而IPv6地址为128位 除了地址数量以外,IPv6还有很多优点,例如:
(3)IPv4和IPv6的区别
4) IP协议简单总结如上所述,IP协议的作用主要有两个:
3、IP数据包根据IP协议发送的数据,就叫做IP数据包。我们直接把IP数据包直接放进以太网数据包的'数据'部分,不用修改以太网的规格。这就是互联网分层结构的好处:上层的变动完全不涉及下层的结构。 具体来说,IP数据包也分为标头和数据两个部分:其中,标头范围为20-60字节(IPv6固定为40字节),整个数据包的总长度最大为65535字节。因此,理论上,一个IP数据包的数据部分,最长为65515字节。 ![]() 如图所示,标头中20字节是固定不变的,它包含了版本、长度、IP地址等信息,另外还有可变部分的标头可选。而数据则是IP数据包的具体内容。 将它放入以太网数据包后,以太网数据包就变成了下面这样: ![]() 在以太网协议中,以太网数据包的数据部分,最长只有1500字节。因此,如果IP数据包超过了1500字节,它就需要分割成几个以太网数据包,分开发送了。 4、ARP协议关于网络层,还有最后一点需要说明。因为IP数据包是放在以太网数据包里发送的,所以我们必须同时知道两个地址,一个是对方的MAC地址,另一个是对方的IP地址。通常情况下,对方的IP地址是已知的,但是我们不知道它的MAC地址。所以,我们需要一种机制,能够从IP地址得到MAC地址。 这里又可以分成两种情况:
总之,有了ARP协议之后,我们就可以得到同一个子网络内的主机MAC地址,可以把数据包发送到任意一台主机之上了。 ARP攻击ARP攻击是利用ARP协议设计时缺乏安全验证漏洞来实现的,通过伪造ARP数据包来窃取合法用户的通信数据,造成影响网络传输速率和盗取用户隐私信息等严重危害。 ARP攻击主要是存在于局域网网络中,局域网中若有一台计算机感染ARP木马,则感染该ARP木马的系统将会试图通过“ARP欺骗”手段截获所在网络内其它计算机的通信信息,并因此造成网内其它计算机的通信故障。 局域网中比较常见的ARP攻击包括:上网时断时续,拷贝文件无法完成,局域网内的ARP包激增。出现不正常的MAC地址,MAC地址对应多个IP地址,网络数据发不出去了,网上发送信息被窃取,个人PC中毒局域网内MAC地址泛洪使MAC地址缓存表溢出等问题。据包的协议地址不匹配,从而在网络中产生大量的ARP。 在局域网环境中,ARP攻击是主要的安全威胁,在传统网络中主要是通过静态绑定的方式来解决,但是这种方式限制了网络扩展的易用性。 五、传输层1、传输层的由来有了MAC地址和IP地址,我们已经可以在互联网上任意两台主机上建立通信。 接下来的问题是,同一台主机上有许多程序都需要用到网络,比如,你一边浏览网页,一边与朋友在线聊天。当一个数据包从互联网上发来的时候,你怎么知道,它是表示网页的内容,还是表示在线聊天的内容? 也就是说,我们还需要一个参数,表示这个数据包到底供哪个程序(进程)使用。这个参数就叫做端口(port),它其实是每一个使用网卡的程序的编号。每个数据包都发到主机的特定端口,所以不同的程序就能取到自己所需要的数据。 端口是0到65535之间的一个整数,正好16个二进制位。0到1023的端口被系统占用,用户只能选用大于1023的端口。不管是浏览网页还是在线聊天,应用程序会随机选用一个端口,然后与服务器的相应端口联系。 传输层的功能,就是建立端口到端口的通信。相比之下,网络层的功能是建立主机到主机的通信。只要确定主机和端口,我们就能实现程序之间的交流。因此,Unix系统就把主机+端口,叫做套接字(socket)。有了它,就可以进行网络应用程序开发了。 2、UDP协议:用户数据报协议现在,我们必须在数据包中加入端口信息,这就需要新的协议。最简单的实现叫做UDP协议,它的格式几乎就是在数据前面,加上端口号。 UDP数据包,也是由标头和数据两部分组成: ![]() 如图所示,UDP的标头固定为8字节,包含了16位源端口和16位目的端口,以及16位的UDP长度和16位的UDP检验和。然后,把整个UDP数据包放入IP数据包的数据部分,而前面说过,IP数据包又是放在以太网数据包之中的,所以整个以太网数据包现在变成了下面这样: ![]() UDP数据包非常简单,标头部分一共只有8个字节,总长度不超过65,535字节,正好放进一个IP数据包。 UDP中一个包的大小最大能多大
3、TCP协议:传输控制协议UDP协议的优点是比较简单,容易实现,但是缺点是可靠性较差,一旦数据包发出,无法知道对方是否收到。为了解决这个问题,提高网络可靠性,TCP协议就诞生了。这个协议非常复杂,但可以近似认为,它就是有确认机制的UDP协议,每发出一个数据包都要求确认。如果有一个数据包遗失,就收不到确认,发出方就知道有必要重发这个数据包了。 因此,TCP协议能够确保数据不会遗失。它的缺点是过程复杂、实现困难、消耗较多的资源。 ![]() 如图所示,TCP标头在20-60字节之间,除了源端口号和目的端口号之外,还包含了序号、确认号等各种信息,用于保证可靠连接与数据重发。 TCP数据包和UDP数据包一样,都是内嵌在IP数据包的数据部分。TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保单个TCP数据包不必再分割。 ![]() 六、应用层应用程序收到传输层的数据,接下来就要进行解读。由于互联网是开放架构,数据来源五花八门,必须事先规定好格式,否则根本无法解读。应用层的作用,就是规定应用程序的数据格式。 举例来说,TCP协议可以为各种各样的程序传递数据,比如Email、WWW、FTP等等。那么,必须有不同协议规定电子邮件、网页、FTP数据的格式,这些应用程序协议就构成了应用层。这是最高的一层,直接面对用户。它的数据就放在TCP数据包的数据部分。 因此,现在的以太网的数据包就变成下面这样: ![]() 结语我只想说,读到这里的,都是 点个 来源于:https:///post/6876860213991833613#heading-15 |
|