文章目录[隐藏]
应用层
1. 概述
我们在浏览器的地址中输入某个网站的域名后,就可以访问该网站的内容,这个就是万维网 WWW 应用,其相关的应用层协议为超文本传送协议 HTTP
用户在浏览器地址栏中输入的是“见名知意”的域名,而 TCP/IP 的网际层使用 IP 地址来表示目的主机,从域名到 IP 地址的装转换,由属于应用层范畴的域名系统DNS,在后台帮用户完成
常见的应用
2. 客户 / 服务器方式(C/S方式)
- 客户/服务器(Client/Server,C/S)方式
- 客户和服务器是指通信中所涉及的两个应用进程
- 客户/服务器方式所描述的是进程之间服务和被服务的关系
- 客户是服务请求方,服务器是服务提供方
- 服务器总是处于运行状态,并等待客户的服务请求。服务器具有固定端口号(例如 HTTP 服务器的默认端口号为80),而运行服务器的主机也具有固定的 IP 地址
- C/S方式是因特网上传统的、同时也是最成熟的方式,很多我们熟悉的网络应用采用的都是C/S方式。包括万维网WWW、电子邮件、文件传输FTP等
- 基于C/S方式的应用服务通常是服务集中型的,即应用服务集中在网络中比客户计算机少得多的服务器计算机上
- 由于一台服务器计算机要为多个客户机提供服务,在C/S应用中,常会出现服务器计算机跟不上众多客户机请求的情况
- 为此,在C/S应用中,常用计算机集群(或服务器场)构建一个强大的虚拟服务器
3. 对等方式(P2P方式)
- 对等(Peer-to-Peer,P2P)方式
- 在 P2P 方式中,没有固定的服务请求者和服务提供者,分布在网络边缘各端系统中的应用进程是对等的,被称为对等方。对等方相互之间直接通信,每个对等方既是服务的请求者,又是服务的提供者
- 目前,在因特网上流行的 P2P 应用主要包括P2P文件共享、即时通信、P2P流媒体、分布式存储等
- 基于 P2P 的应用是服务分散型的,因为服务不是集中在少数几个服务器计算机中,而是分散在大量对等计算机中,这些计算机并不为服务提供商所有,而是为个人控制的桌面计算机和笔记本电脑,它们通常位于住宅、校园和办公室中
- P2P 方式的最突出特性之一就是它的可扩展性。因为系统每增加一个对等方,不仅增加的是服务的请求者,同时也增加了服务的提供者,系统性能不会因规模的增大而降低
- P2P 方式具有成本上的优势,因为它通常不需要庞大的服务器设施和服务器带宽。为了降低成本,服务提供商对于将 P2P 方式用于应用的兴趣越来越大
4. 动态主机配置协议 DHCP
4.1 基本概念
- 互联网广泛使用的动态主机配置协议 DHCP(Dynamic Host Configuration Protocol)提供了即插即用连网(plug-and-play networking)的机制
- 这种机制允许一台计算机加入新网络时可自动获取 IP 地址等网络配置信息而不用手工参与
4.2 作用
在之前,如果要正常访问 Web 服务器,需要该主机手动配置网络的相关配置信息
如果主机数很多,就工作量大,容易出错
如果我们给网络中添加一台 DHCP 服务器
4.3 工作过程
(1)DHCP 使用客户 - 服务器方式
- 需要 IP 地址的主机在启动时就向 DHCP 服务器广播发送发现报文(DHCP DISCOVER),这时该主机就成为 DHCP 客户
- 本地网络上所有主机都能收到此广播报文,但只有 DHCP 服务器才会回答此广播报文(只有 DHCP 服务器应用层始终运行着 DHCP 服务器进程)
- DHCP 服务器先在其数据库中查找该计算机的配置信息。若找到,则返回找到的信息。若找不到,则从服务器的 IP 地址池(address pool)中取一个地址分配给该计算机。DHCP 服务器的回答报文叫做提供报文(DHCP OFFER)
(2)DHCP 工作方式
- DHCP 使用客户-服务器方式,采用请求/应答方式工作
- DHCP 基于 UDP 工作(DHCP 报文在运输层会被封装成为 UDP 用户数据报),DHCP 服务器运行在 67 号端口, DHCP客户运行在 68 号端口
(3)DHCP 交互过程
DHCP 客户端将广播发送 DHCP 发现报文(DHCP DISCOVER)
- 事务ID
- DHCP客户端的MAC地址
封装该报文的 IP 数据报的源 IP 地址为0.0.0.0,这是因为主机目前还未分配到 IP 地址,因此使用该地址代替
目的 IP 地址为广播地址255.255.255.255,之所以广播发送,是因为主机现在并不知道网络中有哪几个 DHCP 服务器。它们的IP地址各是什么
DHCP 服务器收到 DHCP 发现报文后,根据其中封装的 DHCP 客户端的 MAC 地址来查找自己的数据库,如果查到匹配信息,则使用这些配置信息来构建并发送 DHCP 提供报文,如果没有则采用默认配置信息来构建报文并发送
DHCP 服务端将广播发送 DHCP 提供报文(DHCP OFFER)
- 事务ID:DHCP 客户端会与之前 DHCP 发现报文的事务 ID 做对比,来判断该 DHCP 提供报文是否是自己的
- 配置信息:
- IP地址:DHCP 服务器从自己的IP地址池中挑选待租用给主机的IP地址(使用 ARP 来确保所选 IP 地址未被网络中其他主机占用)
- 子网掩码
- 地址租期
- 默认网关
- DNS服务器
源IP地址:发送 DHCP 提供报文的 DHCP 服务器的 IP
目的地址:因为目的主机还没分配到 IP,所以使用广播地址
在本例中,DHCP 客户会收到两个 DHCP 服务器发来的 DHCP 提供报文,DHCP 客户从中选择一个,一般选择先到的,并向所选择的 DHCP 服务器发送 DHCP 请求报文
DHCP 客户端将广播发送 DHCP 请求报文(DHCP REQUEST)
- 事务ID
- DHCP客户端的MAC地址
- 接受的租约中的IP地址
- 提供此租约的DHCP服务器端的IP地址
源地址:0.0.0.0,因为此时 DHCP 客户才从多个 DHCP 服务器中挑选一个作为自己的 DHCP 服务器。它首先要征得该服务器的同意,之后才能正常使用向该 DHCP 服务器租用的 IP 地址
目的地址:广播地址,这样可以一次性向所有 DHCP 服务器发送 DHCP 请求报文,来告知它们是否请求它们作为自己的 DHCP 服务器
在本例中,假设 DHCP 客户端选择 DHCP 服务器1 作为自己的 DHCP 服务器,DHCP 服务器1 接受该请求,于是 DHCP 服务器1 给 DHCP 客户端发送 DHCP 确认报文
源地址:DHCP 服务器1 的 IP 地址
目的地址:广播地址
DHCP 客户收到该报文后就可以使用租用的 IP 地址
在使用前还会进行 ARP 检测
剩下流程图示
4.4 DHCP 中继代理
下图的网络拓扑中的各主机是否可以通过 DHCP 来自动获取到网络配置?
使用 DHCP 中继代理是因为我们并不愿意在每一个网络上都设置一个 DHCP 服务器,因为这样会使 DHCP 服务器的数量太多
5. 域名系统 DNS
5.1 基本概念
- DNS,全称域名系统(Domain Name System),是互联网中的一项基础性技术,它充当了互联网上的地址翻译服务,将人类可读的域名(例如www.example.com)映射到计算机可理解的 IP 地址(例如192.168.1.1)。DNS 在互联网通信中起到了至关重要的作用
因特网是否可以只使用一台 DNS 服务器?
- 这种做法并不可取。因为因特网的规模很大,这样的域名服务器肯定会因为超负荷而无法正常工作,而且一旦域名服务器出现故障,整个因特网就会瘫痪
- 早在1983年,因特网就开始采用层次结构的命名树作为主机的名字(即域名)并使用分布式的域名系统 DNS
- DNS 使大多数域名都在本地解析,仅少量解析需要在因特网上通信,因此系统效率很高
- 由于 DNS 是分布式系统,即使单个计算机出了故障,也不会妨碍整个系统的正常运行
(1)域名结构
-
因特网采用层次树状结构的域名结构
-
域名的结构由若干个分量组成,各分量之间用“点”隔开,分别代表不同级别的域名
- 每一级的域名都由英文字母和数字组成,不超过63个字符,不区分大小写字母
- 级别最低的域名写在最左边,而级别最高的顶级域名写在最右边
- 完整的域名不超过255个字符
-
域名系统既不规定一个域名需要包含多少个下级域名,也不规定每一级的域名代表什么意思
-
各级域名由其上一级的域名管理机构管理,而最高的顶级域名则由因特网名称与数字地址分配机构 ICANN 进行管理
(2)域名分类
-
顶级域名 TLD(Top Level Domain)分为以下三类:
- 国家顶级域名 nTLD:采用IS0 3166的规定。如cn表示中国,us表示美国,uk表示英国等等
- 通用顶级域名 gTLD:最常见的通用顶级域名有七个,即:com(公司企业)、net(网络服务机构)、org(非营利性组织)、int(国际组织)、edu(美国教育结构)、 gov(美国政府部门)、mil(美国军事部门)
- 反向域 arpa:用于反向域名解析,即 IP 地址反向解析为域名
-
在国家顶级域名下注册的二级域名均由该国家自行确定。例如,顶级域名为 jp 的日本,将其教育和企业机构的二级域名定为 ac 和 co,而不用 edu 和 com
-
我国则将二级域名划分为以下两类:
- 类别域名:共七个:ac(科研机构)、com(工、商、金融等企业)、edu(教育机构)、gov(政府部门)、net(提供网络服务的机构)、mil(军事机构)和org(非营利性组织)
- 行政区域名:共34个,适用于我国的各省、自治区、直辖市。例如:bj为北京市、sh为上海市、 js为江苏省等等
名称相同的域名其等级未必相同
(3)域名服务器类型
-
域名和 IP 地址的映射关系必须保存在域名服务器中,供所有其他应用查询。显然不能将所有信息都储存在一台域名服务器中。DNS 使用分布在各地的域名服务器来实现域名到 IP 地址的转换
-
域名服务器可以划分为以下四种不同的类型:
- 根域名服务器
根域名服务器是最高层次的域名服务器。每个根域名服务器都知道所有的顶级域名服务器的域名及其 IP 地址。因特网上共有13个不同 IP 地址的根域名服务器。尽管我们将这13个根域名服务器中的每一个都视为单个的服务器,但“每台服务器”实际上是由许多分布在世界各地的计算机构成的服务器集群。当本地域名服务器向根域名服务器发出查询请求时,路由器就把查询请求报文转发到离这个 DNS 客户最近的一个根域名服务器。这就加快了 DNS 的查询过程,同时也更合理地利用了因特网的资源。根域名服务器通常并不直接对域名进行解析,而是返回该域名所属顶级域名的顶级域名服务器的 IP 地址
- 顶级域名服务器
这些域名服务器负责管理在该顶级域名服务器注册的所有二级域名。当收到 DNS 查询请求时就给出相应的回答(可能是最后的结果,也可能是下一级权限域名服务器的 IP 地址)
- 权限域名服务器
这些域名服务器负责管理某个区的域名。每一个主机的域名都必须在某个权限域名服务器处注册登记。因此权限域名服务器知道其管辖的域名与 IP 地址的映射关系。另外,权限域名服务器还知道其下级域名服务器的地址
- 本地域名服务器
本地域名服务器不属于上述的域名服务器的等级结构。当一个主机发出 DNS 请求报文时,这个报文就首先被送往该主机的本地域名服务器。本地域名服务器起着代理的作用,会将该报文转发到上述的域名服务器的等级结构中。每一个因特网服务提供者 ISP,一个大学,甚至一个大学里的学院,都可以拥有一个本地域名服务器,它有时也称为默认域名服务器。本地域名服务器离用户较近,一般不超过几个路由器的距离,也有可能就在同一个局域网中。本地域名服务器的 IP 地址需要直接配置在需要域名解析的主机中
5.2 域名解析过程
-
递归查询
-
迭代查询
由于递归查询对于被查询的域名服务器负担太大,通常采用以下模式:从请求主机到本地域名服务器的查询是递归查询,而其余的查询是迭代查询
-
为了提高 DNS 的查询效率,并减轻根域名服务器的负荷和减少因特网上的 DNS 查询报文数量,在域名服务器中广泛地使用了高速缓存。高速缓存用来存放最近查询过的域名以及从何处获得域名映射信息的记录
-
由于域名到 IP 地址的映射关系并不是永久不变,为保持高速缓存中的内容正确,域名服务器应为每项内容设置计时器并删除超过合理时间的项(例如,每个项目只存放两天)
-
不但在本地域名服务器中需要高速缓存,在用户主机中也很需要。许多用户主机在启动时从本地域名服务器下载域名和 IP 地址的全部数据库,维护存放自己最近使用的域名的高速缓存,并且只在从缓存中找不到域名时才向域名服务器查询。同理,主机也需要保持高速缓存中内容的正确性
-
DNS 报文使用运输层的 UDP 协议进行封装,运输层端口号为 53
6. 万维网 WWW
6.1 基本概念
-
万维网 WWW(World Wide Web)并非某种特殊的计算机网络。它是一个大规模的、联机式的信息储藏所,是运行在因特网上的一个分布式应用
-
万维网利用网页之间的超链接将不同网站的网页链接成一张逻辑上的信息网
-
万维网是欧洲粒子物理实验室的 Tim Berners-Lee 最初于1989年
-
1993年2月,第一个图形界面的浏览器 Mosaic
-
1995年著名的 Netscape Navigator 浏览器上市
-
目前比较流行的浏览器如下:
-
浏览器最重要的部分是渲染引擎,也就是浏览器内核。负责对网页内容进行解析和显示
- 不同的浏览器内核对网页内容的解析也有不同,因此同一网页在不同内核的浏览器里的显示效果可能不同
- 网页编写者需要在不同内核的浏览器中测试网页显示效果
万维网的工作方式
-
万维网以客户 - 服务器方式工作
-
用户计算机上的浏览器就是万维网的客户程序,万维网文档所驻留的计算机则运行服务器程序,因此这个计算机也称为万维网服务器
-
客户程序向服务器程序发出请求,服务器程序向客户程序送回客户所要的万维网文档
-
在一个客户程序主窗口上显示出的万维网文档称为页面(page)
-
为了方便地访问在世界范围的文档,万维网使用统一资源定位符URL来指明因特网上任何种类“资源”的位置
-
URL 的一般形式由以下四个部分组成:
6.2 超文本传输协议 HTTP
(1)基本介绍
-
超文本传输协议 HTTP(HyperText Transfer Protocol):在万维网客户程序与万维网服务器程序之间进行交互所使用的协议
-
HTTP 是一个应用层协议,它使用 TCP 连接进行可靠的传送
-
HTTP 定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及万维网服务器怎样把万维网文档传送给浏览器
- 每个万维网网点都有一个服务器进程,它不断地监听 TCP 的端口 80,以便发现是否有浏览器向它发出连接建立请求
- 一旦监听到连接建立请求并建立了 TCP 连接之后,浏览器就向万维网服务器发出浏览某个页面的请求,服务器接着就返回所请求的页面作为响应
- 最后,TCP 连接就被释放了
(2)连接方式
-
HTTP/1.0采用非持续连接方式。在该方式下,每次浏览器要请求一个文件都要与服务器建立 TCP 连接,当收到响应后就立即关闭连接
- 每请求一个文档就要有两倍的 RTT 的开销。若一个网页上有很多引用对象(例如图片等),那么请求每一个对象都需要花费2RTT的时间
- 为了减小时延,浏览器通常会建立多个并行的 TCP 连接同时请求多个对象。但是,这会大量占用万维网服务器的资源,特别是万维网服务器往往要同时服务于大量客户的请求,这会使其负担很重
-
HTTP/1.1采用持续连接方式。在该方式下,万维网服务器在发送响应后仍然保持这条连接,使同一个客户(浏览器)和该服务器可以继续在这条连接上传送后续的 HTTP 请求报文和响应报文。这并不局限于传送同一个页面上引用的对象,而是只要这些文档都在同一个服务器上就行。
- 为了进一步提高效率,HTTP/1.1的持续连接还可以使用流水线方式工作,即浏览器在收到 HTTP 的响应报文之前就能够连续发送多个请求报文。这样的一个接一个的请求报文到达服务器后,服务器就发回一个接一个的响应报文。这样就节省了很多个 RTT 时间,使 TCP 连接中的空闲时间减少,提高了下载文档的效率
(3)HTTP 报文格式
HTTP 是面向文本的,其报文中的每一个字段都是一些ASCII码串,并且每个字段的长度都是不确定的
HTTP请求报文格式
举例:
HTTP响应报文格式
举例:
(4)Cookie
-
早期的万维网应用非常简单,仅仅是用户查看存放在不同服务器上的各种静态的文档。因此 HTTP 被设计为一种无状态的协议。这样可以简化服务器的设计
-
现在,用户可以通过万维网实现各种复杂的应用,如网上购物、电子商务等。这些应用往往需要万维网服务器能够识别用户
-
Cookie 提供了一种机制使得万维网服务器能够“记住”用户,而无需用户主动提供用户标识信息。也就是说,Cookie 是一种对无状态的 HTTP 进行状态化的技术
(5)万维网缓存与代理服务器
- 在万维网中还可以使用缓存机制以提高万维网的效率
- 万维网缓存又称为 Web 缓存(Web Cache),可位于客户机,也可位于中间系统上,位于中间系统上的 Web 缓存又称为代理服务器(Proxy Server)
- Web 缓存把最近的一些请求和响应暂存在本地磁盘中。当新请求到达时,若发现这个请求与暂时存放的请求相同,就返回暂存的响应,而不需要按 URL 的地址再次去因特网访问该资源
举例:
如果该请求有缓存
如果该请求没有缓存
若 WEb 缓存的命中率比较高,则会大大减少该链路上的通信量,因而减少了访问因特网的时延
假设原始服务器的文档被更改,这样代理服务器的文档就不是最新的,所以原始服务器通常会为每个响应的对象设定一个修改时间字段和一个有效日期字段
若未过期
若过期并且代理服务器的文档和原始服务器的文档一致,原始服务器则给代理服务器发送不包含实体主体的响应
若过期并且代理服务器的文档和原始服务器的文档不一致,原始服务器则给代理服务器发送封装有该文档的响应报文