作者 | Cooper Song
责编 | 郭芮
DNS全称Domain Name System,也就是域名系统。用户要访问一个网站,需要知道它的IP地址。而DNS系统主要提供的服务就是主机名与IP地址的映射,即输入一个域名,比如www.baidu.com,可以得到www.baidu.com的服务器IP地址39.156.66.18。
之所以需要域名系统,是IP地址太难记了,这就好比人与人之间使用姓名或乳名更好记,而不是认识一个人就背过人家的身份证号。互联网的用户也是人,所以网上冲浪者们也更容易也更喜欢记住一些网站的域名,比如百度www.baidu.com、淘宝www.taobao.com、京东www.jd.com;而路由器则显然更容易识别IP地址。因此从主机名到IP地址这个映射就显得尤为重要。
在我看来,这种服务的提供更像是一种数据库查询:
我好像没猜错,DNS就是一个由分层的DNS服务器(通常是运行BIND软件的UNIX机器)实现的分布式数据库,也是一个使得主机能够查询分布式数据库的应用层协议(运行在UDP之上,使用53号端口)。
虽说是数据库,但不是一个普通的数据库,而是一个分布式数据库,分布式数据库由大量的DNS服务器实现。当然,DNS也可以只用一个服务器来实现,这样做的好处是简单,但也有大大的坏处,特别是互联网用户越来越多,一个DNS服务器是远远不够的,会出现很多问题,主要问题如下:
单点故障。如果唯一的一台DNS服务器崩了,整个因特网都不能使用DNS服务了,所有用户都不能通过www.baidu.com这样的域名访问网站了,整个因特网随之瘫痪。
通信容量。唯一的一台DNS服务器不得不处理所有的DNS查询,必须为所有请求访问的主机产生HTTP请求报文。
近距离的集中式数据库。如果唯一的一台DNS服务器在美国纽约,那么中国用户、澳大利亚用户的查询都得先传播到地球的另一边,在传播过程中还有可能遇到网络拥塞,会导致严重的时延。
维护。唯一的一台DNS服务器需要为所有因特网的主机保留记录,数据规模是非常庞大的,随着联网的主机数增多,还要不断地更新(插入insert、删除delete、修改update)。
正是由于上面那些问题,网络专家们提出了分布式、分层次数据库这一解决方案。
DNS服务器主要分为三种,一种是顶端的根DNS服务器,一种是位于中间的顶级域(Top-Level Domain,简称TLD)DNS服务器,一种是位于下层的权威DNS服务器。
根服务器全世界共有400多个,它提供用户访问域名所属的顶级域服务器的IP地址。
顶级域服务器管理着一类网站权威服务器的IP地址,后缀名为.com、.gov、.edu、.org的URL分属于comDNS服务器、govDNS服务器、eduDNS服务器、orgDNS服务器。此外,每个国家都有自己的顶级域服务器,比如.cn属于中国、.jp属于日本、.uk属于英国、.fr属于法国、.th属于泰国。
在因特网上具有公共可访问主机的每个组织机构必须提供公共可访问的DNS记录,这些记录将这些主机的名字映射为IP地址,一个组织机构的权威DNS服务器会收藏这些DNS记录,或者让这些记录存储在服务提供商的一个权威DNS服务器中。一般大学和大厂都会实现和维护自己的权威DNS服务器,比如麻省理工自己实现的mit.eduDNS服务器、亚马逊自己实现的amazon.comDNS服务器、百度自己实现的baidu.comDNS服务器,baidu.com就会提供百度网址大全site.baidu.com的IP地址。
用户主机向根DNS服务器发出查询请求,根服务器返回给用户主机相应的顶级域DNS服务器的IP地址,用户主机再根据顶级域DNS服务器的IP地址向相应的顶级域服务器发出查询请求,顶级域DNS服务器返回给主机相应的权威DNS服务器的IP地址,用户主机再根据权威DNS服务器的IP地址向相应的权威DNS服务器发出查询请求,该权威DNS服务器最终向用户主机发送查询主机名的IP地址发送给用户主机。
举个例子,我的电脑要访问百度网址大全site.baidu.com,向根DNS服务器发送查询请求,根DNS服务器识别到后缀.com,返回给用户主机comDNS服务器的IP地址,用户主机根据comDNS服务器的IP地址向comDNS服务器发送查询请求,comDNS服务器返回给用户主机百度权威DNS服务器baidu.com的IP地址,用户再向百度的权威服务器baidu.comDNS服务器发送查询请求,百度的权威服务器当然熟悉自家网站,就把百度网址大全site.baidu.com的IP地址返回给了用户主机。
更多的,用户主机请求域名对应的IP地址会借助一个本地DNS服务器,这个DNS服务器一般是一个小区或者一个机构的ISP(Internet Service Provider,可以理解为运行商)提供的,本地DNS服务器获取到最终的IP地址后,再返回给用户主机。访问示意图如下:
圆圈表达了请求的时序关系。根DNS服务器和顶级域服务器更像是中间的领路人,这两种服务器指引着主机找到最终要访问的IP地址。
DNS系统是设有缓存机制的,如果某个DNS服务器收到了一条主机名到IP地址的映射记录,就把这个记录存到本地缓存里,下次收到某域名的请求时,如果该域名在本DNS服务器缓存中,就可以直接返回该域名的IP地址。这将大大减少时延,如果没有缓存机制,上图中的8个步骤缺一不可;而有了缓存机制,用户主机甚至都可以直接从本地DNS服务器那里得到自己想要的IP地址,示意图如下:
参考文献:
[1]James F Kurose,Keith W Ross.Computer Networking A Top-Down Approach Seventh Edition[M].Beijing:China machine Press,2018:83.
作者简介:Cooper Song,大学计算机专业在校生,本科在读,学生开发者。