首先,你需要了解三个基础网络知识。
1 DNS
1.1 DNS简单说就是你给它一个域名,它解析一个IP给你。但是实际上情况不是这么简单的。
客户端发起一个DNS查询请求,提交一个完整主机名(例如记录。
1.2如果DNS服务器上没有查询到相关记录,则会询问上一层的DNS服务器。如果上一层服务器解析出结果,则它在返回给用户结果时,顺便自己缓存一份。缓存的时间由域名的TTL决定。
1.3每个域名首先要注册在跟DNS上NS服务器名称。当一个区域中最顶层的DNS也没有用户查询的主机名记录时,则会首先向INTERNET跟DNS获取这个NS服务器名称,并尝试向这个NS服务器发起查询请求。NS服务器必须响应并响应这个查询。如果DNS跟服务器无法被连接到、NS无法被找到、无法被连接到或者NS服务器无法解析,则本主机名最终解析失败。
1.4 DNS如果返回多条A记录时,会生成一个有序集合。这个排序根据历史查询散列,并根据访问者的IP所在区域优化。客户端拿到的集合中的第一条IP通常为一个优化后的地址,但其他地址依旧可作为备选使用。
1.5 DNS服务器通常不归主机管理商所有,并且由于需要快速响应,在查询的时候是无法判断主机状态和负载的。但一些较大的机构,会自己拥有一个重新设计的DNS服务器,考虑到这些信息。而对于这种情况,外部公网的DNS只能解析出一个CNAME,并交由这个DNS来进行后续解析(这个DNS被注册为这个CNAME对应的NS)。这种设计下的DNS通常被认为是NLB(网络负载均衡)设计的一部份。
1.6由于1.2提及的代理查询以及TTL的机制,DNS其实并不能良好的实现服务器的轮询负载均衡,但是可以实现区域优化查询,即对某个特定区域尽量返回其区域内的IP结果。
2 HTTP头
在发起上并行存在多个不同的主机地址。
3 NLB
通常的NLB有三种解决办法。
3.1本地DNS加速,如1.5所述的方法。
3.2 CDN(内容分发网络)。CDN可以被看做是一个独立的技术。
3.3虚拟IP地址。通常情况下,一个IP不应该被设置到超过一个设备上,因为超过这个设置后,上层的路由器就不知道如何转发这个包了。但是,如果路由器经过了设置(例如BGP协议或者专门设计的路由软件等),是可以在多个设备下共享同一个IP的。这种共享既可以是物理的(多个设备同时使用一个IP,由上层路由进行分支选择或者广播、组播数据包),或者是轮询的(多个设备轮流使用一个IP,同时只有一个设备使用这个IP,而这个IP可以在多个设备间高速切换)。如果某个应用必须基于IP地址(例如DNS服务本身),只能使用这种方式来处理。
那么回头看你三个问题。
Q1返回多个A纪录后,客户端会按照集合的顺序依次尝试访问。这些数据在NS服务器上是单一存在的,但是会被多层DNS缓存。
Q2 HTTP头段已经讲述。
Q3希望你看过NLB段后能理解。