前言

大家都是做开发的,都有GitHub的账号,在日常使用中肯定会遇到这种情况,在不修改任何配置的情况下,有时可以正常访问GitHub,有时又直接未响应,来一起捋捋到底是为啥。

GitHub访问的千层套路

以我家里的电脑为例,在不修改任何配置,不启用什么代理工具的情况下,访问GitHub会得到以下结果:

配置github访问速度(一文入门DNS从访问GitHub开始)(1)

虽然很戳心,但好歹能展示一部分。

从网上搜了一堆乱七八糟的攻略,知道了可以通过修改电脑的Hosts文件达到正常访问的能力,于是胡搜了一通,

步骤:百度经验

效果如下:

配置github访问速度(一文入门DNS从访问GitHub开始)(2)

访问效果依然很感人,最近活动数据不显示,整个界面加载都快接近2分钟了,有什么办法没有咧~

站长工具 PING PING PING

都是搞开发的,都会用F12看看网络或者资源请求的地址是什么,以上面耗时最慢的地址为例,域名为:github.githubassets.com

打开站长工具的PING功能,地址为:http://ping.chinaz.com/github.githubassets.com

结果如下:

配置github访问速度(一文入门DNS从访问GitHub开始)(3)

我发现 185.199.108.154 这个IP地址速度快的一批,于是立马更换 Hosts中该域名对应的IP地址

再次访问,效果如下:

配置github访问速度(一文入门DNS从访问GitHub开始)(4)

那句话怎么说的来着?如什么什么般丝滑,我感觉这就非常丝滑~

GitHub项目定时发布最新Hosts

当然了,如果每次访问都得折腾一次,那滋味,简直不要太难受,所以网上已经有人开源了相关的项目,会定时发布最新的 GitHub IP地址,链接:https://github.com/521xueweihan/GitHub520

本文撰写时的Hosts

# github 185.199.108.154 github.githubassets.com 199.232.68.133 camo.githubusercontent.com 52.168.24.190 github.map.fastly.net 199.232.69.194 github.global.ssl.fastly.net 140.82.112.4 github.com 140.82.112.5 api.github.com 199.232.68.133 raw.githubusercontent.com 199.232.68.133 user-images.githubusercontent.com 199.232.68.133 favicons.githubusercontent.com 199.232.68.133 avatars5.githubusercontent.com 199.232.68.133 avatars4.githubusercontent.com 199.232.68.133 avatars3.githubusercontent.com 199.232.68.133 avatars2.githubusercontent.com 199.232.68.133 avatars1.githubusercontent.com 199.232.68.133 avatars0.githubusercontent.com 复制代码

该项目会自动发布在指定的地址上,结合软件使用,可以完全自动化,无需持续更新

当然也可以自行手动更改

为什么改了Hosts就能访问GitHub

平常都是百度 谷歌,今天非要探究一下原理!咱们一步一步来,首先大家都需要明确一点,在网络的世界中 域名 只是为了便于记忆和识别而存在的一个唯一地址,真正工作的仍然是 IP

Hosts文件是干吗的

简单来说,Hosts文件是存储本机网址域名与其对应的IP地址的一个文件,在网络请求阶段发挥作用

为什么改了Hosts就能生效

这就涉及到了域名解析,因为Hosts文件存放的就是 域名 和 IP 的对应关系,因此它可以在域名解析阶段发挥作用,为什么呢?因为在域名解析的流程中 本机Hosts 解析处于顺序二

即:浏览器解析 -》本机解析 -》XXXX(后面的稍后再提)

所以有时候我们白嫖软件,都会改一下 Hosts,因为需要把它在线验证的域名指向错误的地址去,另外可能存在一定的浏览器缓存或者本机缓存,可以通过重开浏览器或者 PING 域名来检查更改是否生效。

DNS解析到底是什么玩意?

上文中多次提到解析,其实说的就是 DNS解析

同时上文也提到过,在网络世界中真正发挥作用的是 IP,而一般情况下我们访问的都是 域名,为什么能实现这种效果,就是因为域名与IP地址的对应关系存储在一个叫做 DNS(Domain Name System) 的系统里。DNS是一个全球化的分布式数据库,它所提供的服务就是将域名转换为互联网IP地址。

DNS解析的全部流程

网上的关于流程的图很多,我从中借鉴了一副,如下所示:

配置github访问速度(一文入门DNS从访问GitHub开始)(5)

  1. 浏览器缓存:一次请求会首先通过浏览器缓存信息寻找域名映射的IP地址,这也是为什么有时候我们改了本机hosts,需要关闭再打开浏览器才能正常使用,如果找到则返回,没找到则继续到下一级
  2. 本机系统缓存:即上文中提到的,通过 hosts 文件来映射域名和IP,在上古时期有很多垃圾软件会悄咪咪的修改系统的 hosts文件,达到 DNS劫持 的目的,即把淘宝域名指向另一个 IP,然后部署一个高仿的淘宝商城,静静等你输入账号,密码,然后凉凉...
  3. 本地域名解析服务系统:本地域名系统LDNS一般都是本地区的域名服务器。离你的位置都比较近,Windows系统使用命令ipconfig 就可以查看,在Linux和Mac系统下,直接使用命令 cat /etc/resolv.conf 来查看LDNS服务地址。 LDNS一般都缓存了大部分的域名解析的结果,大部分的解析工作到这里就差不多已经结束了 以下即是所谓的 递归解析
  4. 根域名解析:本地域名解析服务系统无法解析时,会向 13根 发起域名解析请求 说明: 所谓的 13根,指的是根域名服务器,是架构因特网所必须的基础设施。根服务器主要用来管理互联网的主目录,由于DNS解析中采用的是UDP协议,仅能传递512字节的有效报文,因此只能构建出A-M 13个根服务器,而真正工作运行肯定不止13台服务器,而是包含很多服务器镜像的
  5. 根域名解析服务器返回 gTLD (Generic top-level domain) 给本地解析服务器,即该域名所属的顶级域及其所在的服务器,顶级域名即如:.com .cn等等
  6. 本地解析服务器已知顶级域名服务器地址后,发起解析请求
  7. 顶级域名解析服务器返回 权限域名服务器 信息给本地解析服务器,权限域名服务器 即如:taobao.com
  8. 本地解析服务器已知权限域名服务器地址后,发起解析请求
  9. 权限域名服务器返回域名对应的IP地址给本地解析服务器
  10. 本地解析服务器缓存相关信息,并返回给用户

是不是有点绕?咱们来整个图吧,递归解析 如下所示:

配置github访问速度(一文入门DNS从访问GitHub开始)(6)

再问一遍为什么改Hosts就可以访问GitHub

了解了上文之后,对于这个问题就更好回答了,因为GitHub毕竟为外国的网站,咱们访问时有一层 DNS污染,即把对应的域名指向了不可达的IP上,或者禁止访问的IP上,因此很多时候无法使用

修改Hosts文件后即避免了DNS污染,直达目标IP,即可正常访问了,当然了,这种方法是全部通用吗?

答案:肯定不是,因为刚才也提到了,网关层是可以控制某些IP禁止访问的

整一个工具来验证一下猜想,顺便看看我们的整个请求流程:

软件名:BestTrace

配置github访问速度(一文入门DNS从访问GitHub开始)(7)

我请求的域名是 github.githubassets.com,最终请求接收方IP和我Hosts配置的IP一致,那我换一个 facebook.com

配置github访问速度(一文入门DNS从访问GitHub开始)(8)

可以看到,当请求到达 221.183.46.249 这个IP时,整个请求就被拦截下来了,因此这并不是万能的办法

除了访问GitHub,还有什么时候可能用到呢?

比如下载 IDEA插件时,如果发现老是刷新不出来插件库,或者下载失败,就可以通过PING工具去配置最佳IP,方便下载~

DNS除了解析还能做什么智能DNS

网络请求交由域名解析服务器来处理,分配到最佳的服务器IP上

例如:请求的源头是电信还是联通等,如果是电信则将解析的IP分流到电信对应的IP上,或者返回距离最近的服务器IP地址

反向代理水平扩展

典型的互联网架构中,可以通过增加web-server来扩充web层的性能,但反向代理nginx仍是整个系统的唯一入口

如果系统吞吐超过nginx的性能极限,那么将难以扩容,此时就需要dns-server来配合水平扩展。

即DNS解析服务器有序的把域名解析到不同的网关层,每次DNS解析请求,轮询返回不同的ip,这样就能实现nginx的水平扩展,这个方法叫 “DNS轮询

作者:Kerwin_链接:https://juejin.im/post/5f18683af265da22f84d7602

,