Tomcat是什么?

Tomcat是开源的 Java Web 应用服务器,实现了 Java EE 的部分技术规范,比如 Java servlet、Java Server Page、JSTL、Java Websocket。Java EE 是 Sun 公 司为企业级应用推出的标准平台,定义了一系列用于企业级开发的技术规范。除了上述的之外,还有 EJB、Java Mail、JPA、JTA、JMS 等,而这些都依赖具体容器的实现。

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(1)

上图对比了 Java EE 容器的实现情况,Tomcat 和 Jetty 都只提供了 Java Web 容器必需的 Servlet 和 JSP 规范,开发者要想实现其他的功能,需要自己依赖其他开源实现。

Glassfish 是由 sun 公司推出,Java EE 最新规范出来之后,首先会在 Glassfish 上进行实现,所以是研究 Java EE 最新技术的首选。

最常见的情况是使用 Tomcat 作为 Java Web 服务器,使用 Spring 提供的开箱即用的强大功能,并依赖其他开源库来完成负责的业务功能实现。

Servlet容器

Tomcat 组成

如下图所示,主要有 Container 和 Connector 以及相关组件构成。

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(2)

Container组成

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(3)

生命周期管理

Tomcat 为了方便管理组件和容器的生命周期,定义了从创建、启动、到停止、销毁共 12 种状态

tomcat 生命周期管理了内部状态变化的规则控制,组件和容器只需实现相应的生命周期方法,即可完成各生命周期内的操作(initInternal、startInternal、stopInternal、 destroyInternal);

比如执行初始化操作时,会判断当前状态是否 New,如果不是则抛出生命周期异常;是的话则设置当前状态为 Initializing,并执行 initInternal 方法,由子类实现,方法执行成功则设置当前状态为 Initialized,执行失败则设置为 Failed 状态;

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(4)

Tomcat 的生命周期管理引入了事件机制,在组件或容器的生命周期状态发生变化时会通知事件监听器,监听器通过判断事件的类型来进行相应的操作。事件监听器的添加可以在 server.xml 文件中进行配置;

Tomcat 各类容器的配置过程是通过添加 listener 的方式来进行的,从而达到配置逻辑与容器的解耦。如 Engineconfig、HostConfig、ContextConfig。

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(5)

Tomcat 的启动过程

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(6)

启动从 Tomcat 提供的 start.sh 脚本开始,shell 脚本会调用 Bootstrap 的 main 方法,实际调用了 Catalina 相应的 load、start 方法。

load 方法会通过 Digester 进行 config/server.xml 的解析,在解析的过程中会根据 xml 中的关系 和配置信息来创建容器,并设置相关的属性。

接着 Catalina 会调用 StandardServer 的 init 和 start 方法进行容器的初始化和启动。

按照 xml 的配置关系,server 的子元素是 service,service 的子元素是顶层容器 Engine,每层容器都持有自己的子容器,而这些元素都实现了生命周期管理的各个方法,因此就很容易的完成整个容器的启动、关闭等生命周期的管理。

StandardServer 完成 init 和 start 方法调用后,会一直监听来自 8005 端口(可配置)

如果接收 到 shutdown 命令,则会退出循环监听,执行后续的 stop 和 destroy 方法,完成 Tomcat 容器的关闭。

同时也会调用 JVM 的 Runtime.getRuntime()﴿.addShutdownHook 方法,在虚拟机意外退出的时候来关闭容器。

所有容器都是继承自 ContainerBase,基类中封装了容器中的重复工作,负责启动容器相关的组件 Loader、Logger、Manager、Cluster、Pipeline,启动子容器(线程池并发启动子容器,通过线程池 submit 多个线程,调用后返回 Future 对象,线程内部启动子容器,接着调用 Future 对象 的 get 方法来等待执行结果)。

List<future> results = new ArrayList<future>();

for (int i = 0; i < children.length; i ) {

results.add(startStopExecutor.submit(new StartChild(children[i])));

}

boolean fail = false;

for (Futureresult :results) {

try {

result.get();

} catch (Exception e) {

log.error(sm.getString("containerBase.threadedStartFailed"), e);

fail = true;

}

}

Web 应用的部署方式

注:catalina.home:安装目录;catalina.base:工作目录;默认值 user.dir

HostConfig 监听了 StandardHost 容器的事件,在 start 方法中解析上述配置文件:

注:

ContextConfig 解析 context.xml 顺序:

ContextConfig 解析 web.xml 顺序:

注:

Servlet 生命周期

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(7)

Servlet 是用 Java 编写的服务器端程序,其主要功能在于交互式地浏览和修改数据,生成动态 Web 内容。

  1. 请求到达 server 端,server 根据 url 映射到相应的 Servlet
  2. 判断 Servlet 实例是否存在,不存在则加载和实例化 Servlet 并调用 init 方法
  3. Server 分别创建 Request 和 Response 对象,调用 Servlet 实例的 service 方法(service 方法 内部会根据 http 请求方法类型调用相应的 doXXX 方法)
  4. doXXX 方法内为业务逻辑实现,从 Request 对象获取请求参数,处理完毕之后将结果通过 response 对象返回给调用方
  5. 当 Server 不再需要 Servlet 时(一般当 Server 关闭时),Server 调用 Servlet 的 destroy() 方 法。

load on startup

当值为 0 或者大于 0 时,表示容器在应用启动时就加载这个 servlet; 当是一个负数时或者没有指定时,则指示容器在该 servlet 被选择时才加载; 正数的值越小,启动该 servlet 的优先级越高;

single thread model

每次访问 servlet,新建 servlet 实体对象,但并不能保证线程安全,同时 tomcat 会限制 servlet 的实例数目

最佳实践:不要使用该模型,servlet 中不要有全局变量

请求处理过程

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(8)

  1. 根据 server.xml 配置的指定的 connector 以及端口监听 http、或者 ajp 请求
  2. 请求到来时建立连接,解析请求参数,创建 Request 和 Response 对象,调用顶层容器 pipeline 的 invoke 方法
  3. 容器之间层层调用,最终调用业务 servlet 的 service 方法
  4. Connector 将 response 流中的数据写到 socket 中

Pipeline 与 Valve

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(9)

Pipeline 可以理解为现实中的管道,Valve 为管道中的阀门,Request 和 Response 对象在管道中 经过各个阀门的处理和控制。

每个容器的管道中都有一个必不可少的 basic valve,其他的都是可选的,basic valve 在管道中最 后调用,同时负责调用子容器的第一个 valve。

Valve 中主要的三个方法:setNext、getNext、invoke;valve 之间的关系是单向链式结构,本身 invoke 方法中会调用下一个 valve 的 invoke 方法。

各层容器对应的 basic valve 分别是 StandardEngineValve、StandardHostValve、 StandardContextValve、StandardWrapperValve。

JSP引擎

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(10)

JSP 生命周期

JSP元素

代码片段:<%>

JSP声明:<%! ...="">

JSP表达式:<%=>

JSP注释:<%-->

JSP指令:<%@ directive="" attribute="“value”">

JSP行为:

HTML元素:html/head/body/div/p/…

JSP隐式对象:request、response、out、session、application、config、pageContext、page、Exception

JSP 元素说明

Jsp 解析过程

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(11)

Connector

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(12)

Http:HTTP 是超文本传输协议,是客户端浏览器或其他程序与 Web 服务器之间的应用层通信协 议

AJP:Apache JServ 协议(AJP)是一种二进制协议,专门代理从 Web 服务器到位于后端的应用 程序服务器的入站请求

阻塞 IO

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(13)

非阻塞 IO

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(14)

IO多路复用

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(15)

阻塞与非阻塞的区别在于进行读操作和写操作的系统调用时,如果此时内核态没有数据可读或者没有缓冲空间可写时,是否阻塞。

IO多路复用的好处在于可同时监听多个socket的可读和可写事件,这样就能使得应用可以同时监听多个socket,释放了应用线程资源。

Tomcat各类Connector对比

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(16)

Connector的实现模式有三种,分别是BIO、NIO、APR,可以在server.xml中指定。

Apache Portable Runtime是一个高度可移植的库,它是Apache HTTP Server 2.x的核心。

APR具有许多用途,包括访问高级IO功能(如sendfile,epoll和OpenSSL),操作系统级功能(随机数生成,系统状态等)和本地进程处理(共享内存,NT管道和Unix套接字)

表格中字段含义说明:

NIO处理相关类

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(17)

Acceptor线程负责接收连接,调用accept方法阻塞接收建立的连接,并对socket进行封装成PollerEvent,指定注册的事件为op_read,并放入到EventQueue队列中,PollerEvent的run方法逻辑的是将Selector注册到socket的指定事件;

Poller线程从EventQueue获取PollerEvent,并执行PollerEvent的run方法,调用Selector的select方法,如果有可读的Socket则创建Http11NioProcessor,放入到线程池中执行

CoyoteAdapter是Connector到Container的适配器,Http11NioProcessor调用其提供的service方法,内部创建Request和Response对象,并调用最顶层容器的Pipeline中的第一个Valve的invoke方法

Mapper主要处理http url 到servlet的映射规则的解析,对外提供map方法

NIO Connector主要参数

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(18)

Comet

Comet是一种用于web的推送技术,能使服务器实时地将更新的信息传送到客户端,而无须客户端发出请求

在WebSocket出来之前,如果不适用comet,只能通过浏览器端轮询Server来模拟实现服务器端推送。

Comet支持servlet异步处理IO,当连接上数据可读时触发事件,并异步写数据(阻塞)

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(19)

Tomcat要实现Comet,只需继承HttpServlet同时,实现CometProcessor接口

Note:

异步Servlet

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(20)

传统流程:

深入理解tomcat源码(深入揭秘Tomcat服务器底层原理)(21)

异步处理流程:

Servlet 线程将请求转交给一个异步线程来执行业务处理,线程本身返回至容器,此时 Servlet 还没有生成响应数据,异步线程处理完业务以后,可以直接生成响应数据(异步线程拥有 ServletRequest 和 ServletResponse 对象的引用)

为什么web应用中支持异步?

推出异步,主要是针对那些比较耗时的请求:比如一次缓慢的数据库查询,一次外部REST API调用, 或者是其他一些I/O密集型操作。这种耗时的请求会很快的耗光Servlet容器的线程池,继而影响可扩展性。

Note:从客户端的角度来看,request仍然像任何其他的HTTP的request-response交互一样,只是耗费了更长的时间而已

异步事件监听

Note :

onError/ onTimeout触发后,会紧接着回调onComplete

onComplete 执行后,就不可再操作request和response

,