Tomcat是如何运行的?整体架构又是怎样的?

在许多的高端开发的岗位中都会或多或少有要求面试人员要研究过一些常用中间件源码 。这是因为一切的秘密都是藏在源码中,阅读源码能够让我们对框架或者中间件的理解更加深刻,而我们也能够在源码的研究中获得其中一些优秀的设计方式 。而我们的中间件和源码那么多,我们该从何入手呢?其实大部分的中间件或者框架都有一些共性的部分,例如网络编程、多线程、反射和类加载等技术 。所以深入研究透了一两个中间件的话,那么再回过头来看其它的中间件,那么就会很容易理解它里面所用的技术以及原理 。而作为一个老牌的WEB端框架Tomcat,无论是其整体的架构设计,还是其内在的一些技术灵活应用,都值得我们一看 。
在学习框架的时候,我一般都是对这个框架有一个整体的认识 。知道它整体是如何运行的,然后再深入其中某部分进行研究,这样会事半功倍 。
整体架构我们想要了解一个框架,首先要了解它是干什么的,Tomcat我们都知道,是用于处理连接过来的Socket请求的 。那么Tomcat就会有两个功能:

  • 对外处理连接,将收到的字节流转化为自己想要的Request和Response对象
  • 对内处理Servlet,将对应的Request请求分发到相应的Servlet中
那么我们整体的骨架就出来了,Tomcat其实就分为两大部分,一部分是连接器(Connnector)处理对外连接和容器(Container)管理对内的Servelet 。大体的关系图如下
Tomcat是如何运行的?整体架构又是怎样的?

文章插图
 
最外层的大框就是代表一个Tomcat服务,一个Tomcat服务可以对应多个Service 。每个Service都有连接器和容器 。这些对应的关系我们也可以打开在Tomcat目录配置文件中server.xml中看出来 。
<Server port="8006" shutdown="SHUTDOWN"><Service name="Catalina"><Connector port="8080" protocol="HTTP/1.1"connectionTimeout="20000"redirectPort="8443" /><Connector port="8010" protocol="AJP/1.3" redirectPort="8443" /><Engine name="Catalina" defaultHost="localhost"><Realm className="org.Apache.catalina.realm.LockOutRealm"><Realm className="org.apache.catalina.realm.UserDatabaseRealm"resourceName="UserDatabase"/></Realm><Host name="localhost"AppBase="webapps"</Host></Engine></Service></Server>这里我将其中配置文件中删除了一些内容精简了一下,这里我们可以看到连接器其实就是Connector,一个Service中可以在多个连接器,容器其实对应的就是Engine 。
Tomcat的整体架构简单来说就是这样的对应关系 。接下来我们简单的介绍连接器的整体架构和容器的整体架构 。
连接器我们可以看到上图中连接器传给容器的是ServletRequest对象,而容器传给连接器的是ServletResponse对象,这些在网络传输过程中是肯定不行的,因为网络传输中传送的字节流 。所以连接器的功能需求我们大概能总结出来以下几点 。
  • Socket连接
  • 读取请求网络中的字节流
  • 根据相应的协议(Http/AJP)解析字节流,生成统一的Tomcat Requestt对象
  • 将Tomcat Reques传给容器
  • 容器返回Tomcat Response对象
  • 将Tomcat Response对象转换为字节流
  • 将字节流返回给客户端
其实上面的细分都能总结为以下的三点
  • 网络通信
  • 应用层协议的解析
  • Tomcat的Request/Response与ServletRequest/ServletResponse对象的转化
而在Tomcat中它也用了三个类来实现上面的三个功能,分别对应如下
  • EndPoint
  • Processor
  • Adapter
用图表示他们的关系的话就是这样
Tomcat是如何运行的?整体架构又是怎样的?

文章插图
 
容器容器,顾名思义就是装东西的器具,那么这个Tomcat容器是装什么的呢?其实主要的就是装了Servlet的 。那么容器是如何设计的呢?Tomcat的容器设计其实是用了组合设计模式 。其实从Server.xml中我们也能看到其关系了 。
<Engine name="Catalina" defaultHost="localhost"><Host name="localhost"appBase="webapps"unpackWARs="true" autoDeploy="true"></Host></Engine>在这里面我们只能看到容器中的两个模块,一个是顶层模块Engine,另一个是Host,其实还有两个模块,一个是Context对应的是我们webapp里面的每个应用文件夹,每个文件夹就是对应一个Context,还有一个模块Wrapper对应的是我们Context中的所有servlet,Wrapper管理了访问关系与具体的Servlet的对应 。图表示就是下面这样 。


推荐阅读