在之前的一篇文章中,聊过从创建进程到进入main函数,发生了什么?

但当时只是针对C/C 这样的native语言,从操作系统(Linux & Windows)的层面去探讨了程序的启动过程,而对Java、Python这样的基于虚拟机/解释器的语言并未提及。

今天,咱们就一起来探索下在Java语言中,你写的main方法又是怎么被执行到的?

main函数可以有几个参数(没想到进入main函数前)(1)

对于Java而言,其底层是Java虚拟机在跑着,也就是JVM,这篇文章如无特殊说明,默认以Hotspot为研究对象。

先来回顾一下那篇文章,对于C/C 程序而言,从创建进程到进入main函数,主要就是经历了四个阶段:

进程 & 主线程创建阶段

主线程启动执行并进行进程级初始化操作(如加载系统动态链接库)

主线程进入可执行文件的入口(OEP)并进行C/C 运行时库初始化

从C/C 运行时库调入main函数

你知道的,Java的虚拟机JVM主要是C 编写的,所以JVM本质上也算是一个C 程序。

因此,上面的四个阶段,对于JVM而言,同样适用。

只不过呢,对于C/C 程序而言,到这里就已经进入main函数了,话题就可以结束了,而对于Java程序,执行到JVM的main,一切才刚刚开始。

JVM的main

故事,要从JVM的main函数开始讲起···

你应该知道的,不管你是普通Java程序,还是用的Spring或者其他什么框架,最终的程序都是在一个Java进程中运行的,这个进程的可执行文件就是一个exe(windows上)或者elf(linux上)。

咱们就从这个可执行文件入手,以Linux系统上的Java8版本为例,用反汇编神器IDA打开可以看到,这个可执行文件的入口:

main函数可以有几个参数(没想到进入main函数前)(2)

和咱们在上一篇分析的流程符合,进入这个程序启动入口后,会经过一系列的调用,最后来到main函数:

main函数可以有几个参数(没想到进入main函数前)(3)

反汇编看着好头大,好在,HotSpot虚拟机有开源版本,咱们可以去OpenJDK中找来这个main函数的源码瞧瞧。

不同版本差异还是挺大,这里以Java8为例:

代码路径:https://github.com/openjdk/jdk/blob/jdk8-b20/jdk/src/share/bin/main.c

main函数可以有几个参数(没想到进入main函数前)(4)

在这个代码中除了main函数,还可以看到如果定义了JAVAW宏定义,则入口从main变成了WinMain函数,做过Windows应用程序开发的朋友这个时候应该露出了满意的微笑。

如果定义了JAVAW,则是一个Win32 GUI的程序,当然在Linux上是肯定没有这个宏定义的,不过这不是本文的主题。

可以看到main函数只是一个包装,直接就进入了JLI_Launch中。

这个函数位于同目录下的隔壁java.c文件中,是JVM非常重要的初始化函数,主要完成了下面几件事情:

参数解析,环境配置

检查Java运行环境

加载JVM核心动态库libjvm.so

创建并初始化Java虚拟机对象

这些过程都不是我们这篇文章探究的目标,咱们继续把目光聚焦在Java中的main函数是怎么得到调用的。

在JLI_Launch的结尾,调用了ContinueInNewThread,从这个函数的名字我们也能窥探它的作用。

main函数可以有几个参数(没想到进入main函数前)(5)

这个函数还是一层封装,内部调用了真正干活的函数ContinueInNewThread0

main函数可以有几个参数(没想到进入main函数前)(6)

接下来就是创建线程来继续后面的事情了,不过创建线程涉及到操作系统API的调用,所以这个函数在不同版本的系统中都有对应的实现。来看传给它的第一个参数,这是新线程启动后将要执行的入口函数:JavaMain

JavaMain

这个函数的名字就有点意思了,看起来,快要进入Java的地界儿了,加油继续看下去:

intJNICALLJavaMain(void*_args){ //... //寻找启动类 mainClass=LoadMainClass(env,mode,what); //... //寻找启动类中的main函数 mainID=(*env)->GetStaticMethodID(env,mainClass,"main", "([Ljava/lang/String;)V"); //... //调用它 (*env)->CallStaticVoidMethod(env,mainClass,mainID,mainArgs); //... }

JavaMain中的细节挺多的,咱们抽出需要关心的,要调用咱们写的main方法就像把大象关进冰箱一共三步:

找到启动类

找到启动类中的main方法

调用它

具体寻找的过程这里就不展开了,有些繁琐,但你应该能猜到,Java代码编译后都是以class文件的形式存储的,所以这个寻找的背后少不了要涉及到class类加载等一系列的工作。

总之,一顿操作猛如虎,嘿,JVM把咱们写的main方法找到了!接下来就是调用它了。

进入Java世界

调用main方法的是CallStaticVoidMethod,从名字可以看到,这是在调用一个静态的、返回值为空的方法。注意了,C 的地盘快到边境了,咱们即将通过它来到美丽的Java新世界!

这个函数内部后面会来到:

JavaCalls::call(result,method,&java_args,CHECK);

最终,会创建Java方法栈帧,准备好模板解释器,随后转向解释器入口开始执行字节码,正式进入Java世界!

进入Java世界第一站,就是前面找到的启动类的main方法,在这里开启程序在Java世界的征程。

总结

现在可以来回答这个问题了:从创建进程到Java的main方法,经历了什么?

咱们来划分三个大的阶段:

第一阶段:操作系统层面进程和主线程的创建

第二阶段:主线程启动执行并进入到Java可执行文件(exe/elf)中的main函数(C 层面)

第三阶段:创建JVM,寻找启动类中的main方法,启动解释器执行对应字节码进入Java世界

前两个阶段是上一篇文章《从创建进程到进入main函数,发生了什么?》讨论的内容,第三阶段则是本文的内容。

现在你明白你写的main方法是怎么被调用的了吗?

作者:轩辕之风

来源:编程技术宇宙(ID:xuanyuancoding)

,