`
pengpeng
  • 浏览: 82384 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

【原】高级语言虚拟机技术,hotspot jvm初识

阅读更多



       写在前边
:为了获得新的能力,解决与计算机系统主要组件接口的多种问题,操作系统、编程语言和编译器、计算机体系结构这三个领域都发展了虚拟机技术。虚拟机技术从进程和系统角度分为:进程虚拟机和系统虚拟机; 进程虚拟机:为用户应用程序仿真虚拟的ABI(application binary interface)环境;典型代表为高级语言虚拟机(HLL VM):hostspot jvm,.net的虚拟机CLI等等; 系统虚拟机:提供完整的系统环境;这个环境可以仿真支持操作系统及其潜在的许多用户进程;典型代表为:VMware,virtualbox; 本篇主要介绍高级语言虚拟机.

     前言


     在你的头脑中是如何绘制计算机的系统结构的呢?现代计算机是人类工程学中最先进的结构,人类对极度复杂性的控制能力成就了现代计算机今日的辉煌。计算机系统由许多硅芯片组成。而每个芯片则由上亿个晶体管组成。这些芯片相互连接,并于高速的输入输出设备、网络设备一起组成可以运行软件的平台。操作系统、应用程序和库,图形和网络软件,所有这些协同工作,为数据管理、教育、通信、娱乐以及许多其他应用提供了强大的计算机环境。

    定义明确的接口是如何管理复杂的情况的呢?明确的接口可以分解计算机的设计任务,使得硬件和软件设计能够或多或少的独立开展工作。指令集就是这样一个硬件和软件的接口;例如:Intel和AMD的cpu设计师开发实现IA-32指令集的微处理器,同时软件工程师来开发把高级语言映射到该指令集的编译器;只要任务高级语言经过编译后能正确映射到CPU指令集,那此种语言就可以运行在这个cpu上;
    从这个意义上说,操作系统就被定义为一组接口的集合,是计算机系统中另一个重要的标准化接口。操作系统为我们应用程序开发人员隐藏了硬件细节,通过操作系统这样一个抽象的接口,高效的调度和运行我们的应用程序; 
    我们看到通过定义明确的接口,实际上是建立了一种协议,用次协议隐藏了底层细节。但是这种定义明确的接口的协议难道没有缺点么? 如果我的应用程序不遵从这个定义的接口怎么办? 我们知道有不同指令集的cpu(比如intel的IA-32,IBM的PowerPC),也有不同的建立在此种指令集上的操作系统(面向不同指令集的操作系统)。但如果我开发的应用程序在IA-32指令集上开发,并且应用程序以二进制分发,应用程序编译后的二进制程序和特定的指令集和操作系统就绑定起来了。那么我的程序就不能在IBM的PowerPC cpu上运行了。这就是缺点。

    怎么解决这个"定义明确的接口"导致的问题呢?虚拟技术可以解决这个问题。 我们的linux平台上只要安装了系统虚拟机virtual box上可以安装任何操作系统。系统虚拟机帮我们仿真基于各种"接口"的指令集。虚拟化是构建了一个将虚拟的客户系统映射到真实的主机系统上的同台的一个技术;


高级语言虚拟机


高级语言虚拟机(High-level language virtual machine)最早是随着1980年的Pascal编程环境开始流行的  。现代的java,ruby,python,.net等等都是高级语言虚拟机应用的典型;



 

     传统的计算环境中,一个编译过的应用程序被紧紧地绑定到一个特殊的操作系统和ISA(Instruction Set Architecture:指令集体系结构)上,比如c语言,通过gcc编译,链接后生成和当前操作系统绑定起来的二进制可执行文件; 为了把一个应用程序迁移到一个具有不同操作系统或ISA的平台上,就必须移植这个应用程序,这至少包括重编译;而unix,linux通过协议POSIX标准(即提供通用api)来保证c程序的可移植性;

      高级语言虚拟机改变了传统语言的这种模式,他的编译步骤类似与传统的模式,但在更高层次上分发程序的代码,它第一步生成的可移植中间代码是是相当普通的一种基于栈的ISA。这个虚拟ISA(class字节码)就是虚拟机的机器代码。这个虚拟ISA被分发,到不同平台上,每个平台只要实现能执行虚拟ISA的虚拟机。最简单的虚拟机形式是包含一个解释器,他取指,译码,执行所需要的状态转,仿真到真实机器上去执行


高级语言虚拟机的实现


    进程虚拟机主要由计算模块和收据结构如下图。其主要模块执行以下的功能:



 

  • 加载器将虚拟ISA代码和数据写入到vm内存映像的内存区,并且加载运行时软件的代码。尽管内存映像包含虚拟ISA(class字节码)的应用程序代码和数据。但是对运行时软件而言这些全是数据,因为源代码(class)并不执行。相反的,源代码(class)被用作解释例程或编译器例程的输入"数据";
  • 加载器紧接着将控制权交给初始化模块,该模块为代码cache和其他表分配在仿真期间所需的内存空间。初始化之后,仿真(执行)过程开始了。
  • 仿真引擎(也叫执行引擎)使用解释器或者编译器,将vm基本方法来仿真指令。如果使用编译器进行仿真,那么翻译的目标代码被保存于代码cache中。在仿真过程中,被编译器填写的代码cache是一个可执行代码区。
    剖析数据包含动态收集的程序信息。用于在编译期间指导优化策略。
         现在流行的高级语言虚拟机不仅仅是跨平台一个优点,它解放了程序员的思想。它还提供了:安全和保护,自动内存管理,网络。和面向对象的思想。随着硬件的发达,虚拟技术和现在流行的云计算思想结合起来。是未来发展的方向。

 

hotspot jvm

 

hotspot jvm结构图




 


 
内存结构

 

  jvm使用一个由一个程序内存区(堆中),常量区,栈和一个关于数据的内存堆组成的内存模型; 如图: 
                              


 
                                                      
    上图为jvm内存的大体结构; 可以看到内存的分配情况,和Linux的内存模型很相似;

    堆中包含程序员new的所有对象;

java指令集
hotspot是一个基于栈的虚拟机体系结构,所以他的指令集也是基于栈的。每个线程一个栈,每当一个方法被调用时,在栈上创建一个栈侦;jvm的指令集相比与基于寄存器的指令集的优点是紧促(因为指令需要的操作数都在栈中,所以就不需要2地址或3地址结构的指令集了);缺点是慢;
基本的指令集包括将值从堆区雅茹栈或者从栈中弹出值到内存区的指令,还有在栈上操作的算数运算,逻辑和移位运算指令;
指令集格式(一个操作码和零个或多个操作数):  opcode ; opcode index ; opcode index1 index2 ; opcode data ; opcode data1 data2;
例如:bipush data 或 sipush data1 data2.将操作数压入栈中;pop指令从栈中弹出栈顶元素;
指令流如下图:
        

 

 


jvm执行引擎

 

                  $ java -version
                  java version "1.6.0_21"
                  Java(TM) SE Runtime Environment (build 1.6.0_21-b06)
                  Java HotSpot(TM) 64-Bit [b]Server[/b] VM (build 17.0-b16, [b]mixed mode[/b])

实际上jvm包括2中模式client,和server模式。jvm会自动根据硬件配置或操作系统采用相应默认模式:window下默认client;linux下并且硬件配置好的用server模式。server模式在执行class时会进行很多优化步骤;线上都用server;(通过java -version可以查看到)
执行引擎通常工作在混杂模式(mixed mode),就是包含解释器和编译器(JIT); jvm充分利用了解释器和编译器各自的有点,class代码默认使用解释器执行;如果一块代码或者方法被执行了很多次,并达到了热点(hotspot).执行引擎里的JIT编译器会将这块代码编译为二进制代码并缓存起来,下一次的执行就直接执行二进制代码,而不经过解释器了; (通过java -version 查看)
 
总结: jvm的实现是复杂的,它实现了安全模型,动态加载,智能化剖析制定优化策略,垃圾收集,内存整理等等; 随着虚拟技术的发展,在不久的将来,实质上所有的应用程序可能都为一个平台独立的高级语言虚拟机而开发。如果将来所有的软件都为一个平台独立的的高级语言虚拟机而开发,那么就提高了标准化的级别,并且就更少与底层硬件ISA相关联了。

  • 大小: 30.4 KB
  • 大小: 46.2 KB
  • 大小: 30.8 KB
  • 大小: 8.4 KB
  • 大小: 55.1 KB
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics