操作系统内存与JVM内存

liang1234_ 2020-09-05

展开全文

操作系统分为栈和堆，栈由操作系统管理，会有操作系统进行自动回收，堆由用户进行分配使用

我们需要注意的是操作系统的栈与堆并不是数据结构里的那个栈与堆

这是个人笔记，所以添加了操作系统内存中的栈与堆内容（高手请直接跳过这部分内容）

操作系统内存中的栈与堆（用亲近底层的C/C++语言进行介绍）

一般情况下程序会被存放在Rom（只读内存器，比如硬盘）或Flash（闪存）中，运行时需要拷到RAM（随机存储器）中进行执行，RAM会分别存储不同的信息，如下图所示：

内存中的栈区处于相对较高的地址以地址的增长方向为上的话，栈地址是向下增长的。

栈中分配局部变量空间，堆区是向上增长的用于分配程序员申请的内存空间。

另外还有静态区是分配静态变量，全局变量空间的；

只读区是分配常量和程序代码空间的。

下面让我们一起看这一段的代码：

int a = 0; //全局初始化区char *p1; //全局未初始化区main(){int b; //栈char s[] = "abc"; //栈char *p2; //栈char *p3 = "123456"; //123456\0在常量区，p3在栈上。static int c =0； //全局（静态）初始化区p1 = (char *)malloc(10); //堆p2 = (char *)malloc(20);  //堆}

从中进行分析：

（1）申请方式和回收方式不同

我们很容易就能注意到了：堆和栈的第一个区别就是申请方式不同，栈（英文名称是stack）是系统自动分配空间的，例如我们定义一个 char a，系统会自动在栈上为其开辟空间。而堆（英文名称是heap）则是程序员根据需要自己申请的空间，例如malloc（10），开辟十个字节的空间。

由于栈上的空间是自动分配自动回收的，所以栈上的数据的生存周期只是在函数的运行过程中，运行后就释放掉，不可以再访问。而堆上的数据只要程序员不释放空间，就一直可以访问到，不过缺点是一旦忘记释放会造成内存泄露。

（2）申请后系统的响应：

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。

堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序。还有，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的 delete语句（C++中的）才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。 也就是说堆会在申请后还要做一些后续的工作，这就会引出申请效率的问题。

（3）申请效率的比较

栈：由系统自动分配，速度较快。但程序员是无法控制的。

堆：是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便。

（4）.申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在 WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

（5）堆和栈中的存储内容

对于C/C++来说

栈：在函数调用时，第一个进栈的是主函数中函数调用后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。
当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

JVM内存：

首先先介绍操作系统内存与JVM内存的联系与区别：

1.操作系统分为栈和堆，栈由操作系统管理，会有操作系统进行自动回收，堆由用户进行分配使用
2.JVM内存使用的操作系统的堆，以防JVM分配的内存被操作系统回收
3.JVM本地方法栈指的是操作系统的栈
4.操作系统的PC寄存器，是计算机上的存储硬件，与内存条一样的硬件，但是寄存区位于CPU内，被称为Cache，用于加快数据访问速度。内存是外挂在CPU的数据总线上的
5.JVM PC寄存器位于操作系统的堆中

下面为图示：

为了便于理解添加图示：

1- JVM PC寄存器

PC寄存器配合字节码解释器，选取下一条字节码指令来解释执行，线程私有，每个线程都有一个PC寄存器。为了确保切换线程后能恢复到原来进程正确的执行位置。如果执行的不是Java方法，而是本地方法Native Method，这个计数器值为空（Undefined），如果是Java方法则保存的是正在执行的虚拟机字节码指令的地址，可以看做是当前线程所执行的字节码的行号指示器，会自增取下一条字节码指令的地址。这是JVM 规范的唯一没有OutMemoryError的内存区域。

2- Java 虚拟机栈
当启动一个线程时，JVM就会给这个线程分配一个栈，所以栈的生命周期是和线程一样的。

Java方法执行的内存模型：每个Java方法的执行都会创建一个栈帧（Stack Frame），方法的调用到执行完毕（正常退出，或者异常退出）对应着一个栈帧的入栈和出栈的过程

一个栈帧包括：局部变量表、操作数栈、动态链接、方法出口等。

栈帧结构：
1）局部变量表：存放的是编译期间可知的基本数据类型，和对象的引用，比如方法的参数变量，还有方法内的局部变量；需要注意的是如果这个方法是普通的方法，那么还会有自己的本身对象的一个引用（this，索引为0），如果是静态方法就没有这个自身对象的引用。一个单位局部变量空间为32位，64位长度的long和double数据类型会占用两个局部变量空间。变量通过声明的顺序的索引来进行访问的，

2）操作数栈（Operand Stack）：是一个存储中间变量结果的栈结构，只能通过入栈和出栈来进行访问。Java虚拟机指令是主要是通过操作数栈来获取操作数（Operand）的，而不是寄存器。

举例：

int a  = 100;  int b = 98;// iload_0,iload_1,iadd,istore_2//iload指令是指将局部变量表中一个int变量加载到操作栈中//iadd指令弹出操作数栈的两个变量，进行加法运算，然后将结果压入栈中//istore指令是指将操作栈一个数值存储到局部变量表中int c = a+b;

3)动态链接（暂时略）

4)方法出口（暂时略）

5)通常程序员所说的Java中的栈指的就是虚拟机的局部变量表。
6)两种异常：StackOverflowError（栈空间溢出），当线程请求的栈深度大于虚拟机所允许的深度，将会抛出此异常；OutMemoryError（栈空间拓展内存溢出），当虚拟机栈支持动态拓展时，如果在扩展时无法申请到足够的内存时，就会抛出此异常。

3- 本地方法栈（Native Method）

1）本地方法栈和虚拟机栈的作用是一样的，只是服务的对象不一样，虚拟机方法栈是为虚拟机执行java方法（字节码）服务的，而本地方法栈是为虚拟机执行Native方法服务的。
2）Sun HotSpot 直接将本地方法栈和虚拟机栈合二为一。
3）两种异常：和虚拟机栈一样

JVM规范中的内存空间

4- Java堆（Java Heap）
1)所有线程共享的内存区域，与虚拟机同生命周期。
2)主要任务是存储对象实例，基本上所有对象实例和数组都在Heap上分配空间，但是也不这么绝对，因为编译器优化。

3)Java堆是一块很大的内存区域，为了加速GC回收的效率，把这个堆有按照不同粒度进行细分

5- 方法区（Method Area）
1)所有线程共享的内存区域，与虚拟机同生命周期。
2)存储已被虚拟机加载的类信息、常量、静态变量、编译后的代码等
3)按照代划分，方法区在HotSpot中被划分为永久代（Permanent Generation）

4)不需要物理连续的存储空间，可拓展（通过 -XX:MaxPermSize，-XX:MinPermSize）

5）永久代并不永久，GC会对常量池的回收，以及类型的卸载。
6）异常：OutMemoryError，当方法区无法满足内存分配时。

7）运行时常量池（Runtime Constant Pool）

7.1是方法区的一部分，Class文件中除了有版本、字段、方法、接口等描述信息，还会有一项信息是常量池，用于存放编译期间生成的各种字面量和符号引用以及翻译后的直接引用，这部分内容将在类加载后存放在方法区的运行时常量池中。
7.2运行时常量池中的常量，不一定来源于一开始加载的Class文件（编译期间产生常量），也可以在运行时将新的常量放入常量池中，这是运行时常量池动态性的体现。

补充：

Java中的内存分配：

栈：存储局部变量
堆：存储new出来的数组或对象
方法区：类的方法代码，变量名，方法名，访问权限，返回值等等
本地方法区：和系统相关
寄存器：给CPU使用

Java虚拟机内存模型中定义的访问操作和物理计算机处理的基本一致，如图：