分享

JVM致命错误日志hs_err_pid_log解读

 闪宁斯达 2013-10-14

致命错误出现的时候,JVM生成了hs_err_pid<pid>.log这样的文件,其中往往包含了虚拟机崩溃原因的重要信息。因为经常遇 到,在这篇文章里,我挑选了一个,并且逐段分析它包含的内容(文件可以在文章最后下载)。默认情况下文件是创建在工作目录下的(如果没权限创建的话JVM 会尝试把文件写到/tmp这样的临时目录下面去),当然,文件格式和路径也可以通过参数指定,比如:

1.   java -XX:ErrorFile=/var/log/java/java_error%p.log 

这个文件将包括:

         触发致命错误的操作异常或者信号;

         版本和配置信息;

         触发致命异常的线程详细信息和线程栈;

         当前运行的线程列表和它们的状态;

         堆的总括信息;

         加载的本地库;

         命令行参数;

         环境变量;

         操作系统CPU的详细信息。

首先,看到的是对问题的概要介绍:

1.   #  SIGSEGV (0xb) at pc=0x03568cf4, pid=16819, tid=3073346448 

一个非预期的错误被JRE检测到,其中:

         SIGSEGV是信号名称

         0xb是信号码

         pc=0x03568cf4指的是程序计数器的值

         pid=16819是进程号

         tid=3073346448是线程号

如果你对JVM有了解,应该不会对这些东西陌生。

接下来是JREJVM的版本信息:

1.   # JRE version: 6.0_32-b05 

2.     

3.   # Java VM: Java HotSpot(TM) Server VM (20.7-b02 mixed mode linux-x86 ) 

运行在mixed模式下。

然后是问题帧的信息:

1.   # Problematic frame: 

2.     

3.   # C  [libgtk-x11-2.0.so.0+0x19fcf4]  __float128+0x19fcf4 

         C:帧类型为本地帧,帧的类型包括:

o    C:本地C

o    j:解释的Java

o    V:虚拟机帧

o    v:虚拟机生成的存根栈帧

o    J:其他帧类型,包括编译后的Java

         libgtk-x11-2.0.so.0+0x19fcf4:和程序计数器(pc)表达的含义一样,但是用的是本地so+偏移量的方式。

接下去第一部分是线程信息:

1.   Current thread (0x09f30c00):  JavaThread "main" [_thread_in_native, id=16822, stack(0xb72a8000,0xb72f9000)] 

当前线程的:

         0x09f30c00:指针

         JavaThread:线程类型,可能的类型包括:

o    JavaThread

o    VMThread

o    CompilerThread

o    GCTaskThread

o    WatcherThread

o    ConcurrentMarkSweepThread

         main:名字

o    _thread_in_native:线程当前状态,状态枚举包括:

o    _thread_uninitialized:线程还没有创建,它只在内存原因崩溃的时候才出现

o    _thread_new:线程已经被创建,但是还没有启动

o    _thread_in_native:线程正在执行本地代码,一般这种情况很可能是本地代码有问题

o    _thread_in_vm:线程正在执行虚拟机代码

o    _thread_in_Java:线程正在执行解释或者编译后的Java代码

o    _thread_blocked:线程处于阻塞状态

o    _trans:以_trans结尾,线程正处于要切换到其它状态的中间状态

         id=16822:线程ID

         0xb72a8000,0xb72f9000:栈区间

1.   siginfo:si_signo=SIGSEGV: si_errno=0, si_code=1 (SEGV_MAPERR), si_addr=0x00000010 

这部分是导致虚拟机终止的非预期的信号信息,含义前面已经大致提到过了。其中si_errnosi_codeLinux下用来鉴别异常的,Windows下是一个ExceptionCode

1.   EAX=0x00000000, EBX=0x0375dd84, ECX=0x00000000, EDX=0x00000000 

2.   ESP=0xb72f0fa0, EBP=0xb72f0fb8, ESI=0x00000000, EDI=0x0a6c1800 

3.   EIP=0x03568cf4, EFLAGS=0x00010246, CR2=0x00000010 

这是寄存器上下文。

1.   Top of Stack: (sp=0xb72f0fa0

2.   0xb72f0fa0:   00000000 00402250 0040217f 0375dd84 

3.   0xb72f0fb0:   00000000 0a6c1800 b72f0fe8 0356c2c0 

4.   0xb72f0fc0:   00000000 0a6c1800 b72f0fe8 003b3e77 

5.   0xb72f0fd0:   003e6c8b 0a1a70d0 0a193358 0375dd84 

6.   0xb72f0fe0:   0a276418 0a276418 b72f1048 03536c56 

7.   0xb72f0ff0:   0acad000 0b3ca978 0000000c 00dd0674 

8.   0xb72f1000:   00000003 0a2c7d50 b72f1038 0000330c 

9.   0xb72f1010:   ffffffff ffffffff 00000001 00000001 

10.  

11.Instructions: (pc=0x03568cf4

12.0x03568cd4:   89 14 24 89 75 f8 89 d6 89 7d fc 89 c7 e8 7e 1b 

13.0x03568ce4:   ea ff 89 34 24 89 87 d4 02 00 00 e8 30 00 ea ff 

14.0x03568cf4:   8b 40 10 89 3c 24 c7 44 24 08 00 00 00 00 89 87 

15.0x03568d04:   d0 02 00 00 8b 83 88 24 00 00 89 44 24 04 e8 d

栈顶程序计数器旁的操作码,它们可以被反汇编成系统崩溃前执行的指令。

1.  Register to memory mapping: 

2.    

3.  EAX=0x00000000 is an unknown value 

4.  EBX=0x0375dd84: <offset 0x394d84> in /usr/lib/libgtk-x11-2.0.so.0 at 0x033c9000 

5.  ECX=0x00000000 is an unknown value 

6.  EDX=0x00000000 is an unknown value 

7.  ESP=0xb72f0fa0 is pointing into the stack for thread: 0x09f30c00 

8.  EBP=0xb72f0fb8 is pointing into the stack for thread: 0x09f30c00 

9.  ESI=0x00000000 is an unknown value 

10. EDI=0x0a6c1800 is an unknown value 

寄存器和内存映射信息。

1.  Stack: [0xb72a8000,0xb72f9000],  sp=0xb72f0fa0,  free space=291k 

2.  Native frames: (J=compiled Java code, j=interpreted, Vv=VM code, C=native code) 

3.  C  [libgtk-x11-2.0.so.0+0x19fcf4]  __float128+0x19fcf4 

4.  C  [libgtk-x11-2.0.so.0+0x1a32c0]  __float128+0xc0 

5.  ... ... 

6.  C  [libswt-pi-gtk-3738.so+0x33f6a]  Java_org_eclipse_swt_internal_gtk_OS__1Call+0xf 

7.  J  org.eclipse.swt.internal.gtk.OS._Call(III)I 

8.  J  org.eclipse.swt.internal.gtk.OS.Call(III)I 

9.    

10. Java frames: (J=compiled Java code, j=interpreted, Vv=VM code) 

11. J  org.eclipse.swt.internal.gtk.OS._Call(III)I 

12. J  org.eclipse.swt.internal.gtk.OS.Call(III)I 

13. j  org.eclipse.swt.widgets.Widget.fixedSizeAllocateProc(II)I+5 

14. j  org.eclipse.swt.widgets.Display.fixedSizeAllocateProc(II)I+17 

15. v  ~StubRoutines::call_stub 

线程栈。包含了地址、栈顶、栈计数器和线程尚未使用的栈信息,由于栈可能非常长,打印的长度有限制,但是至少本地栈和Java栈都打印出来了(很多时候本地栈打印不出来,但是Java栈一般都能打印出来)。从中可以看到,Eclipse的虚拟机崩溃了。

1.  ava Threads: ( => current thread ) 

2.    0x0b4c1000 JavaThread "Worker-247" [_thread_blocked, id=25417, stack(0x741bc000,0x7420d000)] 

3.    0x0a300c00 JavaThread "Worker-246" [_thread_blocked, id=25235, stack(0x7d30c000,0x7d35d000)] 

4.  ... ... 

线程信息。一目了然,不解释了。

1.  VM state:not at safepoint (normal execution) 

虚拟机状态。包括:

         not at a safepoint:正常运行状态;

         at safepoint:所有线程都因为虚拟机等待状态而阻塞,等待一个虚拟机操作完成;

         synchronizing:一个特殊的虚拟机操作,要求虚拟机内的其它线程保持等待状态。

1.  VM Mutex/Monitor currently owned by a thread: None 

虚拟机的MutexMonitor目前没有被线程持有。Mutex是虚拟机内部的锁,而Monitor则关联到了Java对象。

1.  Heap 

2.   PSYoungGen      total 149056K, used 125317K [0xa97000000xb41a00000xb41a0000

3.    eden space 123520K, 95% used [0xa9700000,0xb0ac0de0,0xb0fa0000

4.    from space 25536K, 26% used [0xb28b0000,0xb2f50748,0xb41a0000

5.    to   space 25600K, 0% used [0xb0fa0000,0xb0fa0000,0xb28a0000

6.   PSOldGen        total 261248K, used 239964K [0x941a00000xa40c00000xa9700000

7.    object space 261248K, 91% used [0x941a0000,0xa2bf7018,0xa40c0000

8.   PSPermGen       total 163328K, used 130819K [0x841a00000x8e1200000x941a0000

9.    object space 163328K, 80% used [0x841a0000,0x8c160c40,0x8e120000

堆信息。新生代、老生代、永久代。对JVM有了解的人应该都清楚,不解释了。

1.  Code Cache  [0xb42620000xb5ac20000xb7262000

2.   total_blobs=5795 nmethods=5534 adapters=209 free_code_cache=25103616 largest_free_block=38336 

代码缓存(Code Cache)。这是一块用于编译和保存本地代码的内存,注意是本地代码,它和PermGen(永久代)是不一样的,永久带是用来存放Java类定义的。

1.  Dynamic libraries: 

2.  00101000-00122000 r-xp 00000000 08:01 3483560    /usr/lib/libjpeg.so.62.0.0 

3.  00122000-00123000 rwxp 00020000 08:01 3483560    /usr/lib/libjpeg.so.62.0.0 

4.  00125000-00130000 r-xp 00000000 08:01 9093202    /lib/libgcc_s-4.1.2-20080825.so.1 

5.  00130000-00131000 rwxp 0000a000 08:01 9093202    /lib/libgcc_s-4.1.2-20080825.so.1 

6.  ... ... 

内存映射。这些信息是虚拟机崩溃时的虚拟内存列表区域。在定位崩溃原因的时候,它可以告诉你哪些类库正在被使用,位置在哪里,还有堆栈和守护页信息。就以列表中第一条为例说明:

         00101000-00122000:内存区域

         r-xp:权限,r/w/x/p/s分别表示读//执行/私有/共享

         00000000:文件内的偏移量

         08:01:文件位置的majorIDminorID

         3483560:索引节点号

         /usr/lib/libjpeg.so.62.0.0:文件位置

每一个lib都有两块虚拟内存区域——代码和数据,它们的权限不同,代码区域是r-xp;数据区域是rwxp。守护页(guard page)由权限为--xprwxp的一对组成。

1.  VM Arguments: 

2.  jvm_args: -Dosgi.requiredJavaVersion=1.5 -XX:MaxPermSize=256m -Xms40m -Xmx512m -Dorg.eclipse.swt.browser.XULRunnerPath='' 

3.  java_command: /.../eclipse/plugins/org.eclipse.equinox.launcher_1.2.0.v20110502.jar -os linux -ws gtk -arch x86 -showsplash -launcher /.../eclipse/eclipse -name Eclipse ... 

4.  Launcher Type: SUN_STANDARD 

5.    

6.  Environment Variables: 

7.  PATH=... 

8.  DISPLAY=:0.0 

虚拟机参数和环境变量。

1.  Signal Handlers: 

2.  SIGSEGV: [libjvm.so+0x726440], sa_mask[0]=0x7ffbfeff, sa_flags=0x10000004 

3.  SIGBUS: [libjvm.so+0x726440], sa_mask[0]=0x7ffbfeff, sa_flags=0x10000004 

4.  ... ... 

信号句柄。对于Linux下的信号机制,参阅wiki百科,链接

1.  OS:Red Hat Enterprise Linux Client release 5.4 (Tikanga) 

2.    

3.  uname:Linux 2.6.18-164.el5 #1 SMP Tue Aug 18 15:51:54 EDT 2009 i686 

4.  libc:glibc 2.5 NPTL 2.5 

5.  rlimit: STACK 10240k, CORE 0k, NPROC 65536, NOFILE 1024, AS infinity 

6.  load average:1.78 1.58 1.54 

7.    

8.  /proc/meminfo: 

9.  ... 

10.   

11. CPU:total 4 (4 cores per cpu, 1 threads per core) family 6 model 42 stepping 7, cmov, cx8, fxsr, mmx, sse, sse2, sse3, ssse3 

12.   

13. /proc/cpuinfo: 

14. ... 

15.   

16. Memory: 4k page, physical 3631860k(155144k free), swap 5124724k(5056452k free)

 

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多