1. 过程概述 Python先把代码(.py文件)编译成字节码,交给字节码虚拟机,然后虚拟机一条一条执行字节码指令,从而完成程序的执行。 2. 字节码 字节码在Python虚拟机程序里对应的是PyCodeObject对象。 3. pyc文件 PyCodeObject对象的创建时机是模块加载的时候,即import。
4. PyCodeObject Python代码的编译结果就是PyCodeObject对象。 5. pyc文件格式 加载模块时,模块对应的PyCodeObject对象被写入.pyc文件,格式如下: 6. 分析字节码 6.1 解析PyCodeObject Python提供了内置函数compile可以编译Python代码和查看PyCodeObject对象,如下: Python代码[test.py] 在Python交互式shell里编译代码得到PyCodeObject对象: dir(co)已经列出co的各个域,想查看某个域直接在终端输出即可: test.py的PyCodeObject Python解释器会为函数也生成的字节码PyCodeObject对象,见上面的co_consts[1] func的PyCodeObject co_code是指令序列,是一串二进制流,它的格式和解析方法见6.2。 6.2 解析指令序列 指令序列co_code的格式
Python内置的dis模块可以解析co_code,如下图: test.py的指令序列 func函数的指令序列 第一列表示以下几个指令在py文件中的行号;
7. 执行字节码 Python虚拟机的原理就是模拟可执行程序再X86机器上的运行,X86的运行时栈帧如下图: 假如test.py用C语言来实现,会是下面这个样子: Python虚拟机的原理就是模拟上述行为。当发生函数调用时,创建新的栈帧,对应Python的实现就是PyFrameObject对象。 7.1 PyFrameObject 那么对应Python的运行时栈就是这样子: 7.2 执行指令 执行test.py的字节码时,会先创建一个栈帧,以下用f表示当前栈帧,执行过程注释如下: test.py的符号名集合和常量集合 test.py的指令序列 上面的CALL_FUNCTION指令执行时,会创建新的栈帧,并执行func的字节码指令,以下用f表示当前栈帧,func的字节码执行过程如下: func函数的符号名集合和常量集合 func函数的指令序列 7.3 查看栈帧 如果你想查看当前栈帧,Python提供了sys._getframe()方法可以获取当前栈帧,你只需要在代码里加入代码如下: ▼ |
|