我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python虚拟机pyc文件结构是什么

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python虚拟机pyc文件结构是什么

本篇内容介绍了“python虚拟机pyc文件结构是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

    PYC 文件

    pyc 文件是 Python 在解释执行源代码时生成的一种字节码文件,它包含了源代码的编译结果和相关的元数据信息,以便于 Python 可以更快地加载和执行代码。

    Python 是一种解释型语言,它不像编译型语言那样将源代码直接编译成机器码执行。Python 的解释器会在运行代码之前先将源代码编译成字节码,然后将字节码解释执行。.pyc 文件就是这个过程中生成的字节码文件。

    当 Python 解释器首次执行一个 .py 文件时,它会在同一目录下生成一个对应的 .pyc 文件,以便于下次加载该文件时可以更快地执行。如果源文件在修改之后被重新加载,解释器会重新生成 .pyc 文件以更新缓存的字节码。

    生成 PYC 文件

    正常的 python 文件需要通过编译器变成字节码,然后将字节码交给 python 虚拟机,然后 python 虚拟机会执行字节码。整体流程如下所示:

    python虚拟机pyc文件结构是什么

    我们可以直接使用 compile all 模块生成对应文件的 pyc 文件。

    ➜  pvm lsdemo.py  hello.py➜  pvm python -m compileall .Listing '.'...Listing './.idea'...Listing './.idea/inspectionProfiles'...Compiling './demo.py'...Compiling './hello.py'...➜  pvm ls__pycache__ demo.py     hello.py➜  pvm ls __pycache__ demo.cpython-310.pyc  hello.cpython-310.pyc

    python -m compileall . 命令将递归扫描当前目录下面的 py 文件,并且生成对应文件的 pyc 文件。

    PYC 文件布局

    python虚拟机pyc文件结构是什么

    第一部分魔数由两部分组成:

    python虚拟机pyc文件结构是什么

    第一部分 魔术是由一个 2 字节的整数和另外两个字符回车换行组成的, "\r\n" 也占用两个字节,一共是四个字节。这个两个字节的整数在不同的 python 版本还不一样,比如说在 python3.5 当中这个值为 3351 等值,在 python3.9 当中这个值为 3420,3421,3422,3423,3424等值(在 python 3.9 的小版本)。

    第二部分 Bit Field 这个字段的主要作用是为了将来能够实现复现编译结果,但是在 python3.9a2 时,这个字段的值还全部是 0 。详细内容可以参考 PEP552-Deterministic pycs 。这个字段在 python2 和 python3 早期版本并没有(python3.5 还没有),在 python3 的后期版本这个字段才出现的。

    第三部分 就是整个 py 源文件的大小了。

    第四部分 也是整个 pyc 文件当中最重要的一个部分,最后一个部分就是一个 CodeObject 对象序列化之后的数据,我们稍后再来仔细分析一下这个对象相关的数据。

    我们现在来具体分析一个 pyc 文件,对应的 python 代码为:

    def f():    x = 1    return 2

    pyc 文件的十六进制形式如下所示:

    ➜  __pycache__ hexdump -C hello.cpython-310.pyc00000000  6f 0d 0d 0a 00 00 00 00  b9 48 21 64 20 00 00 00  |o........H!d ...|00000010  e3 00 00 00 00 00 00 00  00 00 00 00 00 00 00 00  |................|00000020  00 02 00 00 00 40 00 00  00 73 0c 00 00 00 64 00  |.....@...s....d.|00000030  64 01 84 00 5a 00 64 02  53 00 29 03 63 00 00 00  |d...Z.d.S.).c...|00000040  00 00 00 00 00 00 00 00  00 01 00 00 00 01 00 00  |................|00000050  00 43 00 00 00 73 08 00  00 00 64 01 7d 00 64 02  |.C...s....d.}.d.|00000060  53 00 29 03 4e e9 01 00  00 00 e9 02 00 00 00 a9  |S.).N...........|00000070  00 29 01 da 01 78 72 03  00 00 00 72 03 00 00 00  |.)...xr....r....|00000080  fa 0a 2e 2f 68 65 6c 6c  6f 2e 70 79 da 01 66 01  |.../hello.py..f.|00000090  00 00 00 73 04 00 00 00  04 01 04 01 72 06 00 00  |...s........r...|000000a0  00 4e 29 01 72 06 00 00  00 72 03 00 00 00 72 03  |.N).r....r....r.|000000b0  00 00 00 72 03 00 00 00  72 05 00 00 00 da 08 3c  |...r....r......<|000000c0  6d 6f 64 75 6c 65 3e 01  00 00 00 73 02 00 00 00  |module>....s....|000000d0  0c 00                                             |..|000000d2

    因为数据使用小端表示方式,因此对于上面的数据来说:

    • 第一部分魔数为:0xa0d0d6f 。

    • 第二部分 Bit Field 为:0x0 。

    • 第三部分最后一次修改日期为:0x642148b9 。

    • 第四部分文件大小为:0x20 字节,也就是说 hello.py 这个文件的大小是 32 字节。

    下面是一个小的代码片段用于读取 pyc 文件的头部元信息:

    import structimport timeimport binasciifname = "./__pycache__/hello.cpython-310.pyc"f = open(fname, "rb")magic = struct.unpack('<l', f.read(4))[0]bit_filed = f.read(4)print(f"bit field = {binascii.hexlify(bit_filed)}")moddate = f.read(4)filesz = f.read(4)modtime = time.asctime(time.localtime(struct.unpack('<l', moddate)[0]))filesz = struct.unpack('<L', filesz)print("magic %s" % (hex(magic)))print("moddate (%s)" % (modtime))print("File Size %d" % filesz)f.close()

    上面的代码输出结果如下所示:

    bit field = b'00000000'
    magic 0xa0d0d6f
    moddate (Mon Mar 27 15:41:45 2023)
    File Size 32

    有关 pyc 文件的详细操作可以查看 python 标准库 importlib/_bootstrap_external.py 文件源代码。

    CODEOBJECT

    在 CPython 中,CodeObject 是一个对象,它包含了 Python 代码的字节码、常量、变量、位置参数、关键字参数等信息,以及一些用于运行代码的元数据,如文件名、代码行号等。

    在 CPython 中,当我们执行一个 Python 模块或函数时,解释器会先将其代码编译为 CodeObject,然后再执行。在编译过程中,解释器会将 Python 代码转换为字节码,并将其保存在 CodeObject 对象中。此后,每当我们调用该模块或函数时,解释器都会使用 CodeObject 中的字节码来执行代码。

    CodeObject 对象是不可变的,一旦创建就不能被修改。这是因为 Python 代码的字节码是不可变的,而 CodeObject 对象包含了这些字节码,所以也是不可变的。

    在本篇文章当中主要介绍 code object 当中主要的内容,以及简单介绍他们的作用,在后续的文章当中会仔细分析 code object 对应的源代码以及对应的字段的详细作用。

    现在举一个例子来分析一下 pycdemo.py 的 pyc 文件,pycdemo.py 的源程序如下所示:

    if __name__ == '__main__':    a = 100    print(a)

    下面的代码是一个用于加载 pycdemo01.cpython-39.pyc 文件(也就是 hello.py 对应的 pyc 文件)的代码,使用 marshal 读取 pyc 文件里面的 code object 。

    import marshalimport disimport structimport timeimport typesimport binasciidef print_metadata(fp):    magic = struct.unpack('<l', fp.read(4))[0]    print(f"magic number = {hex(magic)}")    bit_field = struct.unpack('<l', fp.read(4))[0]    print(f"bit filed = {bit_field}")    t = struct.unpack('<l', fp.read(4))[0]    print(f"time = {time.asctime(time.localtime(t))}")    file_size = struct.unpack('<l', fp.read(4))[0]    print(f"file size = {file_size}")def show_code(code, indent=''):    print ("%scode" % indent)    indent += '   '    print ("%sargcount %d" % (indent, code.co_argcount))    print ("%snlocals %d" % (indent, code.co_nlocals))    print ("%sstacksize %d" % (indent, code.co_stacksize))    print ("%sflags %04x" % (indent, code.co_flags))    show_hex("code", code.co_code, indent=indent)    dis.disassemble(code)    print ("%sconsts" % indent)    for const in code.co_consts:        if type(const) == types.CodeType:            show_code(const, indent+'   ')        else:            print("   %s%r" % (indent, const))    print("%snames %r" % (indent, code.co_names))    print("%svarnames %r" % (indent, code.co_varnames))    print("%sfreevars %r" % (indent, code.co_freevars))    print("%scellvars %r" % (indent, code.co_cellvars))    print("%sfilename %r" % (indent, code.co_filename))    print("%sname %r" % (indent, code.co_name))    print("%sfirstlineno %d" % (indent, code.co_firstlineno))    show_hex("lnotab", code.co_lnotab, indent=indent)def show_hex(label, h, indent):    h = binascii.hexlify(h)    if len(h) < 60:        print("%s%s %s" % (indent, label, h))    else:        print("%s%s" % (indent, label))        for i in range(0, len(h), 60):            print("%s   %s" % (indent, h[i:i+60]))if __name__ == '__main__':    filename = "./__pycache__/pycdemo01.cpython-39.pyc"    with open(filename, "rb") as fp:        print_metadata(fp)        code_object = marshal.load(fp)        show_code(code_object)

    执行上面的程序输出结果如下所示:

    magic number = 0xa0d0d61bit filed = 0time = Tue Mar 28 02:40:20 2023file size = 54code   argcount 0   nlocals 0   stacksize 2   flags 0040   code b'650064006b02721464015a01650265018301010064025300'  3           0 LOAD_NAME                0 (__name__)              2 LOAD_CONST               0 ('__main__')              4 COMPARE_OP               2 (==)              6 POP_JUMP_IF_FALSE       20  4           8 LOAD_CONST               1 (100)             10 STORE_NAME               1 (a)  5          12 LOAD_NAME                2 (print)             14 LOAD_NAME                1 (a)             16 CALL_FUNCTION            1             18 POP_TOP        >>   20 LOAD_CONST               2 (None)             22 RETURN_VALUE   consts      '__main__'      100      None   names ('__name__', 'a', 'print')   varnames ()   freevars ()   cellvars ()   filename './pycdemo01.py'   name '<module>'   firstlineno 3   lnotab b'08010401'

    下面是 code object 当中各个字段的作用:

    • 首先需要了解一下代码块这个概念,所谓代码块就是一个小的 python 代码,被当做一个小的单元整体执行。在 python 当中常见的代码块块有:函数体、类的定义、一个模块。

    • argcount,这个表示一个代码块的参数个数,这个参数只对函数体代码块有用,因为函数可能会有参数,比如上面的 pycdemo.py 是一个模块而不是一个函数,因此这个参数对应的值为 0 。

    • co_code,这个对象的具体内容就是一个字节序列,存储真实的 python 字节码,主要是用于 python 虚拟机执行的,在本篇文章当中暂时不详细分析。

    • co_consts,这个字段是一个列表类型的字段,主要是包含一些字符串常量和数值常量,比如上面的 ";main" 和 100 。

    • co_filename,这个字段的含义就是对应的源文件的文件名。

    • co_firstlineno,这个字段的含义为在 python 源文件当中第一行代码出现的行数,这个字段在进行调试的时候非常重要。

    • co_flags,这个字段的主要含义就是标识这个 code object 的类型。0x0080 表示这个 block 是一个协程,0x0010 表示这个 code object 是嵌套的等等。

    • co_lnotab,这个字段的含义主要是用于计算每个字节码指令对应的源代码行数。

    • co_varnames,这个字段的主要含义是表示在一个 code object 本地定义的一个名字。

    • co_names,和 co_varnames 相反,表示非本地定义但是在 code object 当中使用的名字。

    • co_nlocals,这个字段表示在一个 code object 当中本地使用的变量个数。

    • co_stackszie,因为 python 虚拟机是一个栈式计算机,这个参数的值表示这个栈需要的最大的值。

    • co_cellvars,co_freevars,这两个字段主要和嵌套函数和函数闭包有关。

    “python虚拟机pyc文件结构是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    python虚拟机pyc文件结构是什么

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    python虚拟机pyc文件结构是什么

    本篇内容介绍了“python虚拟机pyc文件结构是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!PYC 文件pyc 文件是 Python
    2023-07-05

    python中的pyc文件是什么

    这篇文章主要介绍了python中的pyc文件是什么,pyc文件是Python编译过的字节码文件,这个字节码是一种低级的、与平台无关的代码,还不知道的朋友来了解一下吧
    2023-05-17

    Python的.pyc文件是什么鬼?

    pyc文件是py文件编译后生成的字节码文件(byte code)。pyc文件经过python解释器最终会生成机器码运行。所以pyc文件是可以跨平台部署的,类似Java的.class文件。一般py文件改变后,都会重新生成pyc文件。为什么要手
    2023-01-31

    Java虚拟机,类文件结构深度解析

    Java类文件结构Java虚拟机不和包括Java在内的任何语言绑定,只与 "Class文件" 这种特定的二进制文件所关联, Class文件中包含了Java虚拟机指令集合符号表以及若干其它辅助信息。 Java虚拟机作为一个通用的、机器无关的执
    2023-06-02

    JAVA虚拟机(JVM)详细介绍(四)——类文件结构

    讲完了自动内存管理,我们来说说执行子系统。执行子系统讲解的是JVM如何执行程序。Class文件概述这篇我们只讲讲Class文件。Class文件又名类文件或字节码文件。javac将.java文件(源代码)编译成.class文件(字节码),jvm再将.class文
    JAVA虚拟机(JVM)详细介绍(四)——类文件结构
    2016-02-29

    Java虚拟机的体系结构和内存模型是什么

    这篇文章主要介绍“Java虚拟机的体系结构和内存模型是什么”,在日常操作中,相信很多人在Java虚拟机的体系结构和内存模型是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java虚拟机的体系结构和内存模型
    2023-06-17

    如何理解Java虚拟机及JVM体系结构是什么

    今天就跟大家聊聊有关如何理解Java虚拟机及JVM体系结构是什么,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。JVM(Java 虚拟机)Java虚拟机,java源文件(.java)通
    2023-06-17

    虚拟主机上传文件的流程是什么

    虚拟主机上传文件的流程如下:1. 选择一个合适的文件上传工具或者使用网页上提供的文件上传功能。2. 连接到虚拟主机的FTP服务器。通常会提供FTP服务器地址、用户名和密码。可以使用FTP客户端软件(如FileZilla)或者命令行工具(如命
    2023-09-12

    虚拟主机下载文件的方法是什么

    虚拟主机下载文件的方法一般有以下几种:1. FTP下载:通过FTP客户端连接虚拟主机,选择需要下载的文件,然后进行下载操作。2. 文件管理器下载:通过虚拟主机提供的文件管理器,选择需要下载的文件,然后进行下载操作。3. 命令行下载:通过SS
    2023-06-03

    虚拟主机文件上传的方法是什么

    虚拟主机文件上传的方法通常有以下几种:1. 使用文件管理器:大多数虚拟主机提供了一个文件管理器,你可以通过登录虚拟主机的控制面板或使用FTP客户端访问文件管理器,然后选择要上传的文件并将其拖放到特定目录中。2. 使用FTP客户端:FTP客户
    2023-08-31

    Java虚拟机中JVM内存结构是怎么样的

    这篇文章给大家分享的是有关Java虚拟机中JVM内存结构是怎么样的的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一、JVM启动流程:JVM启动时,是由java命令/javaw命令来启动的。二、JVM基本结构:JV
    2023-06-02

    云虚拟主机文件解压的方法是什么

    云虚拟主机文件解压的方法有多种,以下是其中几种常见的方法:1. 使用SSH命令行:通过SSH登录到云虚拟主机,使用命令行工具解压文件。常见的解压命令有tar、gzip、unzip等。例如,可以使用以下命令解压一个tar.gz文件:```ta
    2023-09-12

    linux文件系统结构是什么

    这篇文章主要介绍“linux文件系统结构是什么”,在日常操作中,相信很多人在linux文件系统结构是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”linux文件系统结构是什么”的疑惑有所帮助!接下来,请跟
    2023-07-04

    文件上传到云虚拟主机的方法是什么

    要将文件上传到云虚拟主机,可以使用以下方法之一:1. FTP(文件传输协议):使用FTP客户端软件(如FileZilla、CuteFTP等),通过FTP协议将文件从本地计算机上传到云虚拟主机。需要提前设置FTP服务器的连接参数。2. SSH
    2023-09-18

    nginx.conf配置文件的结构是什么

    今天小编给大家分享一下nginx.conf配置文件的结构是什么的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。核心配置文件的结
    2023-06-29

    Dockerfile文件的基本结构是什么

    本篇内容介绍了“Dockerfile文件的基本结构是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!什么是dockerfile?Docke
    2023-07-02

    linux文件系统的结构是什么

    这篇文章主要介绍“linux文件系统的结构是什么”,在日常操作中,相信很多人在linux文件系统的结构是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”linux文件系统的结构是什么”的疑惑有所帮助!接下来
    2023-03-02

    Virtual Box虚拟机文件瘦身处理的方法是什么

    本文小编为大家详细介绍“Virtual Box虚拟机文件瘦身处理的方法是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“Virtual Box虚拟机文件瘦身处理的方法是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习
    2023-07-06

    网站文件上传到虚拟主机的方法是什么

    上传网站文件到虚拟主机通常有以下几种方法:1. FTP(文件传输协议):使用FTP客户端软件(如FileZilla)连接到虚拟主机,然后将网站文件从本地计算机上传到虚拟主机的指定文件夹。2. 控制面板文件管理器:许多虚拟主机提供了Web控制
    2023-08-29

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录