位置：首页-资讯-后端开发

Python 内存管理的工作原理，你了解吗？

2023-05-14 21:19

短信预约 -IT技能 免费直播动态提醒

Python 为开发者提供了许多便利，其中最大的便利之一是其几乎无忧的内存管理。开发者无需手动为 Python 中的对象和数据结构分配、跟踪和释放内存。运行时会为你完成所有这些工作，因此你可以专注于解决实际问题，而不是争论机器级细节。

Python 内存管理的工作原理，你了解吗？

尽管如此，即使是经验不多的 Python 用户，了解 Python 的垃圾收集和内存管理是如何工作的也是有好处的。了解这些机制将帮助你避免更复杂的项目可能出现的性能问题。你还可以使用 Python 的内置工具来监控程序的内存管理行为。

Python如何管理内存

每个 Python 对象都有一个引用计数，也称为引用计数。 refcount 是持有对给定对象的引用的其他对象总数的计数。当你添加或删除对对象的引用时，数字会上升或下降。当一个对象的引用计数变为零时，该对象将被释放并释放其内存。

什么是参考？允许通过名称或通过另一个对象中的访问器访问对象的任何内容。

这是一个简单的例子：

x = "Hello there"

当我们向 Python 发出这个命令时，引擎盖下会发生两件事：

该字符串"Hello there"作为 Python 对象创建并存储在内存中。
该名称x在本地命名空间中创建并指向该对象，这会将其引用计数增加 1 到 1。

如果我们说y = x，那么引用计数将再次提高到 2。

每当xandy超出范围或从它们的命名空间中删除时，对于每个名称，字符串的引用计数都会减少 1。一旦x和y都超出范围或被删除，字符串的引用计数变为 0 并被删除。

现在，假设我们创建了一个包含字符串的列表，如下所示：

x = ["Hello there", 2, False]

字符串保留在内存中，直到列表本身被删除或包含字符串的元素从列表中删除。这些操作中的任何一个都将导致唯一持有对字符串的引用的事物消失。

现在考虑这个例子：

x = "Hello there" y = [x]

如果我们从中删除第一个元素y，或者完全删除列表y，则字符串仍在内存中。这是因为名称x包含对它的引用。

Python 中的引用循环

在大多数情况下，引用计数工作正常。但有时你会遇到两个对象各自持有对彼此的引用的情况。这称为参考周期。在这种情况下，对象的引用计数永远不会达到零，也永远不会从内存中删除。

这是一个人为的例子：

x = SomeClass()
y = SomeOtherClass()
x.item = y
y.item = x

由于x并y持有彼此的引用，因此它们永远不会从系统中删除——即使没有其他任何东西引用它们中的任何一个。

Python 自己的运行时为对象生成引用循环实际上是相当普遍的。一个示例是带有包含对异常本身的引用的回溯对象的异常。

在Python的早期版本中，这是一个问题。具有引用周期的对象可能会随着时间的推移而累积，这对于长时间运行的应用程序来说是一个大问题。但 Python 此后引入了循环检测和垃圾收集系统，用于管理引用循环。

Python 垃圾收集器 (gc)

Python 的垃圾收集器检测具有引用周期的对象。它通过跟踪作为“容器”的对象（例如列表、字典、自定义类实例）并确定其中的哪些对象无法在其他任何地方访问来实现这一点。

一旦这些对象被挑选出来，垃圾收集器就会通过确保它们的引用计数可以安全地降为零来删除它们。

绝大多数 Python 对象没有引用周期，因此垃圾收集器不需要 24/7 运行。相反，垃圾收集器使用一些启发式方法来减少运行频率，并且每次都尽可能高效地运行。

当 Python 解释器启动时，它会跟踪已分配但未释放的对象数量。绝大多数 Python 对象的生命周期都很短，因此它们会迅速出现和消失。但随着时间的推移，更多长寿的物体会出现。一旦超过一定数量的此类对象堆积起来，垃圾收集器就会运行。

每次垃圾收集器运行时，它都会收集所有在收集中幸存下来的对象，并将它们放在一个称为一代的组中。这些“第一代”对象在参考周期中被扫描的频率较低。任何在垃圾收集器中幸存下来的第一代对象最终都会迁移到第二代，在那里它们被扫描得更少。

同样，垃圾收集器不会跟踪所有内容。例如，像用户创建的类这样的复杂对象总是被跟踪。但是不会跟踪仅包含简单对象（如整数和字符串）的字典，因为该特定字典中的任何对象都不会包含对其他对象的引用。不能保存对其他元素（如整数和字符串）的引用的简单对象永远不会被跟踪。

如何使用 gc 模块

通常，垃圾收集器不需要调整即可运行良好。Python 的开发团队选择了反映最常见现实世界场景的默认值。但是如果你确实需要调整垃圾收集的工作方式，你可以使用Python 的 gc 模块。该gc模块为垃圾收集器的行为提供编程接口，并提供对正在跟踪的对象的可见性。

gc当你确定不需要垃圾收集器时，你可以做的一件有用的事情是关闭它。例如，如果你有一个堆放大量对象的短运行脚本，则不需要垃圾收集器。脚本结束时，所有内容都将被清除。为此，你可以使用命令禁用垃圾收集器gc.disable()。稍后，你可以使用重新启用它gc.enable()。

你还可以使用手动运行收集周期gc.collect()。一个常见的应用是管理程序的性能密集型部分，该部分会生成许多临时对象。你可以在程序的该部分禁用垃圾收集，然后在最后手动运行收集并重新启用收集。

另一个有用的垃圾收集优化是gc.freeze(). 发出此命令时，垃圾收集器当前跟踪的所有内容都被“冻结”，或者被列为免于将来的收集扫描。这样，未来的扫描可以跳过这些对象。如果你有一个程序在启动之前导入库并设置大量内部状态，那么你可以gc.freeze()在所有工作完成后发出。这使垃圾收集器不必搜寻那些无论如何都不太可能被删除的东西。（如果你想对冻结的对象再次执行垃圾收集，请使用gc.unfreeze().）