我的编程空间,编程开发者的网络收藏夹
学习永远不晚

详解Python中神奇的字符串驻留机制

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

详解Python中神奇的字符串驻留机制

今天有一个初学者在学习Python的时候又整不会了。 原因是以下代码:

a = [1, 2, 3]  
b = [1, 2, 3]  
if a is b:  
    print("a and b point to the same object")  
else:  
    print("a and b point to different objects")

运行结果是a and b point to different objects。

然后他又试了字符串对象。

str1 = "hello"  
str2 = "hello"  
  
if str1 is str2:  
    print("str1 and str2 are the same object")  
else:  
    print("str1 and str2 are different objects")

运行结果是:str1 and str2 are the same object

他找到田辛老师询问原因。 于是有了今天这篇文章:Python中的字符串驻留机制。

1 什么是字符串驻留机制

字符串驻留机制是Python针对字符串对象采取的一种内存优化技术。其目标是减少内存使用并提高程序的性能。

在Python中,字符串是不可变的对象,一旦创建,就不能被修改。因此,如果我们创建了两个字符串,它们将占用两个不同的内存位置。但是,如果这些字符串是相同的,那么它们将被Python自动合并为一个对象,这就是字符串驻留机制。

Python中的字符串驻留机制是通过使用intern机制来实现的。当我们创建一个字符串时,Python会检查字符串池中是否已经存在相同的字符串。如果是,它将返回现有的字符串对象的引用,而不是创建一个新的对象。这样,我们可以在不占用额外内存的情况下使用相同的字符串。

2 如何使用字符串驻留机制

Python的字符串驻留机制在不同版本之间有一些变化。下面是一些主要的变化:

1.Python 2.x和Python 3.x的字符串驻留机制不同。在Python 2.x中,只有长度为1的字符串才会被驻留。而在Python 3.x中,长度为0到20的字符串都会被驻留。 (更长的田辛老师试过,似乎都可以)

2.在Python 3.7之前,字符串驻留机制只适用于ASCII字符集中的字符串。这意味着只有ASCII字符集中的字符串才会被驻留。但是,在Python 3.7中,这个限制已经被取消,所有字符串都可以被驻留。

3.在Python 3.8中,字符串驻留机制的实现发生了变化。在之前的版本中,字符串池是一个全局的数据结构,所有的字符串都存储在其中。但是,在Python 3.8中,字符串池被改为了一个线程局部的数据结构,每个线程都有自己的字符串池。这样可以提高多线程程序的性能。

需要注意的是,字符串驻留机制是Python的一种优化技术,它并不是Python语言规范的一部分。因此,不同的Python实现(如CPython、Jython、IronPython等)可能会有不同的字符串驻留机制实现。

正是因为上面的变化, 所以有的时候田辛老师觉得字符串驻留在面向内存的时候是友好的, 但确实会给新手带来一些不便。

作为新手, 田辛老师提供一个手动使用字符串驻留的例子:

import sys 

# 使用sys.intern()函数启用字符串驻留机制 
str3 = sys.intern("hello") 
str4 = sys.intern("hello") 

# 使用is关键字比较两个字符串是否相同 
if str3 is str4: 
    print("str3 and str4 are the same object") 
else: 
    print("str3 and str4 are different objects")

上面的例子中,田辛老师使用sys.intern()函数将字符串“hello”添加到字符串池中,并将返回的引用分配给str3和str4。然后,我们再次使用is关键字比较它们是否相同。由于它们是相同的对象,因此输出结果为“str3 and str4 are the same object”。

3 简单拼接驻留, 运行时不驻留

我们来看下面的代码:

str5 = 'tianxin' + 'training'  
print(str5 is 'tianxintraining')  
  
str6 = 'tianxin'  
str7 = 'training'  
print((str6 + str7) is 'tianxintraining')

大家可以猜一猜输出结果是什么? 是两个true,还是一个true一个false?

答案是:

True
False

为什么会出现这种情况呢? 第一个打印,是两个字符串简单拼接, 那么就会实现字符串驻留。 但是, 一旦是变量拼接字符串机制就不能用了。

关于这一点, 田辛老师通过如下代码带领大家查看一下上述两个处理的汇编执行过程:

import dis  
  
  
def pro1():  
    str5 = 'tianxin' + 'training'  
    print(str5 is 'tianxintraining')  
  
  
def pro2():  
    str6 = 'tianxin'  
    str7 = 'training'  
    print((str6 + str7) is 'tianxintraining')  
  
  
print('================================================================')  
dis.dis(pro1)  
print('================================================================')  
dis.dis(pro2)

输出结果:

================================================================
 20           0 LOAD_CONST               1 ('tianxintraining')
              2 STORE_FAST               0 (str5)

 21           4 LOAD_GLOBAL              0 (print)
              6 LOAD_FAST                0 (str5)
              8 LOAD_CONST               1 ('tianxintraining')
             10 IS_OP                    0
             12 CALL_FUNCTION            1
             14 POP_TOP
             16 LOAD_CONST               0 (None)
             18 RETURN_VALUE
================================================================
 25           0 LOAD_CONST               1 ('tianxin')
              2 STORE_FAST               0 (str6)

 26           4 LOAD_CONST               2 ('training')
              6 STORE_FAST               1 (str7)

 27           8 LOAD_GLOBAL              0 (print)
             10 LOAD_FAST                0 (str6)
             12 LOAD_FAST                1 (str7)
             14 BINARY_ADD
             16 LOAD_CONST               3 ('tianxintraining')
             18 IS_OP                    0
             20 CALL_FUNCTION            1
             22 POP_TOP
             24 LOAD_CONST               0 (None)
             26 RETURN_VALUE

进程已结束,退出代码0

我们可以看到, Python的解释器对这种简单的字符串拼接在形成字符码的时候,就已经进行了拼接。 str5 你写不写成拼接的形式都是一样的。

4 总结

Python的字符串驻留机制是一种优化技术,它可以减少内存使用并提高程序的性能。它的做法的基础是Python字符串对象的不可改变的特性。 当然, 不同的Python版本对于字符串驻留机制的处理不同可能会给初学者带来一些麻烦。 Python学习者必须要面对的一个问题。

5 全部代码

上面已经有了关于输出汇编的全部代码, 就不再重新输出了。 只展示字符串驻留部分的代码:

#!/usr/bin/env python  
# -*- coding:utf-8 -*-  
"""  
#-----------------------------------------------------------------------------  
#                     --- TDOUYA STUDIOS ---  
#-----------------------------------------------------------------------------  
#  
# @Project : di08-tdd-cdg-python-learning  
# @File    : str_intern.py  
# @Author  : tianxin.xp@gmail.com  
# @Date    : 2023/4/5 10:34  
#  
# 代码说明  
#  
#--------------------------------------------------------------------------"""  
import sys  
  
a = [1, 2, 3]  
b = [1, 2, 3]  
if a is b:  
    print("a and b point to the same object")  
else:  
    print("a and b point to different objects")  
  
str1 = "hello"  
str2 = "hello"  
  
if str1 is str2:  
    print("str1 and str2 are the same object")  
else:  
    print("str1 and str2 are different objects")  
  
# 使用sys.intern()函数启用字符串驻留机制  
str3 = sys.intern("hello")  
str4 = sys.intern("hello")  
  
# 使用is关键字比较两个字符串是否相同  
if str3 is str4:  
    print("str3 and str4 are the same object")  
else:  
    print("str3 and str4 are different objects")  
  
str5 = 'tianxin' + 'training'  
print(str5 is 'tianxintraining')  
  
str6 = 'tianxin'  
str7 = 'training'  
print((str6 + str7) is 'tianxintraining')

执行结果:警告可忽略

D:\python-grp\miniconda_env\py3.10\python.exe E:\develop\python\di08-tdd-cdg-python-learning\class="lazy" data-src\std_str_intern\str_intern.py 
a and b point to different objects
str1 and str2 are the same object
str3 and str4 are the same object
True
False
E:\develop\python\di08-tdd-cdg-python-learning\class="lazy" data-src\std_str_intern\str_intern.py:44: SyntaxWarning: "is" with a literal. Did you mean "=="?
  print(str5 is 'tianxintraining')
E:\develop\python\di08-tdd-cdg-python-learning\class="lazy" data-src\std_str_intern\str_intern.py:48: SyntaxWarning: "is" with a literal. Did you mean "=="?
  print((str6 + str7) is 'tianxintraining')

进程已结束,退出代码0

到此这篇关于详解Python中神奇的字符串驻留机制的文章就介绍到这了,更多相关Python字符串驻留机制内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

详解Python中神奇的字符串驻留机制

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

详解Python中神奇的字符串驻留机制

字符串驻留机制是Python针对字符串对象采取的一种内存优化技术。其目标是减少内存使用并提高程序的性能。这篇文章主要介绍了字符串驻留机制的简单应用,需要的可以参考一下
2023-05-14

Python中字符串驻留的机制是什么

这篇文章主要介绍“Python中字符串驻留的机制是什么”,在日常操作中,相信很多人在Python中字符串驻留的机制是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python中字符串驻留的机制是什么”的疑
2023-07-05

Python中的字符串驻留

C#中的字符串驻留熟悉.NET的人都应该知道C#中的字符串驻留机制,.NET维护了一个驻留池,它会把在编译期间就相同的字符串只保留一份拷贝。如果仅在运行期间值才相同的字符串变量,.NET不会为这个2个相同的字符串变量指向同一份引用的。不过.
2023-01-31

详解python字符串驻留技术

目录前言1、什么是“字符串驻留”?2、为什么要驻留字符串?3、Python的字符串驻留4、字符串驻留的原理4.1 如何驻留字符串?4.2 如何清理驻留的字符串?5、字符串驻留的实现5.1 变量、常量与函数名5.2 字典的键5.3 任何对象的
2022-06-02

Python中字符串驻留指的是什么

小编给大家分享一下Python中字符串驻留指的是什么,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!python主要应用领域有哪些1、云计算,典型应用OpenSta
2023-06-14

Python字符串怎么创建和驻留机制是什么

本篇内容主要讲解“Python字符串怎么创建和驻留机制是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python字符串怎么创建和驻留机制是什么”吧!字符串  字符串在Python中是基本数
2023-06-29

Python中字符串驻留的原理是什么

这篇文章给大家介绍Python中字符串驻留的原理是什么,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易
2023-06-14

怎么在Python中清理驻留的字符串

这期内容当中小编将会给大家带来有关怎么在Python中清理驻留的字符串,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。python可以做什么Python是一种编程语言,内置了许多有效的工具,Python几乎
2023-06-14

深入 Python 解释器源码,我终于搞明白了字符串驻留的原理!

每种编程语言为了表现出色,并且实现卓越的性能,都需要有大量编译器级与解释器级的优化。

Python中字符串的修改及传参详解

发现问题 最近在面试的时候遇到一个题目,选择用JavaScript或者Python实现字符串反转,我选择了Python,然后写出了代码(错误的):#!/usr/bin/env python #-*-coding:utf-8-*- __aut
2022-06-04

Python中的字符串操作和编码Unicode详解

本文主要给大家介绍了关于 Python中的字符串操作和编码Unicode的一些知识,下面话不多说,需要的朋友们下面来一起学习吧。 字符串类型str:Unicode字符串。采用''或者r''构造的字符串均为str,单引号可以用双引号或者三引号
2022-06-04

深入理解Go语言中的字符串拼接机制

在Go语言中,字符串拼接是开发中经常会遇到的操作。了解Go语言中的字符串拼接机制,能够帮助我们更好地理解其内部工作原理,并有效地优化代码性能。本文将深入探讨Go语言中的字符串拼接机制,并给出具体的代码示例。在Go语言中,字符串是不可变的。
深入理解Go语言中的字符串拼接机制
2024-03-12

PHP7中对十六进制字符串处理的问题详解

本篇文章由PHP7教程栏目给大家介绍一下关于 php7 中 "0xFFFFFFFF" 和 0xFFFFFFFF 的问题。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。具体问题:$t1 = 0x3FFFFFFF & (1 * (0xd5b42e
2021-05-26

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录