我的编程空间,编程开发者的网络收藏夹
学习永远不晚

详解Python中re.sub

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

详解Python中re.sub

详解Python中re.sub


re.sub的功能


re是regular expression的所写,表示正则表达式


sub是substitute的所写,表示替换;


re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能;


举个最简单的例子:

如果输入字符串是:      
inputStr = "hello 111 world 111"


那么你可以通过    
replacedStr = inputStr.replace("111", "222")

去换成  
"hello 222 world 222"


但是,如果输入字符串是:   
inputStr = "hello 123 world 456"


而你是想把123和456,都换成222

(以及其他还有更多的复杂的情况的时候),

那么就没法直接通过字符串的replace达到这一目的了。


就需要借助于re.sub,通过正则表达式,来实现这种相对复杂的字符串的替换:    
replacedStr = re.sub("\d+", "222", inputStr)


当然,实际情况中,会有比这个例子更加复杂的,其他各种特殊情况,就只能通过此re.sub去实现如此复杂的替换的功能了。


所以,re.sub的含义,作用,功能就是:

对于输入的一个字符串,利用正则表达式(的强大的字符串处理功能),去实现(相对复杂的)字符串替换处理,然后返回被替换后的字符串

其中re.sub还支持各种参数,比如count指定要替换的个数等等。


下面就是来详细解释其各个参数的含义。

 
re.sub的各个参数的详细解释


re.sub共有五个参数。

其中三个必选参数:pattern, repl, string

两个可选参数:count, flags

 
第一个参数:pattern

pattern,表示正则中的模式字符串,这个没太多要解释的。

需要知道的是:

    反斜杠加数字(\N),则对应着匹配的组(matched group)  
        比如\6,表示匹配前面pattern中的第6个group    
        意味着,pattern中,前面肯定是存在对应的,第6个group,然后你后面也才能去引用

比如,想要处理:  
hello crifan, nihao crifan

且此处的,前后的crifan,肯定是一样的。


而想要把整个这样的字符串,换成crifanli

则就可以这样的re.sub实现替换:  

inputStr = "hello crifan, nihao crifan";    
replacedStr = re.sub(r"hello (\w+), nihao \1", "crifanli", inputStr);    
print "replacedStr=",replacedStr; #crifanli

 

第二个参数:repl

repl,就是replacement,被替换,的字符串的意思。

repl可以是字符串,也可以是函数。

 
repl是字符串

如果repl是字符串的话,其中的任何反斜杠转义字符,都会被处理的。

即:

    \n:会被处理为对应的换行符;  
    \r:会被处理为回车符;    
    其他不能识别的转移字符,则只是被识别为普通的字符:    
        比如\j,会被处理为j这个字母本身;    
    反斜杠加g以及中括号内一个名字,即:\g<name>,对应着命了名的组,named group


接着上面的举例:

想要把对应的:  
hello crifan, nihao crifan

中的crifan提取出来,只剩:  
crifan


就可以写成:  

inputStr = "hello crifan, nihao crifan";    
replacedStr = re.sub(r"hello (\w+), nihao \1", "\g<1>", inputStr);    
print "replacedStr=",replacedStr; #crifan

 

对应的带命名的组(named group)的版本是:  

inputStr = "hello crifan, nihao crifan";    
replacedStr = re.sub(r"hello (?P<name>\w+), nihao (?P=name)", "\g<name>", inputStr);    
print "replacedStr=",replacedStr; #crifan

 
repl是函数

举例说明:

比如输入内容是:  
hello 123 world 456

想要把其中的数字部分,都加上111,变成:  
hello 234 world 567

那么就可以写成:    

#!/usr/bin/python    
# -*- coding: utf-8 -*-
      
import re;      
def pythonReSubDemo():        
"""            demo Pyton re.sub        
"""        
inputStr = "hello 123 world 456";             

def _add111(matched):            
intStr = matched.group("number"); 
#123            
intValue = int(intStr);            
addedValue = intValue + 111; 
#234            
addedValueStr = str(addedValue);            
return addedValueStr;                 
replacedStr = re.sub("(?P<number>\d+)", _add111, inputStr);        
print "replacedStr=",replacedStr; 
#hello 234 world 567

if __name__=="__main__":       
pythonReSubDemo();

 
第三个参数:string

string,即表示要被处理,要被替换的那个string字符串。

没什么特殊要说明。

 
第四个参数:count

举例说明:

继续之前的例子,假如对于匹配到的内容,只处理其中一部分。

比如对于:  
hello 123 world 456 nihao 789

只是像要处理前面两个数字:123,456,分别给他们加111,而不处理789,

那么就可以写成:  

#!/usr/bin/python    
# -*- coding: utf-8 -*-      

import re;      
def pythonReSubDemo():        
"""            demo Pyton re.sub        
"""        
inputStr = "hello 123 world 456 nihao 789";   
          
def _add111(matched):            
intStr = matched.group("number"); 
#123            
intValue = int(intStr);            
addedValue = intValue + 111; 
#234            
addedValueStr = str(addedValue);            
return addedValueStr; 
                
replacedStr = re.sub("(?P<number>\d+)", _add111, inputStr, 2);        
print "replacedStr=",replacedStr; 
#hello 234 world 567 nihao 789

if __name__=="__main__":       
pythonReSubDemo();

 
第五个参数:flags

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

详解Python中re.sub

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

详解Python中re.sub

详解Python中re.subre.sub的功能re是regular expression的所写,表示正则表达式sub是substitute的所写,表示替换;re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的r
2023-01-31

Python中re.findAll()、re.sub()、set()的使用

本文主要介绍了Python中re.findAll()、re.sub()、set()的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-05-18

Python中的re.findAll()、re.sub()、set()如何使用

本文小编为大家详细介绍“Python中的re.findAll()、re.sub()、set()如何使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python中的re.findAll()、re.sub()、set()如何使用”文章能帮助
2023-07-06

Python中str.format()详解

1. str.format 的引入在 Python 中,我们可以使用 + 来连接字符串,在简单情况下这种方式能够很好的工作。但是当我们需要进行复杂的字符串连接时,如果依然使用 + 来完成,不仅会使代码变得晦涩难懂,还会让代码变得难以维护,此
2022-06-04

Python 中的 else详解

我们都知道 Python 中else的基本用法是在条件控制语句中的 if...elif...else...,但是 else 还有两个其它的用途,一是用于循环的结尾,另一个是用在错误处理的 try 中。这原本是 Python 的标准语法,但由
2022-06-04

python中的unicode详解

Unicode是一种字符编码标准,它定义了世界上几乎所有字符的唯一编号和名称。Unicode编码标准旨在解决传统字符编码标准(如ASCII)的局限性,使得不同语言和字符集可以在同一个文本中混合使用。在Python中,字符串默认使用Unico
2023-09-23

Python中的functoolspartial详解

这篇文章主要介绍了Python中functoolspartial详解,本文通过示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-01-18

python unicode详解 python中的unicode

在Python中,Unicode是一种字符编码标准,它为全球范围内的所有字符提供了唯一的标识符。Unicode编码由一个固定的编码空间组成,目前包含超过130,000个字符,涵盖了几乎所有的语言和符号。在Python 3中,默认的字符串类型
2023-08-24

Python 中 Meta Classes详解

接触过 Django 的同学都应该十分熟悉它的 ORM 系统。对于 python 新手而言,这是一项几乎可以被称作“黑科技”的特性:只要你在models.py中随便定义一个Model的子类,Django 便可以:获取它的字段定义,并转换成表
2022-06-04

python中list方法详解

list是Python中的一种内置数据类型,代表一个可变的有序序列。list类型的对象可以使用多个方法来操作和修改其中的元素。文中通过代码示例详细介绍了list的常用方法,感兴趣的同学可以参考阅读
2023-05-17

Python中模块string.py详解

一、用法字符串常量:import stringprint(string.ascii_lowercase) print(string.ascii_uppercase) print(string.ascii_letters) print(str
2022-06-04

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录