我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python 正则表达式

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python 正则表达式

正则表达式的作用:用来匹配字符串

一、字符串方法

字符串提供的方法是完全匹配,不能进行模糊匹配
s = 'hello world'

# 字符串提供的方法是完全匹配,不能进行模糊匹配
print(s.find('ll'))  # 2   查找ll的位置,输出的是第一个l的位置   
ret = s.replace('ll', 'xx')   # 替换,用ll 替换为 xx
print(ret)   # hexxo world   
print(s.split('w'))   # ['hello ', 'orld']   分割:以w为界限,分割为前后两部分,存在列表中

二、正则表达式

正则的方法:
1、findall() :所有结果返回到一个列表里
2、search() :返回匹配到的第一个对象,对象可以调用group()返回结果
3、match() :只在字符串开始匹配,也返回一个对象,可调用group()
findall() 方法:

1、正则表达式可以进行模糊匹配:

ret = re.findall(r'w\w{2}l', 'hello world')    # 匹配字符串中w开头l结尾中间有两个字符的词
# (加r,声明是原生字符串,避免字符串转义)
print(ret)      # ['worl']

2、元字符

  • “.”  通配符:可以代指除换行符之外的所有字符,一个通配符只能代指任意一个字符
ret = re.findall('w..l', 'hello world')    # 匹配字符串中w开头l结尾中间有两个字符的字符串
print(ret)      # ['worl']
  • “^” 上尖角号,只在字符串开始的位置匹配匹配
ret = re.findall('^h..o', 'hjklshllo')  # 只在字符串的开始位置进行匹配,匹配不上就结束,不匹配后面的内容
print(ret)    # []

ret = re.findall('^h..o', 'hjkoshllo')
print(ret)    # ['hjko']
  • “$”符, 只在字符串结尾匹配
ret = re.findall('h..o$', 'hjkoshllo')
print(ret)    # ['hllo']

ret = re.findall('h..o$', 'hjkoshlyto')
print(ret)    # []
  • “*”号,重复匹配(*还可以代指0个) ,*代指的个数是0到无穷
ret = re.findall('h.*o', 'hjkoshlytg')      # *表示重复前面多个.  既只要是以h开头o结尾的都行
print(ret)      # ['hjko']

ret = re.findall('h*', 'hhhhjlhl')        # 匹配多个h
print(ret)      # ['hhhh', '', '', 'h', '', '']

ret = re.findall('ah*', 'sdahhh')       # 贪婪匹配,既按最多的匹配
print(ret)      # ['ahhh']

ret = re.findall('ah*?', 'sdahhh')     # 后加?变为惰性匹配,既按最少的匹配
print(ret)      # ['a']
  • “+”号,重复匹配,同*,但是个数最少为1个,如果是0个匹配不了,范围是1到无穷
ret = re.findall('ah+', 'asdahhhjlhl')   # 匹配以ah开头的内容
print(ret)    # ['ahhh']

ret = re.findall('a+b', 'aaabsdbhbhabj')
print(ret)    # ['aaab', 'ab']
  • “?”号,匹配的范围是[0, 1]个
ret = re.findall('a?b', 'aaabsdhbhabj')   # 匹配[0, 1]个a
print(ret)      # ['ab', 'b', 'ab']
  • “{}”大括号,自定义匹配的次数
ret = re.findall('a{2}b', 'aaabhaabhab')   # 匹配2个a开头,b结尾共3位的字符
print(ret)  # ['aab', 'aab']

ret = re.findall('a{1,3}b', 'aaaabfaabhhab')   # 匹配1-3个a,以b结尾的字符
# 注意:{1,3} 之间不能有空格,不能写成{1, 3}
print(ret)  # ['aaab', 'aab', 'ab']

ret = re.findall('a{1, }b', 'aaaaaaaab')   # {1,} 什么都不加默认匹配的是正无穷
print(ret)      # ['aaaaaaaab']

ret = re.findall('a{1,3}b', 'aaaab')   # 匹配1-3个a,贪婪匹配原则,既默认按多的匹配
print(ret)  # ['aaab']

3、字符集

    取消元字符的特殊功能   
  • []
ret = re.findall('a[dc]b', 'adb')      # 匹配既可以是adb也可以是acb,只能2选一,注意[]里面不用逗号隔开
print(ret)  # ['adb']

ret = re.findall('[a-z]', 'adb')       # 表示一个范围
print(ret)  # 'a', 'd', 'b']

[]字符集还有取消元字符的特殊功能,(\ ^ -)例外:

ret = re.findall('[w,.]', 'awdb')     # .此时不是元字符,无特殊意义,而是一个普通的字符
print(ret)    # ['w']

ret = re.findall('[w,,]', 'awdb')
print(ret)     # ['w']
“^”放在[]里面,表示取反:
ret = re.findall('[^w]', 'awdb')   # 匹配除W以外的所有字符
print(ret)  # ['a', 'd', 'b']

ret = re.findall('[^1,4]', 'a1wd42b')   # 注:取反的是(1,4) 整体
print(ret)  # ['a', 'w', 'd', '2', 'b']

4、\ 字符集

反斜杠后跟元字符去除特殊功能;反斜杠后跟普通字符实现特殊功能
"""
\d 匹配十进制数;相当于类[0-9]
\D 匹配任意非数字字符;相当于类[^0-9]
\s 匹配任意空白字符;相当于类[\t\n\r\f\v]
\S 匹配任何非空白字符;相当于类[^ \t\n\r\f\v]
\w 匹配任意字母数字字符;相当于类[a-zA-Z0-9]
\W 匹配任何人非字母数字字符;相当于类[^a-zA-Z0-9]
\b: 匹配一个特殊字符的边界,就是单词和空格间的位置
"""
ret = re.findall(r'\d{8}', 'qeqwe45454455qws1245')
print(ret)     # ['45454455']  只能匹配到1组,因为后面数字的不够8位

ret = re.findall(r'\d{8}', 'qeqwe45454455qws12456541')
print(ret)      # ['45454455', '12456541']  匹配到2组,

ret = re.findall(r'\D{4}', 'qeqwe4555qws41')   # 大括号里面的数字4代表的是4个字符一组
print(ret)     # ['qeqw']

ret = re.findall(r'\s', 'we4 g1')         # 匹配空白符
print(ret)      # [' ']

ret = re.findall(r'\sw', 'ws4 wsg1')       # 匹配空白符加w
print(ret)      # [' w']

ret = re.findall(r'\w', 'w4 g1')   # 匹配空白符
print(ret)      # ['w', '4', 'g', '1']

ret = re.findall(r'hello\b', 'hello, you is cat? ')   # 匹配出你想要的且是一个单词的内容
print(ret)      # ['hello']

search() 方法:     匹配出第一个满足条件的结果

ret = re.search('lo', 'hello, youlo? ')   # 匹配出你想要的且是一个单词的内容
print(ret)   # <_sre.SRE_Match object; span=(3, 5), match='lo'>
print(ret.group())   # lo

ret = re.search('a.', 'asd')
print(ret.group())   # as

ret = re.search(r'a\.', 'asd')   # 报错,因为被索引字符串里面没有"."

print(ret.group())   # AttributeError: 'NoneType' object has no attribute 'group'

ret = re.search(r'a\.', 'a.sd')
print(ret.group())   # a.

ret = re.search(r'a\+', 'a+sd')
print(ret.group())   # a+
ret = re.search(r'\\c', r'asd\c')   # \\不加r会报错
print(ret.group())   # \c

ret = re.search(r'\\', r'asd\c')   # \\不加r会报错
print(ret.group())   # \

注意:加r是告诉python解释器,\\就是原生字符,不需要转义,就直接把2个\送给re模块

ret = re.search('\\\\', r'asd\c')   # 等同于上面的语句,
print(ret.group())   # \c

注意:因为在python解释器里面\也是有特殊意义的,所以当传入4个\时,python解释器通过转义,变为2个\,然后传给re模块;在re模块里面,\同样是有特殊意义,所以把2个\转义为1个\,然后进行匹配

5() :分组    |:或

ret = re.search('(as)+', r'asasd\c')   # 匹配括号里面一个组的字符,而不是单个字符
print(ret.group())   # asas

ret = re.findall(r'www.(\w+).com', 'www.123swd.com')   # 涉及到组时,只会把组里面的内容匹配出来
print(ret)   # ['123swd']

ret = re.findall(r'www.(?:\w+).com', 'www.123swd.com')   # 加问号冒号(?:)取消组的优先级
print(ret)   # ['www.123swd.com']

ret = re.search('(as)|', r'asd35')   # 匹配括号里面一个组的字符,而不是单个字符
print(ret.group())   # as

ret = re.search('(as)|3', r'asd35')   # as或3,优先匹配第一个,谁在前输出谁
print(ret.group())   # as

ret = re.search('(as)|3', r'3as5e')
print(ret.group())   # 3

三、稍复杂一点儿的正则

ret = re.search(r'(?P<id>\d{3})', 'asdsf124c4vss7').group('id')  # 给匹配到的三个数字起一个名字,叫id;?<名字>是固定写法
print(ret)      # 124

# 后面匹配项只能是 '数字/数字或字母' 的形式,/前的一个字符一定不能为字母
ret = re.search(r'(?P<id>\d{3})/(?P<name>\w{3})', 'wa124/bug')
print(ret.group())      # 124/bug
print(ret.group('id'))      # 124
print(ret.group('name'))    # bug

ret = re.match('asd', 'sdsasd')
print(ret)    # None

ret = re.split('s', 'qwesdc')   # 通过s对后面的字符串进行分割
print(ret)  # ['qwe', 'dc']

ret = re.split('[eh]', 'qwesdhtrc')   # 先通过e对后面的字符串进行分割,然后通过h对前面分割开的两部分继续分割
print(ret)  # ['qw', 'sd', 'trc']

ret = re.split('[eh]', 'hqwesdhtrc')
print(ret)  # ['', 'qw', 'sd', 'trc']   列表第一个元素为空,是因为字符串h前面没有其他的字符

ret = re.sub('臭猪', '小baby', '双双是臭猪')    # ('原内容', '新内容', '对象')
print(ret)  # 双双是小baby

ret = re.subn('臭猪', '小baby', '双双是臭猪,小臭猪')    # ('原内容', '新内容', '对象'),该方法会输出替换的次数
print(ret)  # ('双双是小baby,小小baby', 2)

ret = re.sub('q..s', 's..z', 'zaqwesf')    # ('原内容', '新内容', '操作对象')
print(ret)  # zas..zf


ret = re.findall(r'\.com', 'adsdas.comasdaf')
print(ret)      # ['.com']

obj = re.compile(r'\.com')   # 为了避免重复,把规则编译为一个对象,下次使用只需调用对象即可
ret = obj.findall('adsdas.comasdaf')   # 等价于 re.findall(r'\.com', 'adsdas.comasdaf')
print(ret)      # ['.com']

ret = re.finditer(r'\d', 'a2da7f')   # 把结果封装为一个迭代器,既此时ret为一个迭代器
print(ret)      # <callable_iterator object at 0x000001E3DDFF1320>
print(next(ret))    # <_sre.SRE_Match object; span=(1, 2), match='2'>
print(next(ret).group())    # 2

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python 正则表达式

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python 正则表达式

正则表达式的作用:用来匹配字符串 一、字符串方法字符串提供的方法是完全匹配,不能进行模糊匹配s = 'hello world'# 字符串提供的方法是完全匹配,不能进行模糊匹配print(s.find('ll')) # 2 查找ll的位
2023-01-30

python正则表达式

笔记:一:简介 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 主要介绍Python中常用的正则表达式处理函数 提高工作效率,完成内置函数无法完成的任务! 搜索常用正则表达式!--
2023-01-30

Python 正则表达式:split

作用:用正则表达式的字符分割字符串,正则的字符会被抛弃。本文以 提取URL的地址与参数 为例,介绍re模块的split的用法: 返回值 -> 列表复杂匹配 = re.compile(正则表达式): 将正则表达式实例化            
2023-01-31

Python 正则表达式:compile

本文以匹配×××ID为例,介绍re模块的compile与match的用法复杂匹配 = re.compile(正则表达式): 将正则表达式实例化             +        re.match(要匹配的字符串): 从字符串开 头/
2023-01-31

Python正则表达式:十个正则表达式应用实例

在Python中,通过re模块,我们可以轻松地进行模式匹配、搜索、替换等操作。本文将通过15个实例,从基础到进阶,让你掌握Python正则表达式的实用技巧。

Python 正则表达式:search

本文介绍re模块的search的用法复杂匹配 = re.compile(正则表达式): 将正则表达式实例化             +        re.search(要匹配的字符串): 从字符串开头 开始匹配简单匹配 = re.sear
2023-01-31

在python正则表达式中是怎样正确使用正则表达式

这篇文章将为大家详细讲解有关在python正则表达式中是怎样正确使用正则表达式,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。现在我们已经看了一些简单的正则表达式,那么我们实际在 Python
2023-06-17

Python中使用正则表达式及正则表达式匹配规则详解

这篇文章主要介绍了Python中使用正则表达式以及正则表达式匹配规则,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-03-22

Python中的正则表达式

正则表达式 是包含文本和特殊字符的字符串, 为高级的文本模式匹配, 抽取, 与文本形式的搜索和替换功能提供了基础Python通过标准库re模块来支持正则表达式模式匹配的两种方法完成匹配(模式匹配)搜索(search())匹配(match()
2023-01-31

Python正则表达式分组

这篇文章主要介绍了Python正则表达式分组,命名分组,后向引用,前向否定断言、后向否定断言需要的朋友可以参考下
2022-12-19

Python正则表达式 re(regul

1. 点..: 代表一个字符 (这个跟linux的正则表达式是不同的,那里.代表的是后面字符的一次或0次出现)2. 转义\\或者r'\': 如 r'python\.org' (对.符号的转义)3. ^ 非或叫做排除如[^abc]: 任何以非
2023-01-31

python学习--正则表达式

正则表达式是一种用来匹配字符串的强有力的工具它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。Python支持的正则表达式元字符和语法:语法说明实例完整匹配的字
2023-01-31

Python正则表达式大全

正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。

理解python正则表达式

在python中,对正则表达式的支持是通过re模块来支持的。使用re的步骤是先把表达式字符串编译成pattern实例,然后在使用pattern去匹配文本获取结果。 其实也有另外一种方式,就是直接使用re模块的方法,但是这样就不能使用编译后的
2022-06-04

Python 08 re 正则表达式

. 匹配除换行符以外的任意字符\w 匹配字母或数字或下划线或汉字\s 匹配任意的空白符\d 匹配数字\b 匹配单词的开始或结束^ 匹配字符串的开始$ 匹配字符串的结束 代码/语法 说明* 重复零次或更多次+ 重复一次或更多次? 重复零次或一
2023-01-31

正则表达式

2019-01-16作用 :    路由匹配,表单信息的验证  (字符串匹配)信息提取(在大段文本中提取信息,爬虫)字符串的提取和校验[]在中括号内匹配任意项  [^]不匹配中括号中的任意一项    [0-9]  0123...9   [a
2023-01-30

python 关于正则表达式re

  1.正则表达式 re  典型的搜索和替换操作要求您提供与预期的搜索结果匹配的确切文本。虽然这种技术对于对静态文本执行简单搜索和替换任务可能已经足够了,但它缺乏灵活性,若采用这种方法搜索动态文本,即使不是不可能,至少也会变得很困难。  通
2023-06-02

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录