我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python中正则表达式及其常用匹配函数有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python中正则表达式及其常用匹配函数有哪些

这篇文章主要介绍Python中正则表达式及其常用匹配函数有哪些,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。

/简介/

Python 自1.5版本起增加了re 模块,它提供 Perl风格的正则表达式模式。re 模块使得Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。

/re.match函数/

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。语法如下所示:

re.match(pattern, string, flags=0)

“pattern”匹配的正则表达式“string”要匹配的字符串“flags”标志位。

匹配成功re.match方法返回一个匹配的对象,否则返回None。

我们可以使用group(num)或 groups() 匹配对象函数来获取匹配表达式。

group(num=0) 匹配的整个表达式的字符串,“group()”可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。

下图是个实际例子:

Python中正则表达式及其常用匹配函数有哪些

输出结果如下图所示:

Python中正则表达式及其常用匹配函数有哪些

/检索和替换/

Python 的re模块提供了re.sub用于替换字符串中的匹配项。语法如下所示:

re.sub(pattern, repl, string, count=0, flags=0)

参数:

pattern : 正则中的模式字符串。

repl : 替换的字符串,也可为一个函数。

string : 要被查找替换的原始字符串。

count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。

flags : 编译时用的匹配模式,数字形式。

前三个为必参数,后两个为可选参数。

下图是个实际例子:

Python中正则表达式及其常用匹配函数有哪些

输出结果如下图所示:

Python中正则表达式及其常用匹配函数有哪些

/compile函数/

compile 函数用于编译正则表达式,供match() 和 search() 这两个函数使用。语法格式为:

re.compile(pattern[, flags])

参数:

pattern : 一个字符串形式的正则表达式

flags 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

re.I 忽略大小写

re.L 表示特殊字符集 \w,\W, \b, \B, \s, \S 依赖于当前环境

re.M 多行模式

re.S 即为' . '并且包括换行符在内的任意字符(' . '不包括换行符)

re.U 表示特殊字符集 \w,\W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库

re.X 为了增加可读性,忽略空格和'# '后面的注释

/正则表达式对象/

re.RegexObject:re.compile() 返回RegexObject 对象。

re.MatchObject:group() 返回被 RE 匹配的字符串。

start() 返回匹配开始的位置

end() 返回匹配结束的位置

span() 返回一个元组包含匹配 (开始,结束) 的位置

/正则表达式修饰符 - 可选标志/

正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I| re.M 被设置成 I 和 M 标志:

Python中正则表达式及其常用匹配函数有哪些

/正则表达式模式/

模式字符串使用特殊的语法来表示一个正则表达式:

字母和数字表示他们自身。一个正则表达式模式中的字母和数字匹配同样的字符串。

多数字母和数字前加一个反斜杠时会拥有不同的含义。

标点符号只有被转义时才匹配自身,否则它们表示特殊的含义。

反斜杠本身需要使用反斜杠进行转义。

由于正则表达式通常都包含反斜杠,所以你最好使用原始字符串来表示它们。模式元素(如 r'\t',等价于 \\t )匹配相应的特殊字符。

下表列出了正则表达式模式语法中的特殊元素。如果你使用模式的同时提供了可选的标志参数,某些模式元素的含义会改变。

Python中正则表达式及其常用匹配函数有哪些

正则表达式实例

字符匹配

Python中正则表达式及其常用匹配函数有哪些

字符类

Python中正则表达式及其常用匹配函数有哪些

/实际应用/

以猫眼电影为例。我们需要获取(电影的名字作者,上映时间)等等都可以用正则表达式来解析。

Python中正则表达式及其常用匹配函数有哪些

分析一下,利用正则表达式提取。

Python中正则表达式及其常用匹配函数有哪些

可以看到我们要的名字在一个a里面,而他们被一个div包裹着。

我们把div想象成一个盒子,可以看到div里面还有一个div 我们可以先找他上面一层的div是一个表单<dl class=”movie_item_info”>再找到它的上一层的盒子div<div class= ”board-iten-main” >一般来说我们找到前两层就可以找到我们要的结果。如果不对就再找几层。

分析完再实际操作一下:

pattern = re.compile('<div>.*?title="(.*?)".*?class="star">(.*?)</p>.*?releasetime">(.*?)</p>',re.S)

(.*?)表示我们要的内容<p class=”star”>(.*?)</p>里面的主演也是我们要的这样我们就可以得到我们想要得多个数据。

/小结/

正则表达式适合一些需要获取多个数据的场景。它能够以更快捷的方式去获取到我们想要的数据。

本Python教程主要介绍了正则表达式,及其基本用法,具体每个字符的用法,可以参考前言里边的正则表达式系列文章,希望能够帮助大家更好的了解正则表达式的用法。

以上是“Python中正则表达式及其常用匹配函数有哪些”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网行业资讯频道!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python中正则表达式及其常用匹配函数有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python中正则表达式及其常用匹配函数有哪些

这篇文章主要介绍Python中正则表达式及其常用匹配函数有哪些,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。/简介/Python 自1
2023-06-01

Python中使用正则表达式及正则表达式匹配规则详解

这篇文章主要介绍了Python中使用正则表达式以及正则表达式匹配规则,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-03-22

正则表达式的匹配规则有哪些

正则表达式的匹配规则有以下几种:1. 字符匹配:使用普通字符来匹配输入的相应字符。2. 通配符匹配:使用特殊字符来匹配任意一个字符。3. 字符类匹配:使用字符类来匹配某个字符集合中的任意一个字符。4. 反向字符类匹配:使用反向字符类来匹配不
2023-09-26

PHP中的preg_match()函数用于正则表达式匹配

PHP是一种常用的服务器端编程语言,其内置函数中包含了许多强大的功能,其中一个非常重要的函数就是preg_match()函数。该函数用于正则表达式匹配,能够帮助开发者快速有效地处理字符串数据。本文将为大家介绍preg_match()函数的具
PHP中的preg_match()函数用于正则表达式匹配
2023-11-18

正则表达式常用规则有哪些

这篇文章将为大家详细讲解有关正则表达式常用规则有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。我们来看一下正则常用规则:一张图足以说明一切,哈哈哈!!方法:find()查找findall()查找所有内
2023-06-20

Python3常用正则表达式有哪些

这篇文章主要介绍“Python3常用正则表达式有哪些”,在日常操作中,相信很多人在Python3常用正则表达式有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python3常用正则表达式有哪些”的疑惑有所
2023-06-19

Python正则表达式匹配中文用法示例

本文实例讲述了Python正则表达式匹配中文用法。分享给大家供大家参考,具体如下:#!/usr/bin/python #-*- coding:cp936-*-#思路,将str转换成unicode,方可用正则表达式,前提是,要知道文件的编码,
2022-06-04

.net中常用的正则表达式有哪些

这篇文章主要讲解了“.net中常用的正则表达式有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“.net中常用的正则表达式有哪些”吧!一、匹配字符串正则1 //正则1
2023-06-30

Python正则表达式匹配字符串中的数字

这篇文章主要介绍了Python正则表达式匹配字符串中的数字,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下1.使用“\d+”匹配全数字
2023-06-01

Python中的正则表达式有哪些

这篇文章给大家介绍Python中的正则表达式有哪些,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。什么是正则表达式?正则表达式(Regular Expression)通常被用来检索、替换那些符合某个模式(规则)的文本。此
2023-06-08

Python中怎么利用正则表达式匹配子串

本篇文章给大家分享的是有关Python中怎么利用正则表达式匹配子串,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。获取Python正则表达式所匹配的子串(Get the part
2023-06-17

怎么使用PHP中全局正则表达式匹配及匹配数组元素

这篇文章主要介绍“怎么使用PHP中全局正则表达式匹配及匹配数组元素”,在日常操作中,相信很多人在怎么使用PHP中全局正则表达式匹配及匹配数组元素问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么使用PHP中全
2023-06-25

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录