我的编程空间,编程开发者的网络收藏夹
学习永远不晚

解读python正则表达式括号问题

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

解读python正则表达式括号问题

python正则表达式括号

python中re库函数的简单用法

re.findall(pattern,string)
  • 匹配所有符合正则表达式的字符,返回一个列表
re.search(pattern,string)
  • 查找第一个符合正则表达式的字符,返回一个Matcher对象。用group()或groups()方法取值
re.match(pattern,string)
  • 查找第一个符合正则表达式的字符,要求完全符合,返回一个Matcher对象。用group()或groups()方法取值

正则表达式中的圆括号()的作用是对字符或元字符分组。

我错把它的作用认为是将圆括号内的字符看成一个整体。

尽管在一些正则测试网站上,进行匹配时,把括号内的字符看成一个整体来匹配也能匹配到想要的结果。测试网站如:regex101等

然而在在写python程序的时候,会出现不是我想要的结果。

如果正则表达式中多出使用了圆括号进行分组的话。

在使用findall方法匹配结果就会只有分组的结果(即括号内表达式匹配的内容),而不是整个表达式所匹配的内容。

如果使用search方法匹配,对返回的Matcher对象调用group()方法可以获取完整的结果。但是在需要匹配多个结果时,还得用findall

所以在使用正则表达式时,若像我不太熟悉的话,避免使用圆括号来把一段表达式看成一个整体。

python正则表达式入门教程括号及字符

数据分析遇到字符串处理会有两个阶段涉及到正则表达式,一个是在数据库阶段一个是Python处理阶段。作为一个小白学习正则也遇到很多弯路和难理解的点,梳理梳理学习的过程。

hive里面正则表达式可以用regexp_extract()在select里进行返回指定要求的内容,也可以用regexp在where里进行指定要求的限制条件;

python里面re.findall()或者df.str.extract()(pandas功能);

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。学习正则需要记住两类知识点加上实际案例的联系就能很快的理解和掌握。

正则中语法规范:

括号区别

正则表达式中存在(),[],{}

1、():匹配小括号内的字符串,可以是一个,也可以是多个,常跟“|”(或)符号搭配使用,是多选结构的。() 是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串

例: 

string=‘我正在学习python3的正则表达式,现在的日期是2019-01-22’
目的给定指定字符串进内容进行精准匹配获取python
hiveselect regexp_extract(string,’(python)’,1) 返回结果为:python,1代码返回正则的第几个括号中的内容
pythonre.findall(’(python)’,string)返回结果为:python

2、【】:匹配字符组内的字符,比如咱们常用的[0-9a-zA-Z.*?!]等,在[]内的字符都是字符,不是元字符,比如“0-9”、“a-z”这中间的“-”就是连接符号,表示范围的元字符,如果写成[-!?*(]这样的话,就是普通字符例:

string=‘我正在学习python3的正则表达式,现在的日期是2019-01-22’
目的给定字符进内容匹配获取python
hiveselect regexp_extract(string,’[a-z]’,0) 返回结果为:python,0代码返回符合正则的内容,如果有小括号可以写1(如'([a-z]+)')
pythonre.findall(’[a-z]+’,string)返回结果为:python
目的给定字符进内容匹配获取日期2019-01-22
hiveselect regexp_extract(string,’([0-9]+.[0-9]+.[0-9]+)’,1) 返回结果为:2019-01-22
pythonre.findall(’[0-9]+.[0-9]+.[0-9]+’,string)返回结果为:2019-01-22
需求增加如果我要只需日期22这个部分
pythonre.findall(’[0-9]+.[0-9]+.([0-9]+)’,string)返回结果为:22,和上面的对比发现在最后一个[0-9]+外面加了一个小括号,有小括号就返回小括号里面的内容

3、{ }一般用来表示匹配的长度,比如 \s{3} 表示匹配三个空格,\s{1,3}表示匹配一到三个空格例:

string=‘我正在学习python3的正则表达式,现在的日期是2019-01-22’
目的取出日期数据部分结果为2019,01,22
pythonre.findall(’([0-9]{2,4})’,string) 返回结果为:[2019,01,22],python3中到3是一个数字,所以指定数据个数为2-4的就为日期部分的数字

常用正则表达式

匹配名匹配表达式例子
转义符\“n”匹配字符“n”。"\n"匹配一个换行符。串行"\\"匹配"\"而"\("则匹配"("
开始位置^"abc,bac"匹配b开头的bac[^b]([a-z]{3})
结束位置$"abce,abcd"匹配d结尾字母[a-z]+d$
表达式0次或多次* 
表达式1次或多次+ 
表达式0次或1次 
除\n任意字符. 
单词边界\b“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”
非单词边界\B“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”
换页符\f 
空白行\n\s*\r 
首尾空白字符^\s*\s*$
中文字符[\u4e00-\u9fa5] 
双字节字符(包含汉子在内)[^\x00-\xff] 
数字[0-9]或\d 
非数字\D 
小写字母[a-z] 
大写字母[A-Z] 
大小写字母[a-zA-Z] 
英文加数字a-z0-9 

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

解读python正则表达式括号问题

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

理解python正则表达式

在python中,对正则表达式的支持是通过re模块来支持的。使用re的步骤是先把表达式字符串编译成pattern实例,然后在使用pattern去匹配文本获取结果。 其实也有另外一种方式,就是直接使用re模块的方法,但是这样就不能使用编译后的
2022-06-04

Python正则表达式实现截取成对括号的方法

本文实例讲述了Python正则表达式实现截取成对括号的方法。分享给大家供大家参考,具体如下:strs = '1(2(3(4(5(67)6)7)8)9)0' reg1 = re.compile('([()])') #一对括号 reg2 = r
2022-06-04

Python中使用正则表达式及正则表达式匹配规则详解

这篇文章主要介绍了Python中使用正则表达式以及正则表达式匹配规则,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-03-22

正则表达式-问号的四种用法

问号在正则表达式中有四种常见的用法:1. 匹配零个或一个字符:在正则表达式中使用问号表示前面的字符或子表达式可选,即出现零次或一次。例如,表达式"a?b"可以匹配"b"、"ab"和"aab"。2. 非贪婪匹配:在正则表达式中使用问号可以将贪
2023-09-02

正则表达式如何获取括号里的内容

在正则表达式中,可以使用圆括号来指定一个子表达式。子表达式可以用于分组、捕获和引用。要获取括号里的内容,可以使用捕获组。捕获组是由括号内的表达式定义的,可以通过捕获组的索引或名称来引用它们的内容。以下是一些示例:1. 使用括号捕获整个字符串
2023-08-18

正则表达式中问号怎么使用

在正则表达式中,问号有两种不同的用法:1. 非贪婪匹配:在量词后面加上问号,表示尽可能少地匹配。例如,"/a+?/"将匹配一个或多个连续的"a"字母,并且只匹配尽可能少的"a"。2. 零次或一次匹配:在某个字符或字符组之后加上问号,表示该字
2023-08-11

Python中正则表达式详解

基础篇 正则表达式在python中运用的非常多,因为他可以进行任意的匹配,可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re 在一些工程中我们会经常调用正则的库来做与匹配相关的问题。 字符串是编程时涉及到
2022-06-04

Python正则表达式对象怎么解决相关问题

本篇内容主要讲解“Python正则表达式对象怎么解决相关问题”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python正则表达式对象怎么解决相关问题”吧!产生方式:通过re.compile(pa
2023-06-17

正则表达式怎么匹配多个括号中的值

可以使用正则表达式的分组功能来匹配多个括号中的值。具体步骤如下:1. 使用圆括号 `()` 将需要匹配的内容包裹起来,形成一个分组。2. 使用 `|` 或运算符将多个分组连接起来,表示匹配其中任意一个分组。3. 使用 `\` 转义字符来匹配
2023-08-18

Python中常见的正则表达式问题及解决方法

Python中常见的正则表达式问题及解决方法正则表达式是一种强大的文本匹配工具,在Python中使用正则表达式可以高效地处理字符串操作。但是,由于正则表达式语法较为复杂,常常会遇到一些问题。本文将介绍一些常见的正则表达式问题,并提供相应的解
2023-10-22

如何在Python中处理正则表达式的问题

如何在Python中处理正则表达式的问题,需要具体代码示例正则表达式是一种用于匹配和处理文本的强大工具。在Python中,可以使用内置的re模块来处理正则表达式。本文将介绍如何在Python中利用正则表达式进行文本处理,并提供具体的代码示例
2023-10-22

C#正则表达式之Ismatch()的用法解读

这篇文章主要介绍了C#正则表达式之Ismatch()的用法,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-05-18

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录