Python正则表达式中的量词符号与组问题小结

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

正则表达式中的符号

在这里插入图片描述

例子

| 是或的关系，只要存在就会被捕获
匹配到的数据只按字符串顺序返回，而不是按照匹配规则返回


In [18]: data = 'insane@loafer.com'

In [19]: print(re.findall('insane|com|loafer', data))
['insane', 'loafer', 'com']

^ 等同于 \A


In [20]:  print(re.findall('^insane',data))
['insane']

In [21]:  print(re.findall('^insane1',data))
[]

$ 等同于 \Z


In [22]:  print(re.findall('com$',data))
['com']

In [23]:  print(re.findall('net$',data))
[]

* 匹配0次或多次


In [24]:  print(re.findall('\w*',data))
['insane', '', 'loafer', '', 'com', '']

+ 匹配1次或多次
w+ 匹配1次或多次数字或字母
@和.属于0次范围，不会被匹配出来


In [25]:  print(re.findall('\w+',data))
['insane', 'loafer', 'com']

{3} 表示对于匹配到的数据只获取3次


In [31]: data = 'insane@loaf.com'

In [32]:  print(re.findall('\w{3}',data))
['ins', 'ane', 'loa', 'com']

In [33]:  print(re.findall('[a-z]{3}',data))
['ins', 'ane', 'loa', 'com']

[a-zA-Z0-9] 基本上等同于 \w

{M, N} 表示对于匹配到的数据只获取M~N次


In [34]: data = 'insane@loaf.com'

In [35]:  print(re.findall('\w{1,4}',data))
['insa', 'ne', 'loaf', 'com']

反例：N 和 M 中间不能有空格


In [36]:  print(re.findall('\w{1, 4}',data))
[]

[^...] 表示不匹配字符集中的字符


In [37]: data = 'insane@loaf.com'

In [38]:  print(re.findall('[^insane]',data))
['@', 'l', 'o', 'f', '.', 'c', 'o', 'm']

组的概念

在这里插入图片描述

组的应用


In [42]: test = 'hello my name is insane'

In [43]: result = re.search('hello (.*) name is (.*)', test)

In [44]: result.groups()
Out[44]: ('my', 'insane')

In [45]: result.groups(1)
Out[45]: ('my', 'insane')

In [46]: result.group(1)
Out[46]: 'my'

In [47]: result.group(2)
Out[47]: 'insane'

贪婪与非贪婪 0次或多次属于贪婪模式
通过?组合变成非贪婪模式实战


#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time     : 2021/8/28 22:13
# @Author   : InsaneLoafer
# @File     : re_test2.py

import re


def check_url(url):
    """
    判断url是否合法
    :param url:
    :return:
    """
    result = re.findall('[a-zA-Z]{4,5}://\w*\.*\w+\.\w+', url)
    if len(result) != 0:
        return True
    else:
        return False

def get_url(url):
    """
    通过组获取url中的某一部分
    :param url:
    :return:
    """
    result = re.findall('[https://|http://](\w*\.*\w+\.\w+)', url)
    if len(result) != 0:
        return result[0]
    else:
        return ''

def get_email(data):
    # result = re.findall('[0-9a-zA-Z_]+@[0-9a-zA-Z]+\.[a-zA-Z]+', data)
    result = re.findall('.+@.+\.[a-zA-Z]+', data)
    return result


html = ('<div class="s-top-nav" style="display:none;">'
        '</div><div class="s-center-box"></div>')

def get_html_data(data):
    """
    获取style中的display:
    使用非贪婪模式
    """
    result = re.findall('style="(.*?)"', data)
    return result

def get_all_data_html(data):
    """
    获取html中所有等号后双引号内的字符
    :param data:
    :return:
    """
    result = re.findall('="(.+?)"', data)
    return result


if __name__ == '__main__':
    result = check_url('https://www.baidu.com')
    print(result)

    result = get_url('https://www.baidu.com')
    print(result, 'https')

    result = get_url('http://www.baidu.com')
    print(result, 'http')

    result = get_email('insane@163.net')
    print(result)

    result = get_html_data(html)
    print(result)

    result = get_all_data_html(html)
    print(result)


True
www.baidu.com https
www.baidu.com http
['insane@163.net']
['display:none;']
['s-top-nav', 'display:none;', 's-center-box']

Process finished with exit code 0

到此这篇关于Python正则表达式中的量词符号与组的文章就介绍到这了,更多相关python正则表达式量词内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Python正则表达式中的量词符号与组问题小结

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Python正则表达式中的量词符号与组问题小结

正则表达式中的符号

例子

组的概念

组的应用

Python正则表达式中的量词符号与组问题小结

相关文章

猜你喜欢

Python正则表达式中的量词符号与组问题小结

Linux中的特殊符号与正则表达式

Linux中特殊符号与正则表达式的示例分析

如何在Python中处理正则表达式的问题

python正则表达式中匹配次数与贪心问题详解(+ ？*)

Python中常见的正则表达式问题及解决方法

热门标签

编程热搜

Python 学习之路 - Python

chatgpt的中文全称是什么

C/C++中extern函数使用详解

C/C++可变参数的使用

css样式文件该放在哪里

php中数组下标必须是连续的吗

Python 3 教程

Python pip包管理

ubuntu如何重新编译内核

改善Java代码之慎用java动态编译

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

Python正则表达式中的量词符号与组问题小结

正则表达式中的符号

例子

组的概念

组的应用

Python正则表达式中的量词符号与组问题小结

相关文章

猜你喜欢

Python正则表达式中的量词符号与组问题小结

Linux中的特殊符号与正则表达式

Linux中特殊符号与正则表达式的示例分析

如何在Python中处理正则表达式的问题

python正则表达式中匹配次数与贪心问题详解(+ ？*)

Python中常见的正则表达式问题及解决方法

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复