Java中Pattern.compile函数的使用详解
短信预约 -IT技能 免费直播动态提醒
Java Pattern.compile函数的使用
除了Pattern Pattern.compile(String regex),
Pattern类的compile()方法还有另一个版本:
Pattern Pattern.complie(String regex,int flag),它接受一个标记参数flag,以调整匹配的行为。
flag来自以下Pattern类中的常量:
编译标记 | 效果 |
---|---|
Pattern.CANON_EQ | 两个字符当且仅当它们的完全规范分解相匹配时,就认为它们是匹配的,例如,如果我们指定这个标记,表达式a\u030A就会匹配字符串?。在默认的情况下,匹配不考虑规范的等价性 |
Pattern.CASE_INSENSITIVE(?i) | 默认情况下,大小写不敏感的匹配假定只有US-ASCII字符集中的字符才能进行。这个标记允许模式匹配不必考虑大小写(大写或小写)。通过指定UNICODE_CASE标记及结合此标记,基于Unicode的大小写不敏感的匹配就可以开启了,也可以使用嵌入的标记表达式?i开启,下同 |
Pattern.COMMENTS(?x) | 在这种模式下,表达式中的空格(不是指\s,单纯指空格)将被忽略掉,并且以#开始直到行末的注释也会被忽略掉。通过嵌入的标记表达式也可以开启Unix的行模式 |
Pattern.DOTALL(?s) | 在dotall模式中,表达式“.”匹配所有字符,包括行终结符。默认情况下,“.”表达式不匹配行终结符 |
Pattern.MULTLINE(?m) | 在多行模式下,表达式^和$分别匹配一行或输入字符串的开始和结束。默认情况下,这些表达式仅匹配输入的完整字符串的开始和结束 |
Pattern.UNICODE_CASE(?u) | 当指定这个标记,并且开启CASE_INSENSITIVE时,大小写不敏感的匹配将按照与Unicode标准相一致的方式进行。默认情况下,大小写不敏感的匹配假定只能在US-ASCII字符集中的字符才能进行 |
Pattern.UNIX_LINES(?d) | 在这种模式下,在.、^和$行为中,只识别行终结符\n |
在这些标记中 Pattern.CASE_INSENSITIVE(?i) ,Pattern.MULTLINE(?m),==Pattern.COMMENTS(?x)==中特别有用。
使用示例如下:
我们可以通过“或”( | )操作组合多个标记的功能
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ReFlags {
public static void main(String[] args) {
Pattern p=Pattern.compile("^java",Pattern.CASE_INSENSITIVE|Pattern.MULTILINE);
Matcher m=p.matcher("java has regex\nJava has regex\n"
+ "JAVA has pretty good regular expression\n"
+ "Regular expressions are in JavA");
while (m.find()) {
System.out.println(m.group());//输出已匹配的部分
}
}
}
输出结果:
java
Java
JAVA
使用Pattern.COMMENTS(?x)的例子:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ReFlags_Comments {
public static void main(String[] args) {
String s="123";
Pattern p1=Pattern.compile(" (\\d+)+#test comments");
Matcher m1=p1.matcher(s);
System.out.println(m1.matches());//false
Pattern p2=Pattern.compile("(?x) (\\d+)+#test comments");
Matcher m2=p2.matcher(s);
System.out.println(m2.matches());//true
Pattern p3=Pattern.compile(" (\\d+)+#test comments",Pattern.COMMENTS);
Matcher m3=p3.matcher(s);
System.out.println(m3.matches());//true
}
}
运行结果:
false
true
true
Pattern.compile函数的相关解释
Pattern.compile函数:
Pattern Pattern.compile(String regex, int flag)
flag的取值范围如下:
Pattern.CANON_EQ
:当且仅当两个字符的"正规分解(canonical decomposition)"都完全相同的情况下,才认定匹配。比如用了这个标志之后,表达 式"a\u030A"会匹配"?"。默认情况下,不考虑"规范相等性(canonical equivalence)"。Pattern.CASE_INSENSITIVE
: 默认情况下,大小写不敏感的匹配只适用于US-ASCII字符集。这个标志能让表达式忽略大小写进行匹配。要想对Unicode字符进行大小不明感的匹 配,只要将UNICODE_CASE与这个标志合起来就行了。Pattern.COMMENTS
: 在这种模式下,匹配时会忽略(正则表达式里的)空格字符(不是指表达式里的"\\s",而是指表达式里的空格,tab,回车之类)。注释从#开始,一直到这行结束。可以通过嵌入式的标志来启用Unix行模式。Pattern.DOTALL
: 在这种模式下,表达式'.'可以匹配任意字符,包括表示一行的结束符。默认情况下,表达式'.'不匹配行的结束符。Pattern.MULTILINE
: 在这种模式下,'^'和'$'分别匹配一行的开始和结束。此外,'^'仍然匹配字符串的开始,'$'也匹配字符串的结束。默认情况下,这两个表达式仅仅匹配字符串的开始和结束。Pattern.UNICODE_CASE
: 在这个模式下,如果你还启用了CASE_INSENSITIVE标志,那么它会对Unicode字符进行大小写不明感的匹配。默认情况下,大小写不敏感的匹配只适用于US-ASCII字符集。Pattern.UNIX_LINES(?d)
在这个模式下,只有'\n'才被认作一行的中止,并且与'.','^',以及'$'进行匹配。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341