JAVA 使用正则提取A标签以及href链接
正则提取A标签以及href链接
代码如下:
String content = "<p>下载地址:<a title=\"持续更新补丁下载地址\" target=\"_blank\" href=\"http://pan.baidu.com/s/xxxx\">持续更新补丁下载地址</a></p><p>";
Pattern pattern_a = compile("<a[^>]*href=(\\\"([^\\\"]*)\\\"|\\'([^\\']*)\\'|([^\\\\s>]*))[^>]*>(.*?)</a>");
Matcher matcher_a = pattern_a.matcher(content);
System.out.println("网站连接");
while (matcher_a.find()) {
for (int i = 0; i < matcher_a.groupCount(); i++) {
System.out.println(matcher_a.group(i));
}
}
输出结果如下:
<a title="持续更新补丁下载地址" target="_blank" href="http://pan.baidu.com/s/xxxx">持续更新补丁下载地址</a>
"http://pan.baidu.com/s/xxxx"
http://pan.baidu.com/s/xxxx
null
null
JAVA 匹配正则表达式大全
java匹配字符串表达式在我们数据处理方面是及其重要的,现在就把我这几天数据处理比较常用的向大家介绍一下,常规的一些匹配方式就不介绍了,我们来学习一些特殊的
一.我们先举个例子来看看Java匹配正则表达式
Pattern pattern = Pattern.compile("采购(人名称|人单位|名称).*");
Matcher matcher = pattern.matcher("采购名称乒位");
String dateStr = null;
if (matcher.find()) {
dateStr = matcher.group(0);
System.out.println(dateStr);
}
运行结果如下:
二.匹配表达式的特殊情况
(1)匹配中文字符
Pattern pattern = Pattern.compile("[\\u4e00-\\u9fa5]");
Matcher matcher = pattern.matcher("2322购购购购232323");
String dateStr = null;
if (matcher.find()) {
dateStr = matcher.group(0);
System.out.println(dateStr);
}
运行结果如下:
(2).匹配从规定字符开始所有非换行字符
Pattern pattern = Pattern.compile("1.*");
Matcher matcher = pattern.matcher("2312购购购购232323");
String dateStr = null;
if (matcher.find()) {
dateStr = matcher.group(0);
System.out.println(dateStr);
}
运行结果如图:
(3)使用字符串数组匹配多个条件匹配字符串,这是我在实习进行处理数据的一个例子,希望有助于大家理解:
(4).对于字符串匹配查找多个符合条件的字符字串,我们用到group(),
group(num=0): 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
groups() : 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341