Java正则表达式教程大全
Java正则表达式教程大全
在Java代码中,如果你想使用正则表达式,需引入包 java.util.regex,
Java代码中的正则表达式同其它语言的正则表达式非常类似,学习起来非常容易上手。
正则表达式简介
正则表达式由一些特殊含义的字符组成,这些特殊含义的字符用于表示一类字符,我们可使用正则表达式去匹配查找字符。java.util.regex包主要由以下三个类:
-
Pattern类:Pattern对象是正则表达式的编译表示。
Pattern类无构造函数。 要创建模式,需使用静态compile()方法,此方法会返回一个Pattern对象 -
Matcher类: -Matcher对象是解释模式并对输入字符串执行匹配操作的引擎。
Matcher无构造函数。 需使用Pattern对象上调用matcher()方法,返回一个Matcher对象 -
PatternSyntaxException:PatternSyntaxException对象是未经检查的异常,
用于返回正则表达式模式中的语法错误
1. 捕获组
捕获组是将多个字符视为一个单元的一种方法。
将要分组的字符放在一组括号中来创建的。
例,正则表达式(Java)创建包含字母J,a,v和a的单个组。
捕获组通过从左到右计算它们的左括号来编号。 在表达式((X)(Y(Z)))中,
例,有四个这样的组 -
((X)(Y(Z)))(X)(Y(Z))(Z)
要查找表达式中存在多少个组,可使用Matcher对象上的groupCount()方法
groupCount()方法返回一个int类型值,返回Matcher模式中存在的捕获组数。
还有一个特殊组,即组0,它始终代表整个表达式。
该组未包含在groupCount()报告的总数中。
例
查找一个字符串中的数字字符串
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class testClass {
public static void main( String args[] ) {
String str1= "Java265.com 888 999!!";
String pattern = "(.*)(\\d+)(.*)";
Pattern r = Pattern.compile(pattern);
Matcher m = r.matcher(str1);
if (m.find( )) {
System.out.println("value1: " + m.group(0) );
System.out.println("value2: " + m.group(1) );
System.out.println("value3: " + m.group(2) );
}else {
System.out.println("NO MATCH");
}
}
}
/*
以上代码运行后,将输出以下信息
value1: Java265.com 888 999!!
value2: Java265.com 888 99
valu3: 9
*/
2. 正则表达式语法
下面列出了Java中可用的所有正则表达式元字符语法 -
| 编号 | 子表达式 | 匹配 |
|---|---|---|
| 1 | ^ |
匹配行的开头。 |
| 2 | $ |
匹配行的结尾。 |
| 3 | . |
匹配除换行符之外的任何单个字符,使用m选项也可以匹配换行符。 |
| 4 | [...] |
匹配括号中的任何单个字符。 |
| 5 | [^...] |
匹配括号内的任何单个字符。 |
| 6 | \A |
整个字符串的开头。 |
| 7 | \z |
整个字符串的结尾。 |
| 8 | \Z |
除允许的最终行终止符之外的整个字符串的结尾。 |
| 9 | re* |
匹配前面表达式的0次或更多次出现。 |
| 10 | re+ |
匹配前面表达式的1次或更多次出现。 |
| 11 | re? |
匹配前面表达式的0或1次出现。 |
| 12 | re{n} |
准确匹配前面表达式的n次出现次数。 |
| 13 | re{n,} |
准确匹配前面表达式的n次以上出现次数。 |
| 14 | aΙb | 匹配a或b。 |
| 15 | (re) |
对正则表达式进行分组并记住匹配的文本。 |
| 16 | (?: re) |
将正则表达式分组而不记住匹配的文本。 |
| 17 | (?> re) |
匹配独立模式而无需回溯。 |
| 18 | \w |
匹配单词字符。 |
| 19 | \W |
匹配非单词字符。 |
| 20 | \s |
匹配空白符,相当于:[\t\n\r\f] |
| 21 | \S |
匹配非空白。 |
| 22 | \d |
匹配数字,相当于:[0-9]。 |
| 23 | \D |
匹配非数字。 |
| 24 | \A |
匹配字符串的开头。 |
| 25 | \Z |
匹配字符串的结尾。如果存在换行符,则它在换行符之前匹配。 |
| 26 | \z |
匹配字符串的结尾。 |
| 27 | \G |
匹配最后一个匹配结束的点。 |
| 28 | \n |
反向引用以捕获组号:n。 |
| 29 | \b |
在括号外部匹配单词边界,在括号内匹配退格(0x08)。 |
| 30 | \B |
匹配非字边界。 |
| 31 | \n,\t |
匹配换行符,回车符,制表符等。 |
| 32 | \E |
转义(引用)所有字符直到\E。 |
| 33 | \Q |
结束以\Q开头引用。 |
start()和end()方法
例:
查询java字符串出现的次数:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class testClass {
private static final String REGEX = "\\bjava\\b";
private static final String str = "java java java265.com this is my website java!!!";
public static void main( String args[] ) {
Pattern p = Pattern.compile(REGEX);
Matcher m = p.matcher(str); // get a matcher object
int count = 0;
while(m.find()) {
count++;
System.out.println("Match number: "+count);
System.out.println("start(): "+m.start());
System.out.println("end(): "+m.end());
}
}
}
/*
以上代码运行后,将输出以下信息
I:\E\Tmp>java testClass
Match number: 1
start(): 0
end(): 4
Match number: 2
start(): 5
end(): 9
Match number: 3
start(): 41
end(): 45
*/
此示例中使用了单词边界 "\b"确保 j,a,v,a不是一个子字符串,而是一个单词
matches和lookingAt方法
matches()和lookingAt()方法都尝试将输入序列与模式匹配。
它与查找的不同之处在于匹配需匹配整个输入序列,查找则不需要
-----匹配字符串
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class testClass {
private static final String REGEX = "java";
private static final String str = "java265.com";
private static Pattern pattern;
private static Matcher matcher;
public static void main( String args[] ) {
pattern = Pattern.compile(REGEX);
matcher = pattern.matcher(str);
System.out.println("Current REGEX is: "+REGEX);
System.out.println("Current INPUT is: "+str);
System.out.println("lookingAt(): "+matcher.lookingAt());
System.out.println("matches(): "+matcher.matches());
}
}
/*
以上代码运行后,将输出以下信息
Current REGEX is: java
Current INPUT is: java265.com
lookingAt(): true
matches(): false
*/
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。


