【零碎JAVA】正则表达式

对于复杂的字符串处理,如果我们单过使用String类对她进行我们需要的处理会变得十分困难,编写代码会变的十分繁杂,此时,我们可以使用正则表达式来处理这样的问题。

java中的java.util.regex包中对正则表达式进行了描述。这个包中主要包含两个类,一个Pattern,一个Mathcer。其中Pattern可以理解为一个分装好的正则表达式实例对象,Mathcer可以理解为指定字符串与正则表达式匹配后产生的一个匹配器,他内部提供了很多对匹配后的结果的操作。使用起来比较便捷。

使用Pattern与Matcher的操作步骤如下:

1.创建Pattern对象,该对象是由Pattern编译指定的正则表达式后产生的。

2.将获得的Pattern对象与我们需要比较的字符串进行匹配,产生一个Mathcer对象。

3.根据我们的需求,调用Matcher的方法,达到我们的目标。

比如,我们需要比较将例如“aabbbccddeeeeeffg”字符串转换成”abcdefg”,我们可以这么做

	String str = "aabbbccddeeeeeffg";
	Pattern pattern = Pattern.compile("([a-z])\\1+");
	Matcher matcher = pattern.matcher(str);
	str = matcher.replaceAll("$1");
	sop(str);

当然,我们也可以直接使用String提供的replaceAll方法来实现这个功能:

	String str = "aabbbccddeeeeeffg";
	str = str.replaceAll("([a-z])\\1+", "$1");
	sop(str);

如果我们查看String的repalceAll源码,我们会发现,他底层就是使用了Pattern与Matcher。

上述代码的正则表达式用到了组合的概念,用()括起来的就是一个组,后面我们可以通过组号来调用前面的组内容,避免重复写代码,组号是根据左括号出现的位置决定的,第一个左括号到与之对应右括号为第一组,第二个左括号到与之对应的右括号为第二组,以此类推...我们可以使用\+组号的形式来调用,需要注意的是\是特殊字符,需要使用\来转义。

 

处理字符串主要有以下几种操作:

1.匹配:用于判断是否与我们指定的形式符合。主要方法 matches()

2.替换:将一有字符串变换成另一种字符串,元素基本跟已有字符串一致。主要方法 replaceAll()

3.切割:根据自己的需求将字符串分割成多个字符串。主要方法 split()

4.获取:获取符合要求的字符串子串。

习题:

	/*
	*	将IP字符串“192.168.1.150 2.2.2.2 10.16.48.123 56.78.123.253”按照网段顺序输出
	*	思路:
	*		1.使用String的split方法将各个IP地址分割开来。
	*		2.由于IP的每一段长度都不一样,无法进行准确的比较,我们需要将IP地址的每段都设置成3位,
	*			先给IP地址的每段前面添加两个0,然后取后三位,这样就可以统一起来。
	*		3.使用集合存放字符串输出,由于需要有顺序,所以使用TreeSet存放。
	*/

	import java.util.*;	
	import java.util.regex.*;

	class IPSortDemo 
	{
		public static void main(String[] args) 
		{
			String str = new String("192.168.1.150 2.2.2.2 10.16.48.123 56.78.123.253");
			str = str.replaceAll("([0-9]{1,3})", "00$1");
			str = str.replaceAll("0+([0-9]{3})", "$1");
			TreeSet<String> ts = new TreeSet<String>();
			String[] arr_str = str.split(" ");
			for(String s : arr_str){
				ts.add(s);
			}

			Iterator iterator = ts.iterator();
			while(iterator.hasNext()){
				String temp = (String)iterator.next();
				sop(temp.replaceAll("0*(<a target=_blank target="_blank" href="file://\\d">\\d</a>+)", "$1"));
			}
		
		}

		public static void sop(Object obj){
			System.out.println(obj);
		}
	}	


链接:网络爬虫示例程序

 

发布了36 篇原创文章 · 获赞 3 · 访问量 3万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章