正则表达式基础应用(切割split(regex))

1. 基础字符串切割

要求:

按照空格将字符串切割

String a = "asd adsf    asdf        dfkajsd   yyy";
String reg1 = " +";  //1个或多个空格切割
String[] val = a.split(reg1);
for(String v : val){
System.out.println(v);
}


2. 按照特殊字符切割

要求:

按照点将字符串切割

特别说明:

在正则表达式中,. 为特殊字符,所以必须转义\. ,而在java字符串中\ 如果想正常表示也需要转义,就成为\\.

String b = "abc.sd.s.ldj.l44.sd";
String reg2 = "\\.";
String[] val1 = b.split(reg2);
for(String v : val1){
System.out.println(v);
}


3. 按照叠词完成切割,为了规则的结果可以被重用

要求:

按照有重复的字符串切割

特别说明:

正则表达式中()中的内容表示一个组,而组后面跟上\1 表示组的编号,此处表示重用组里规则过滤出来的值,这个就叫叠词

String c = "sdflddfkdfguuuflglglhlsgfaszzdk";
String reg3 = "(.)\\1+";  // 组里为任意字符,\\1为重用组里过滤出来的值,+表示多次利用组里规则过滤出来的值
String [] val2 = c.split(reg3);
for(String v : val2){
System.out.println(v);
}



补充: 

如下面正则表达式: ((a(b))(c)) 

怎么判断它是几个组呢?  

答: 只要数它有几个左括号或者几个右括号就行了,这里是4个组; 

那么怎么知道组的编号了?

答:从左至右数左括号,第一个就是第一组,一次类推。


总结补充:这个正是正则表达式的一个缺点,就是符号定义越多,正则越长,阅读行越差。说白了就是越牛的正则表达式越难看明白。


发布了27 篇原创文章 · 获赞 2 · 访问量 4万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章