java中关于正则表达式反斜杠问题http:\....

原創

2018-08-23 03:11

今天想用正则表达式匹配微博中网页信息并删除超链接，例如“3768152699415666 网友反映，沃尔玛东门非法停车太多严重影响交通，我们把车停马路上的停车位上了，很多司机拉活，又在我们车左侧违法停了一排，导致交通混乱。希望有关部门能治理。 http:\t.cnR7ygMKL @北京12345 @北京延庆2014/10/17 10:22 延庆生活门户$”

这还不简单，马上写好代码。

String regex = "http:\\t.[a-z,1-9,A-Z]*"
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(str);
boolean result = m.find();

我去，各种失败。为嘛？

测试发现，反斜杠"\"总是匹配不对，后来发现，regex字符串String，http:\\... -> http:\....

再然后compile中的http:\t...继续匹配，http:\t....你懂了吧，Tab键，怎么能匹配呢。

于是更改

String regex = "http:\\\\t.[a-z,1-9,A-Z]*"

ok.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

java中关于正则表达式反斜杠问题http:\....

100 元錢，由二元、一元、五角面幣 100 張組成，問各有多少張？

實現一個新浪微博 MID 轉換算法

JAVA實現一把逆向最大匹配

讀入一個整數，將各個數位上的數拆分下來並輸出（從高位到低位）。

邏輯問題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結