【编程灵异事件】replaceAll() 无法替换空白符

问题发现

笔者在JavaWeb开发时,由于从数据库读取的文章段落存在空格,所有笔者觉得用以下方法将其消除:
在这里插入图片描述
这很合逻辑吧,正则表达式 \s+ 用于匹配一个或多个空白符,按理来说所有的空格都会被替换成 9 ,然而结果是下面这样的:
在这里插入图片描述

尝试解决

于是猜想,可能是其他空白符导致的,于是尝试替换   (html空格), \n (java编程常用换行符), \r\n (windows换行符) 都行不通。

最后决定控制台输出一下,这几个隐形字符的ASCII码,结果如下:
在这里插入图片描述
如图,段首的空白符替换之后,文字前面还存在空格。根据输出的ASCII码值可以通过查表的值,前面两个字符分别为 空格 换行 。那么问题来了,后面两个是什么?

问题解决

笔者直接把 12288 这串数字往百度一贴,原来早有前人也遇到了这个问题,得知这串数字表示的是 全角空格 ,而平时编程都是使用英文半角的空格,所以用"\s+"替换失败。

解决办法就是使用,先把全角空格替换为半角空格,再用上面说的方法去替换。

String s=str.replace((char)12288," ");

s=s.replaceAll("\\s+","");
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章