问题发现
笔者在JavaWeb开发时,由于从数据库读取的文章段落存在空格,所有笔者觉得用以下方法将其消除:
这很合逻辑吧,正则表达式 \s+ 用于匹配一个或多个空白符,按理来说所有的空格都会被替换成 9 ,然而结果是下面这样的:
尝试解决
于是猜想,可能是其他空白符导致的,于是尝试替换 (html空格), \n (java编程常用换行符), \r\n (windows换行符) 都行不通。
最后决定控制台输出一下,这几个隐形字符的ASCII码,结果如下:
如图,段首的空白符替换之后,文字前面还存在空格。根据输出的ASCII码值可以通过查表的值,前面两个字符分别为 空格 和 换行 。那么问题来了,后面两个是什么?
问题解决
笔者直接把 12288 这串数字往百度一贴,原来早有前人也遇到了这个问题,得知这串数字表示的是 全角空格 ,而平时编程都是使用英文半角的空格,所以用"\s+"替换失败。
解决办法就是使用,先把全角空格替换为半角空格,再用上面说的方法去替换。
String s=str.replace((char)12288," ");
s=s.replaceAll("\\s+","");