在svn上提交了一个文件trac进行codereview 的时候,发现其中的中文是乱码,猜测是文件编码的问题,用emedit查看之后,发现这个文件的编码时utf-8 (无bom)格式,然后对比了一下其它显示正确的文件格式:utf-8(含bom),问题就是bom有无的问题,使用emedit保存完后,调查了一下这个bom是什么.
"UTF- 8编码的文件中,BOM占三个字节。如果用记事本把一个文本文件另存为UTF-8编码方式的话,用UE打开这个文件,切换到十六进制编辑状态就可以看到开 头的FFFE了。这是个标识UTF-8编码文件的好办法,软件通过BOM来识别这个文件是否是UTF-8编码,很多软件还要求读入的文件必须带BOM。可 是,还是有很多软件不能识别BOM。"
"UTF-8 BOM又叫UTF-8 签名,其实UTF-8的BOM对UFT-8没有作用,是为了支援UTF-16,UTF-32才加上"
才发现这个bom在utf-8格式的文件中代表了头三个字节“EF BB BF”,很多文件就没有这个概念,经常会被当做数据进行处理。php好像暂时不支持,不能处理带bom的utf-8文件。
所以说,数据文件最好不要带bom,当然你如果知道bom,处理程序中做了处理那就是另一说了。,
关于文件的UTF-8的BOM标记问题记录
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
PHP去除BOM头
brokenjoin
2019-02-22 18:04:44
python 编码问题
ywdcj930102
2019-02-22 23:34:32
析Unicode和UTF-8
key001
2019-02-22 16:55:12
利用Notepad将Base64+GBK 转为明码UTF-
小慢哥
2019-02-22 13:56:25
纯C实现unicode-utf8互转
狼性執行
2019-02-22 13:52:28
utf8字符串截取
zhongyi_hlju
2019-02-22 13:22:00
十分钟搞清字符集和字符编码 顶 原 荐
失敗人士
2018-12-02 21:31:20
UTF8转成GB2312乱码问题解决方案
神馬文庫
2018-10-25 22:03:55
批量编码转换脚本cp936转utf8
ritto
2018-09-13 02:34:11
HEX文件格式分析 - 适用MPLAB
ypixunil
2019-02-22 15:34:21
怎么把PPT文件转成PDF文件格式
轉換達人
2019-02-16 12:51:59
手机中如何处理Excel格式转换PDF格式
辦公家
2018-09-16 02:43:25
各种文件后缀名与打开方式
badboycx
2018-09-13 02:30:00