UTF-8转码GBK

原創

2018-08-27 02:17

昨天一个大学的同学问了一个关于utf-8转码gbk的问题，所以两个人一起讨论了一下关于utf-8转码成为GBK的乱码原因。

正常情况下如果我们需要将UTF-8格式转码为GBK，我们会需要经过这样一个中转：

通常情况下如果直接转码会出现一种情况就是GBK转码UFT-8出现乱码后乱码可以在转码回去变为原来的GBK中文。

但是UTF-8转码为GBK则会出现两种情况，在中文字符长度为偶数时是可以直接将乱码还原回去的，但是奇数情况下是无法全部转码回去的

究竟什么原因呢？

这和UTF-8的编码字节数和GBK的编码字节数有关，我们知道UTF-8的字符集是以三个字节数来存储的，而GBK则是两个字节数，所以就存在以下问题

当“你好好”三个字转码为字符集表示的时候，一共得到九个字节，当然这九个字节转码为gbk的时候会被两两分组，所以第九个字节就会被抛弃无法识别转化为有标记的乱码符号，当我们再把乱码转回去的时候，自然就无法还原为原来的UTF-8了。如下图

所以在UTF-8转gbk的基数情况下就会出现最后一个字转码为乱码后无法还原的情况。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Linux Ubuntu 笔记（长期更新）

軟鏈接、硬鏈接：前者相當於快捷方式，後者則相當於重新拷貝了一次。軟鏈接命令： ln -s /home/sb/a /home/sb/b 注意！刪除軟鏈接時，注意rm a 和 rm -r a/的區別，後者會將源文件夾也刪除，血的教訓

2020-07-08 10:35:24

PyTorch踩过的坑（长期更新，转载请注明出处）

最近在知乎看到有人轉載了這裏的內容，提醒一下，歡迎轉載，但是請註明出處，謝謝。 1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差異無論是對於模型還是數據，cuda()函數都能實現從CPU到GPU的

2020-07-08 10:35:24

个人笔记_研发流程

EVT: Engineering Verification Test DVT: Design Verification Test PVT: Pilot-run Verification Test MP: Mass-Producti

2020-07-07 21:32:10

2018个人年度工作总结与2019工作计划（互联网）

2019新的一年已經到來，如何制定個人it工作計劃呢？下面是收集整理的it個人工作計劃，歡迎閱讀。下手方向其實無論你是否是IT行業都可以從以下5個方向入手。寫好年度總結的基本要點年度工作總結時應本着實事求是的態度

IT界的小小小学生

2020-07-06 14:04:16

android控件checkBox的选中效果

一如既往的先聲明： private TextView result; private String china; 接下來： protected void onCreate(Bundle savedInsta

半路出道的songsong

2020-07-06 08:05:22

Java个人笔记

HashSet 無序唯一，TreeSet 有序唯一 TreeSet 對一個實體類進行排序 HashSet<NavigationTable> navigationTableHashSet = new HashSet<>(); ..

2020-07-05 17:57:22

spring boot 整合 activiti 6.0

一、爲什麼選擇Activiti（本人已經轉爲使用eclipse,idea的bpmn工具不好用）二、核心7大接口、28張表 7大接口(service) RepositoryService：提供一系列管理流程部署和流程定義的A

2020-07-05 17:20:15

springboot aop个人使用笔记

spring boot 框架配置 aop 依賴注入  <dependency> <groupId>org.springframework.boot</groupId> <artifa

2020-07-05 17:20:15

Docker常用命令个人笔记

安裝Docker先檢查以CentOS爲例：查看當前當前的CentOs內核版本是不是高於3.10的。查看CentOS內核命令：uname -r 如果不是,請升級內核，命令用：yum update 安裝docker，命令：yum

2020-07-05 17:20:04

FastJSON 使用个人笔记

如何全局配置 fastdfs 的策略在mvc裏面實現全局的fastdfs的全局序列化 /* * 解決序列問題 * */ @Override public void configureMe

2020-07-05 17:20:04

CentOS 使用个人笔记

檢查端口被哪個進程佔用 netstat -lnp|grep 8000 如下圖，找到進程號：11100 ps 11100 殺掉進程 kill -9 11100 CentOS下tar解壓 gz解壓 bz2等各種解壓文

2020-07-05 17:20:04

spring boot 使用笔记

一、配置視圖解析在resources文件夾下新建static文件夾（用來儲存靜態資源）配置application.yml spring: mvc: view: prefix: / suff

2020-07-05 17:20:04

spring cloud 微服务框架搭建（个人笔记）

父工程包引入 <properties> <spring-cloud-dependencies.version>Hoxton.SR3</spring-cloud-dependencies.version>

2020-07-05 17:20:04

Android PopupWindow 相关设置

windowLayout = LayoutInflater.from(LiveActivity.this).inflate(R.layout.live_pop_more, null); window = new PopupWindow(

2020-07-05 15:57:57

关于参数命名时产生无法调用get和set的问题

在大佬羣中看到一個大佬提到的一個問題，一個類中的參數命名的時候有一個單獨的小字母，在生成get 和 set方法的時候使用工具（類似於POSTMAN）無法調用。模擬了下場景大概是這樣： public class Bean {

2020-07-05 05:18:08

24小時熱門文章

最新文章

最新評論文章