UTF-8轉碼GBK

原創

2018-08-27 02:17

昨天一個大學的同學問了一個關於utf-8轉碼gbk的問題，所以兩個人一起討論了一下關於utf-8轉碼成爲GBK的亂碼原因。

正常情況下如果我們需要將UTF-8格式轉碼爲GBK，我們會需要經過這樣一箇中轉：

通常情況下如果直接轉碼會出現一種情況就是GBK轉碼UFT-8出現亂碼後亂碼可以在轉碼回去變爲原來的GBK中文。

但是UTF-8轉碼爲GBK則會出現兩種情況，在中文字符長度爲偶數時是可以直接將亂碼還原回去的，但是奇數情況下是無法全部轉碼回去的

究竟什麼原因呢？

這和UTF-8的編碼字節數和GBK的編碼字節數有關，我們知道UTF-8的字符集是以三個字節數來存儲的，而GBK則是兩個字節數，所以就存在以下問題

當“你好好”三個字轉碼爲字符集表示的時候，一共得到九個字節，當然這九個字節轉碼爲gbk的時候會被兩兩分組，所以第九個字節就會被拋棄無法識別轉化爲有標記的亂碼符號，當我們再把亂碼轉回去的時候，自然就無法還原爲原來的UTF-8了。如下圖

所以在UTF-8轉gbk的基數情況下就會出現最後一個字轉碼爲亂碼後無法還原的情況。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Linux Ubuntu 筆記（長期更新）

軟鏈接、硬鏈接：前者相當於快捷方式，後者則相當於重新拷貝了一次。軟鏈接命令： ln -s /home/sb/a /home/sb/b 注意！刪除軟鏈接時，注意rm a 和 rm -r a/的區別，後者會將源文件夾也刪除，血的教訓

2020-07-08 10:35:24

PyTorch踩過的坑（長期更新，轉載請註明出處）

最近在知乎看到有人轉載了這裏的內容，提醒一下，歡迎轉載，但是請註明出處，謝謝。 1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差異無論是對於模型還是數據，cuda()函數都能實現從CPU到GPU的

2020-07-08 10:35:24

個人筆記_研發流程

EVT: Engineering Verification Test DVT: Design Verification Test PVT: Pilot-run Verification Test MP: Mass-Producti

2020-07-07 21:32:10

2018個人年度工作總結與2019工作計劃（互聯網）

2019新的一年已經到來，如何制定個人it工作計劃呢？下面是收集整理的it個人工作計劃，歡迎閱讀。下手方向其實無論你是否是IT行業都可以從以下5個方向入手。寫好年度總結的基本要點年度工作總結時應本着實事求是的態度

IT界的小小小学生

2020-07-06 14:04:16

android控件checkBox的選中效果

一如既往的先聲明： private TextView result; private String china; 接下來： protected void onCreate(Bundle savedInsta

半路出道的songsong

2020-07-06 08:05:22

Java個人筆記

HashSet 無序唯一，TreeSet 有序唯一 TreeSet 對一個實體類進行排序 HashSet<NavigationTable> navigationTableHashSet = new HashSet<>(); ..

2020-07-05 17:57:22

spring boot 整合 activiti 6.0

一、爲什麼選擇Activiti（本人已經轉爲使用eclipse,idea的bpmn工具不好用）二、核心7大接口、28張表 7大接口(service) RepositoryService：提供一系列管理流程部署和流程定義的A

2020-07-05 17:20:15

springboot aop個人使用筆記

spring boot 框架配置 aop 依賴注入  <dependency> <groupId>org.springframework.boot</groupId> <artifa

2020-07-05 17:20:15

Docker常用命令個人筆記

安裝Docker先檢查以CentOS爲例：查看當前當前的CentOs內核版本是不是高於3.10的。查看CentOS內核命令：uname -r 如果不是,請升級內核，命令用：yum update 安裝docker，命令：yum

2020-07-05 17:20:04

FastJSON 使用個人筆記

如何全局配置 fastdfs 的策略在mvc裏面實現全局的fastdfs的全局序列化 /* * 解決序列問題 * */ @Override public void configureMe

2020-07-05 17:20:04

CentOS 使用個人筆記

檢查端口被哪個進程佔用 netstat -lnp|grep 8000 如下圖，找到進程號：11100 ps 11100 殺掉進程 kill -9 11100 CentOS下tar解壓 gz解壓 bz2等各種解壓文

2020-07-05 17:20:04

spring boot 使用筆記

一、配置視圖解析在resources文件夾下新建static文件夾（用來儲存靜態資源）配置application.yml spring: mvc: view: prefix: / suff

2020-07-05 17:20:04

spring cloud 微服務框架搭建（個人筆記）

父工程包引入 <properties> <spring-cloud-dependencies.version>Hoxton.SR3</spring-cloud-dependencies.version>

2020-07-05 17:20:04

Android PopupWindow 相關設置

windowLayout = LayoutInflater.from(LiveActivity.this).inflate(R.layout.live_pop_more, null); window = new PopupWindow(

2020-07-05 15:57:57

關於參數命名時產生無法調用get和set的問題

在大佬羣中看到一個大佬提到的一個問題，一個類中的參數命名的時候有一個單獨的小字母，在生成get 和 set方法的時候使用工具（類似於POSTMAN）無法調用。模擬了下場景大概是這樣： public class Bean {

2020-07-05 05:18:08

24小時熱門文章

最新文章

最新評論文章