关于使用InputStreamReader读取GBK编码文件乱码的问题

原創

2019-08-06 06:05

原文链接：https://mypyg.iteye.com/blog/888915

Java代码：

BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(packageFilePath)));

当使用此Reader读取GBK编码的文件时，所有的中文都会乱码，因为Reader会将读取到的byte转换成char，如果没有指定转换编码，那么默认是使用的utf8，那么读取到的内容就会错误。

那么假如读取完毕后进行一次转码是否可以解决乱码问题呢？

String s = readline();  
s = new String(s.getBytes("gbk"), "gbk");

思路是获得字符串的gbk编码，按照gbk编码重新解析一遍，实验证明是不可以的，是什么原因呢？

举例说明：

Java代码

byte ge[] = {(byte)0xb8, (byte)0xf6};

这是汉字‘个’的gbk编码。
String s = new String(ge, "gbk");
此时s不会是乱码。

s.getBytes("utf8") //得到-28，-72，-86。‘个’的utf8编码  
s.getBytes("gbk") //得到0xb8,0xf6。‘个’的gbk编码

而如果用一下代码生成s：

String s = new String(ge, "utf8");

此时s已经是乱码。

s.getBytes("utf8") //得到-17,-65,-67,-17,-65,-67

此时s的内容已经完全乱掉了，所以再用 s.getBytes("gbk"); 得到的数据也是乱的，无法逆向出真正的内容来。

所以要解决这个问题只能是让reader将byte转向char时使用正确的编码，即生成Reader时指定编码，即：

BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(packageFilePath), "gbk"));

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【java基础（五十五）】泛型的约束与局限（二）

不能構造泛型數組就想不能實例化一個泛型實例一樣，也不能實例化數組。不過原因有所不同，畢竟數組會填充null值，構造時看上去是安全的。不過，數組本身也有類型，用來監控存儲在虛擬機中的數組。這個類型會被擦除。如： public st

2020-07-08 11:18:09

《架构探险》学习之总体框建框架

搭建輕量級Java Web框架快速搭建開發框架如何加載配置文件如何實現一個簡單的 IOC 容器如何加載指定的類如何初始化框架 *註解開發目標：打造一個輕量級的 MVC 框架，Controller 是MVC的核心，類似於 SpringMV

2020-07-15 13:41:29

反射获取Class对象的四种方法

1、通過ClassLoader的loadClass方法。 package com.IO; public class ClassLoaderTest { public static void main(String[]

2020-07-08 12:00:21

Java package包,导入包import

package包包類似於操作系統的文件夾作用： 1.包可以提供文件（.class）的分類管理 2.提供獨立的命名空間，防止命名衝突 3.設置了空間的訪問權限的控制（可以提供很好的封裝性）包的聲明：

2020-07-08 12:00:21

Java俄罗斯轮盘死亡游戏

俄羅斯輪盤是一種自殺式玩命遊戲。參與者在左輪手槍的彈巢放入一顆子彈，之後將子彈盤旋轉，然後關上。參與者輪流把手槍對着自己的頭，按下扳機；直至有人中槍，或不敢按下扳機爲止。傳說這種“遊戲”源自十九世紀俄羅斯，由監獄的獄卒強迫囚犯進行

2020-07-08 12:00:21

nginx windows配置

#user nobody; worker_processes 1; #error_log logs/error.log; #error_log logs/error.log notice; #error_log logs

八点二十四分

2020-07-08 11:46:48

java获取某个月最后一天

代碼如下： public static String getLastDayOfMonth(int year,int month) { Calendar calendar = Calendar.getInst

2020-07-08 11:43:17

谈谈自定义注解及相关开发实践

說道自定義註解，可能大家都不太陌生，實際開發過程中可能多多少少也會用到，今天這邊就通過自定義註解結合反射，分享一些實際開發經驗。好吧，關於什麼是自定義註解，以及元註解什麼什麼的我這邊就不一一介紹了，大家自行百度，內容也都比較簡單

2020-07-08 11:43:17

【java基础（五十四）】泛型的约束与局限（一）

在使用Java泛型時需要考慮一些限制，大多數限制都是由類型擦除引起的。不能用基本類型實例化類型參數不能用類型參數代替基本類型。因此，沒有Pair<double>，只有Pair<Double>。當然，其原因是類型擦除。擦除之後，

2020-07-08 11:18:07

【java基础（五十三）】类型擦除、翻译泛型

虛擬機沒有泛型類型對象。所有對象都屬於普通類。類型擦除無論何時定義一個泛型類型，都自動提供了一個相應的原始類型（raw type）。原始類型的名字就是刪去類型參數後的泛型類型名。擦除（erased）類型變量，並替換爲限定類型（

2020-07-08 11:18:07

dom4j解析.xml文件

xml 是可擴展的標記性語言。xml 的主要作用有： 1、用來保存數據，而且這些數據具有自我描述性 2、它還可以做爲項目或者模塊的配置文件 3、還可以做爲網絡傳輸數據的格式（現在 JSON 爲主）。 CDATA 語法可以告訴 xml 解析

2020-07-08 10:45:03

生产者消费者ReentrantLock 版本

package com.example.demo.test; import java.util.concurrent.TimeUnit; import java.util.concurrent.locks.Condition; imp

诗和远方zdx

2020-07-08 10:07:23

生产者消费者阻塞队列版

package com.example.demo.test; import ch.qos.logback.core.util.TimeUtil; import java.util.concurrent.ArrayBlockingQu

诗和远方zdx

2020-07-08 10:07:23

学妹问我 JDK1.8 的新特性，我这样帮她总结

0 引子學妹：師兄師兄！我去面試被問到 JDK1.8 的新特性這個問題，不知道怎麼回答啊！哭了哭了，師兄能幫我總結一下 JDK1.8 的新特性嗎？我：小意思！學妹你先坐下，且讓師兄爲你慢慢講解（嘻嘻） 1 前言瞭解 JDK1

2020-07-08 10:04:53

博主在阿里笔试中拿了0分，竟是因为分不清楚 Java 输入类 nextLine 与 next 两个方法的区别

前言以前做算法題，都是實現一個方法，需要的參數會在方法參數中直接給出，而且需要的返回值直接在方法中 return 就好了。但是，這次阿里筆試，讓博主遭遇百萬點暴擊，需要的參數居然要到輸入流中讀取，而且返回結果居然直接輸出到控制檯

2020-07-08 10:04:49

24小時熱門文章

最新文章

最新評論文章