使用ICSharpCode.SharpZLib,讀取Tar.gz壓縮包的文件名亂碼問題

默認版本的庫文件讀取時會將tar包中的中文路徑讀成亂碼,兩種方案,
 
第一種方法,不改SharpZLib的源代碼,將讀出的Entry名稱進行如下轉換:
private string ParseName(string source)
{
byte[] sourceByte = new byte[source.Length];
for (int i = 0; i < source.Length; i++)
{
sourceByte[i] = (byte)source[i];
}
return Encoding.Default.GetString(sourceByte);
}
 
即可將其轉化爲正常,
注:SharpZLib中,是將byte[]數組中的每一個元素強制轉化爲char,然後再拼成string,所以會出現亂碼,這裏的處理是將其恢復原來的byte[]數組,再使用gb2312的編碼解出來,得到中文
 
 
 
第二種方法,修改SharpZLib的源代碼(有風險,未詳細測試)
將TarHeader.cs中的ParseName函數改爲下文所示,可解決這一問題:
 
static public String ParseName(byte[] header, int offset, int length)
        {
            if ( header == null ) {
                throw new ArgumentNullException("header");
            }
            if ( offset < 0 ) {
#if NETCF_1_0
                throw new ArgumentOutOfRangeException("offset");
#else
                throw new ArgumentOutOfRangeException("offset", "Cannot be less than zero");
#endif                
            }
            if ( length < 0 )
            {
#if NETCF_1_0
                throw new ArgumentOutOfRangeException("length");
#else
                throw new ArgumentOutOfRangeException("length", "Cannot be less than zero");
#endif                
            }
            if ( offset + length > header.Length )
            {
                throw new ArgumentException("Exceeds header size", "length");
            }
//StringBuilder result = new StringBuilder(length);
            
//for (int i = offset; i < offset + length; ++i) {
// if (header[i] == 0) {
// break;
// }
// result.Append((char)header[i]);
//}
            
//return result;
int tmpCount = 0;
for (int i = offset; i < offset + length; ++i)
{
if (header[i] == 0)
{
break;
}
else tmpCount++;
}
byte[] bytes = new byte[tmpCount];
for (int i = offset; i < offset+tmpCount; i++)
{
bytes[i] = header[i];
}
string res = System.Text.Encoding.Default.GetString(bytes);
return res;
        }

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章