最近程序中需要用到rubyzip这个gem进行解压缩和压缩,于是就遇到了中文文件名变成乱码的问题。
首先,使用rubyzip解压缩zip文件,代码参照官网的示例很简单
def unzip(zip_file, dest_dir) Zip::File.open zip_file do |zf| zf.each do |e| path = File.join dest_dir, e.name FileUtils.mkdir_p File.dirname(path) zf.extract(e, path) { true } end end end
发现中文文件名乱码后,看文档发现只需在方法开始加上 ,
Zip.force_entry_names_encoding = 'GBK'
经过测试果然解决问题。
应用里还需要生成zip压缩包,这里就不贴代码了,完全采用官网的示例即可,这次仔细看了说明,在其中加上下面这行即可顺利生成包含中文文件名的zip压缩包
Zip.unicode_names = true
def unzip(zip_file, dest_dir) file_encoding = detect_encoding_v2 zip_file Zip::File.open zip_file do |zf| zf.each do |e| name = e.name name = name.encode('GB18030', file_encoding) if file_encoding != 'ASCII' path = File.join dest_dir, name FileUtils.mkdir_p File.dirname(path) zf.extract(e, path) { true } end end end def detect_encoding_v2(zip_file) require 'charlock_holmes' names = [] Zip::File.open zip_file do |zf| zf.each do |e| name = e.name names << e.name end end ss = names.join cd = CharlockHolmes::EncodingDetector.detect(ss) syscoding = name.encoding.to_s.upcase coding = cd[:encoding].upcase if coding=='ASCII' && syscoding!='ASCII' coding = 'GB18030' end return coding end