【目標檢測】UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 4886: invalid start byte

原創

Mein_Augenstern

2020-07-06 09:16

Q：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb3 in position 4886: invalid start byte

在Vim中可以直接查看文件編碼
:set fileencoding
即可顯示文件編碼格式。
如果你只是想查看其它編碼格式的文件或者想解決用Vim查看文件亂碼的問題，那麼你可以在
~/.vimrc 文件中添加以下內容：

set encoding=utf-8 fileencodings=ucs-bom,utf-8,cp936

出現這種問題的原因是因爲，windows的文件名中文編碼默認爲GBK,而Linux 中默認文件名編碼爲UTF8,由於編碼不一致，所以導致了文件名亂碼的問題，解決這個問題需要對文件名進行轉碼。

開始之前，請先安裝enca這個軟件包。enca是Linux等系統下用來查看文件編碼和轉換文件編碼的工具。

下面一行Linux命令能夠查找當前目錄下所有文件中，哪些文件不是UTF-8編碼。我對文件加了些限制，用find命令時候，排除了所有目錄下的.svn目錄，且只查找後綴爲.json的文件。

find . ! -iregex '.*\.svn.*' -type f -name '*.json' -exec bash -c "enca -L zh_CN {}|grep GB2312 > /dev/null && echo {}" \;

既然找到了這些非UTF8編碼的文件，接下來再用一條命令將他們都轉換成UTF8編碼。

find . ! -iregex '.*\.svn.*' -type f -name '*.json' -exec bash -c "enca -L zh_CN {} | grep GB2312 >/dev/null && enconv -L zh_CN -x UTF-8 {}" \;

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

[已解決]There is already an open DataReader associated with this Connection which mu

今天程序報錯：There is already an open DataReader associated with this Connection which mu…… 解決方案：在報錯方法之前使用了一個未釋放的IQueryable類型

2020-07-08 08:40:16

Mask R-CNN tensorflow 訓練自己的數據

Mask R-CNN tensorflow 訓練自己的數據 https://blog.csdn.net/doudou_here/article/details/87855273 labelme https://blog.csdn.ne

2020-07-08 12:33:38

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

IOU計算代碼

import numpy as np def compute_iou(box1, box2, standard_coordinates=True): ''' :param box1: [Xmin, Ymin, Xmax

2020-07-08 10:30:45

Faster RCNN圖解

高清圖：faster rcnn流程圖.png

2020-07-08 10:30:45

NMS計算代碼

''' # INPUT：所有預測出的bounding box (bbx)信息（座標和置信度confidence），　IOU閾值（大於該閾值的bbx將被移除） for object in all objects: (1) 獲取當前目

2020-07-08 10:30:45

yolov4訓練自己的數據集實現安全帽佩戴檢測

昨兒立下來的flag，今天還是要含淚完成的，抓緊時間趕呀！！！本次用yolov4來實現人佩戴安全帽檢測，若未佩戴安全帽則將人臉框出來，若佩戴安全帽，則將安全帽以及人臉框出來，多說無益，直接看效果吧！！！效果還是不錯的，那

mind_programmonkey

2020-07-08 09:29:00

YOLOV5目標檢測----上手

YOLOV5目標檢測----上手 2020年4月23日，YOLOV4開源 2020年6月10日，YOLOV5開源這兩個日子，可是把CV類公衆號的運營者忙壞了，各大公衆號都在忙着搶“首發” 當然，YOLOV4是貨真價實的YOLO

西红柿爱吃小番茄

2020-07-08 07:02:00

目標檢測框架——Dtectron2

前言目標檢測的模型還是很多的，要挨個挨個學還是有點喫力（精力旺盛可忽略），所以這裏總結一下當前流行的目標檢測的框架：darknet yolov4，mmdetection2.0，detectron2.0。至於這三個框架怎麼去選擇，

不会写作文的李华

2020-07-08 06:19:37

目標檢測框架——mmdetection2.0

前言目標檢測的模型還是很多的，要挨個挨個學還是有點喫力（精力旺盛可忽略），所以這裏總結一下當前流行的目標檢測的框架：darknet yolov4，mmdetection2.0，detectron2.0。至於這三個框架怎麼去選擇，

不会写作文的李华

2020-07-08 06:19:36

三、訓練自己的yolo3模型

yolo3整體的文件夾構架如下：本文使用VOC格式進行訓練。訓練前將標籤文件(.xml) 放在 VOCdevkit 文件夾下的 VOC2007 文件夾下的 Annotation 中。訓練前將圖片文件放在 VOCdevkit

2020-07-07 15:53:01

字符編碼格式歷史

原文地址：http://blog.csdn.net/iscandy/archive/2009/02/02/3859219.aspx 很久很久以前，有一羣人，他們決定用8個可以開合的晶體管來組合成不同的狀態，以表示世界上的萬物。他們看到

wangqiang624731186

2020-07-08 02:53:25

Python: Base64文件編碼、解碼

base64.py 模型提供了將二進制數據編碼爲可印刷的 ASCII 字符和將這些編碼後的數據返回到二進制數據的方法。一、方法 b64encode(s, altchars=None) 1. 使用 Base64 編碼類字節對象（bytes

2020-07-08 02:30:58

字符與GBXX,UCS-2,utf-8編碼的相互轉換

在介紹轉換之前，先介紹一下常見的字符集： 1ASCII:這個大家應該都比較熟悉，他把英文字母、數字等256個字符編碼爲Ox00-OxFF 2GBXX:包括GB2312、GBK、GB18030，這裏面主要增加了對漢及漢字標點等的編碼。其中G

向日葵之热爱生命

2020-07-07 23:38:21

24小時熱門文章

最新文章

最新評論文章