python3中的UNICODE 與 UTF-8的簡單關係

原創

2018-09-03 17:18

一.字符集：

ascii
ISO-8859-1 通常叫做Latin-1，向下兼容ASCII，此字符集支持部分於歐洲使用的語言
GB2312/GBK 這就是漢字的國標碼，專門用來表示漢字，是雙字節編碼，而英文字母和iso8859-1一致（兼容iso8859-1編碼）。其中gbk編碼能夠用來同時表示繁體字和簡體字，而gb2312只能表示簡體字，gbk是兼容gb2312編碼的。
unicode 萬國碼

二.Unicode 與 UTF 之間的簡單關係：

UTF Unicode Transformation Format，通用傳輸格式
UTF-8 8-bit Unicode Transformation Format

UTF-8 是一種 Unicode 的編碼方式，主要作用對 Unicode 碼的數據進行轉換，轉換後方便存儲和網絡傳輸

三.Python3 中的字節串與字符串之間的區別:

節串（二進制數據，bytes）
字符串（Unicode碼數據，2個字節作爲一個字）

四.Python3 中編碼:

二進制 -> 轉換 -> 字符串需要解碼 decode
字符串 -> 轉換 -> 二進制需要編碼 encode

python3 內存中使用的字符串全部是 unicode 碼，但是網絡傳輸的數據或者從磁盤讀取的數據是把 unicode 碼轉換過的數據，通常情況下可能是 utf-8 格式的數據，所以如果從網絡中讀取或者磁盤中讀取其實就是把 utf-8 格式的數據解碼成 unicode 碼數據，相反如果想把內存中 unicode 碼數據存儲到磁盤或者網絡中需要對 unicode 碼進行編碼，通常可以採用 utf-8 的形式進行編碼

python3解釋器中自帶UTF-8編碼器，python2中不自帶，所以需要手動設置： #coding:utf-8

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

進程之間使用隊列Queue()通信

多進程之間通信可以使用multiprocessing中的Queue()來完成,下面簡單介紹一下Queue()裏面的函數及功能初始化Queue()對象時（例如：q=Queue()），若括號中沒有指定最大可接收的消息數量，或數量爲負值，那麼

2020-06-29 08:18:37

Python高級 -- 10 WSGI、mini_frame（web框架）

一、模擬瀏覽器訪問指定頁面1、使用多線程實現動態訪問指定頁面server-web.py# coding=UTF-8 import socket import re import multiprocessing class WSGISe

2020-06-28 03:11:23

Python高級 -- 02 網絡（udp、tcp）

一、socket 1、socket簡介 socket(簡稱套接字) 是進程間通信的一種方式，它與其他進程間通信的一個主要不同是：它能實現不同主機間的進程間通信，我們網絡上各種各樣的服務大多都是基於 Socket 來完

2020-06-28 03:11:13

Python高級 -- 06 Python提高

一、私有化xx: 公有變量_x: 單前置下劃線,私有化屬性或方法，from somemodule import *禁止導入,類對象和子類可以訪問__xx：雙前置下劃線,避免與子類中的屬性命名衝突，無法在外部直接訪問(名字重整所以訪問不到)

2020-06-28 03:11:12

Python高級 -- 08 MySQL與Python交互

一、準備MySQL數據-- 創建 "京東" 數據庫 create database jing_dong charset=utf8; -- 使用 "京東" 數據庫 use jing_dong; -- 創建一個商品goods數據表 cre

2020-06-28 03:11:11

Python高級 -- 12 mini_frame框架添加路由、路由支持正則、Log日誌功能

一、路由1、mini_frame中實現簡單的路由功能mini_frame.py# coding=UTF-8 import re def index(): with open("./templates/index.html") a

2020-06-28 03:11:11

Python高級 -- 09 MySQL高級之事務、視圖、索引、賬戶管理、主從配置

一、視圖1、視圖是什麼通俗的講，視圖就是一條SELECT語句執行後返回的結果集。所以我們在創建視圖的時候，主要的工作就落在創建這條SQL查詢語句上。視圖是對若干張基本表的引用，一張虛表，查詢語句執行的結果，

2020-06-28 03:11:11

Python中的哈希

基礎 1、什麼是可哈希(hashable)?哪些類型是可哈希的？參考 python可變與可哈希 2、Python的哈希值和哈希集 Python內置了hash()方法，能夠返回可哈希對象的哈希值（一個整數）。對於這個整數我們需要了

2020-06-26 23:14:46

Python中可哈希和不可變

Python中hashable和immutable 初學Python，我們清楚元組對象是不可變的（immutable），字典的鍵必須是可以哈希的（hashable）。這一講我們就來好好聊聊這兩個概念到底是什麼意思。 1. 可變與不

2020-06-26 23:14:46

python多態和鴨子類型

概述 python是一門解釋語言，但是同java等靜態語言一樣，是可以通過繼承的方式實現多態。而且python還有一個自己的特殊實現多態的方法，就是通過鴨子類型，來實現多態。繼承多態通過嚴格的繼承父類，重寫父類的方法實現多態

2020-06-26 23:14:46

http協議簡述以及三次握手四次揮手

目前絕大部分使用的都是HTTP/1.1版本，在瞭解http之前，先了解一下Tcp/Ip協議族通常使用網絡是在TCP/IP協議族的基礎上運作的，而Http屬於它內部的一個子集 TCP/IP協議族： TCP/IP按照層次從上至下分爲四層：應

爱吃萝卜的喵

2020-06-22 10:30:16

包（package）、模塊（module）

1.模塊一個模塊就是一個包含python代碼的文件，後綴名稱是.py就可以，模塊就是個python文件爲什麼我們用模塊程序太大，編程維護非常不方便，需要拆分模塊可以增加代碼重複利用的方式當作命名空間使用，避免命

2020-06-22 04:42:47

高級函數 - lambda

Python語言的高級特性函數式編程（FunctionalProgramming）基於lambda演算的一種編程方式程序中只有函數函數可以作爲參數，同樣可以作爲返回值純函數式編程語言：LISP，Haskell P

2020-06-22 04:42:47

高階函數-排序

高階函數-排序把一個序列按照給定算法進行排序 key：在排序前對每個元素進行key函數運算，可以理解成按照key函數定義的邏輯進行排序 python2和python3相差巨大 help(sorted) Help on bu

2020-06-22 04:42:47

dequeue、defaultdict、Counter

dequeue 比較方便的解決了頻繁刪除插入帶來的效率問題 from collections import deque q = deque(['a','b','c']) print(q) q.append("d") pri

2020-06-22 04:42:47

24小時熱門文章

最新文章

最新評論文章