QR碼長度問題以及生成原理和編碼方式

一、什麼是QR碼

QR碼屬於矩陣式二維碼中的一個種類,由DENSO(日本電裝)公司開發,由JIS和ISO將其標準化。QR碼的樣子其實在很多場合已經能夠被看到了,我這還是貼個圖展示一下:

QR碼生成原理-QR <wbr>Code(ISO <wbr>18004)編碼方式

這個圖如果被正確解碼,應該看到我的名字和郵箱。

二、QR碼的特點

說到QR碼的特點,一是高速讀取(QR就是取自“QuickResponse”的首字母),對讀取速度的體驗源自於我手機上的一個軟件,象上面貼出的碼圖,通過攝像頭從拍攝到解碼到顯示內容也就三秒左右,對攝像的角度也沒有什麼要求;

二是高容量、高密度;理論上內容經過壓縮處理後可以存7089個數字,4296 個字母和數字混合字符,2953個8位字節數據,1817個漢字;

三是支持糾錯處理;糾錯處理相對複雜,目前我還沒有深入瞭解,按照QR碼的標準文檔說明,QR碼的糾錯分爲4個級別,分別是:

level L : 最大 7% 的錯誤能夠被糾正;

level M : 最大 15% 的錯誤能夠被糾正;

level Q : 最大 25% 的錯誤能夠被糾正;

level H : 最大 30% 的錯誤能夠被糾正;

四是結構化;看似無規則的圖形,其實對區域有嚴格的定義,下圖就是一個模式2、版本1的QR圖結構(關於QR碼的"模式"、"版本"將在後面進行介紹):

QR碼生成原理-QR <wbr>Code(ISO <wbr>18004)編碼方式

在上圖21*21的矩陣中,黑白的區域在QR碼規範中被指定爲固定的位置,稱爲尋像圖形(finder pattern) 和 定位圖形(timingpattern)。尋像圖形和定位圖形用來幫助解碼程序確定圖形中具體符號的座標。

黃色的區域用來保存被編碼的數據內容以及糾錯信息碼。

藍色的區域,用來標識糾錯的級別(也就是Level L到Level H)和所謂的"Mask pattern",這個區域被稱爲“格式化信息”(formatinformation)。

五是擴展能力。QR碼的Structure Append特點,使一個QR碼可以分解成多個QR碼,反之,也可以將多個QR碼的數據組合到一個QR碼中來:

QR碼生成原理-QR <wbr>Code(ISO <wbr>18004)編碼方式

 

三、QR碼的模式和版本

前面提到過QR碼的模式(Model)和版本(Version)。QR碼分爲Model1和Model2兩種模式,Model1是對QR的初始定義,Model2是對Model1的擴展,目前使用較爲普遍的是Model2,本文的所有說明也僅用於Model2。

QR圖的大小(size)被定義爲版本(Version),版本號從1到40。版本1就是一個21*21的矩陣,每增加一個版本號,矩陣的大小就增 加4個模塊(Module),因此,版本40就是一個177*177的矩陣。(版本越高,意味着存儲的內容越多,糾錯能力也越強)。

三、QR碼支持的編碼內容

QR碼支持編碼的內容包括純數字、數字和字符混合編碼、8位字節碼和包含漢字在內的多字節字符。其中:

數字:每三個爲一組壓縮成10bit。

字母數字混合:每兩個爲一組,壓縮成11bit。

8bit字節數據:無壓縮直接保存。

多字節字符:每一個字符被壓縮成13bit。

 

QR碼編碼原理(編碼)

 

編碼就是把常見的數字、字符等轉換成QR碼的方法。說具體的編碼之前,先說一下QR碼的最大容量問題。

一、最大容量

QR碼的最大容量取決於選擇的版本、糾錯級別和編碼模式(Mode:數字、字符、多字節字符等)。以版本1、糾錯級別爲Level Q的QR碼爲例,可以存儲27個純數字,或17個字母數字混合字符或11個8bit字節數據。如果要存儲同樣多的內容同時提高糾錯級別,則需要採用更高的版本。版本1~9數據容量、糾錯碼容量對照如下表:

(version)

(error correcting level)

(count of data code words)

count of EC code words

(numeric)

(alphanumeric)

8bit

1

L

19

7

41

25

17

M

16

10

34

20

14

Q

13

13

27

16

11

H

9

17

17

10

7

2

L

34

10

77

47

32

M

28

16

63

38

26

Q

22

22

48

29

20

H

16

28

34

20

14

3

L

55

15

127

77

53

M

44

26

101

61

42

Q

34

36

77

47

32

H

26

44

58

35

24

4

L

80

20

187

114

78

M

64

36

149

90

62

Q

48

52

111

67

46

H

36

64

82

50

34

5

L

108

26

255

154

106

M

86

48

202

122

84

Q

62

72

144

87

60

H

46

88

106

64

44

6

L

136

36

322

195

134

M

108

64

255

154

106

Q

76

96

175

108

74

H

60

112

139

84

58

7

L

156

40

370

224

154

M

124

72

293

178

122

Q

88

108

207

125

86

H

66

130

154

93

64

8

L

194

48

461

279

192

M

154

88

365

221

152

Q

110

132

259

157

108

H

86

156

202

122

84

9

L

232

60

552

335

230

M

182

110

432

262

180

Q

132

160

312

189

130

H

100

192

235

143

98

如果要了解更詳細的QR碼容量信息,可以到電裝的網站去看看:

http://www.denso-wave.com/qrcode/vertable1-e.html

 

下面,就舉例說明將“ABCDE123”轉換成爲版本1、LevelH的QR碼轉換方法。

二、模式標識符(Mode Indicator)

QR碼的模式(Mode)就是前文提到的數字、字符、8bit 字節碼、多字節碼等。對於不同的模式,都有對應的模式標識符(Mode Indicator)來幫助解碼程序進行匹配,模式標識符是4bit的二進制數:

1、數字模式(numeric mode ): 0001

2、混合字符模式(alphanumeric mode) : 0010

3、8bit byte mode: 0100

4、日本漢字(KANJI mode) : 1000

5、中國漢字(GB2312):1101

由於示例文本串是混合字符,因此將選擇alphanumeric mode,其標識碼爲:0010

三、文本串計數標識符(Character count indicator)

文本串計數標識符用來存儲源內容字符串的長度,在版本1-9的QR碼中,文本串長度標識符自身的長度被定義爲:

數字 : 10bit

混合字符 : 9bit

8bit 字節碼 : 8bit

多字節碼 : 8bit

在本例中,源文本串的長度爲8個字符,混合字符的長度爲9bit,因此將字符個數8編碼爲9位二進制表示:000001000

加上混合字符模式標識碼,總的編碼爲0010 000001000

四、數據內容編碼

 1、數字模式下的編碼

在數字模式下,數據被限制爲3個數字一段,分成若干段。如:"123456" 將分成"123" 和 "456",分別被編碼成10bit的二進制數。“123”的10bit二進制表示法爲:0001111011,實際上就是二進制的123。

當數據的長度不足3個數字時,如果只有1個數字則用4bit,如果有2個數字就用7個bit來表示。
如:"9876"被分成"987"和"6"兩段,因此被表示爲"1111011011 0110"。

2、混合字符模式下的編碼

混合字符模式編碼,其字符對照表如下:

0

 0

 

 A

 10

 

 K

 20

 

 U

 30

 

 +

 40

1

1

 

B

11

 

L

21

 

V

31

 

-

41

2

2

 

C

12

 

M

22

 

W

32

 

.

42

3

3

 

D

13

 

N

23

 

X

33

 

/

43

4

4

 

E

14

 

O

24

 

Y

34

 

:

44

5

5

 

F

15

 

P

25

 

Z

35

6

6

 

G

16

 

Q

26

 

[sp]

36

7

7

 

H

17

 

R

27

 

$

37

8

8

 

I

18

 

S

28

 

%

38

9

9

 

J

19

 

T

29

 

*

3

 

編碼方式爲:

源碼被分成兩個字符一段,如下所示,每段的第一個字符乘上45,再用第二個數字相加。因此每段變成了11bit的2進制碼,如果字符個數只有1個,則用6bit表示。

 

示例:

 

 

 

"AB"

"CD"

"E1"

"23"

 

 

45*10+11

45*12+13

45*14+1

45*2+3

 

 

461

553

631

93

0010

000001000

00111001101

01000101001

01001110111

00001011101

 

3、8bit字節數據不經編碼轉換直接保存。

五、編碼終止符(Terminator)

如果編碼後的字符長度不足當前版本和糾錯級別所存儲的容量,則在後續補"0000",如果容量已滿則無需添加終止符。此時得到的編碼串爲:

0010 000001000 00111001101 01000101001 0100111011100001011101 0000

六、編成8bit碼字(Codewords)

將以上的編碼再按8bit一組,形成碼字(code words):

 00100000 0100000111001101 01000101 00101001 11011100 00101110 10000

如果尾部數據不足8bit,則在尾部充0:

00100000 01000001 11001101 01000101 00101001 1101110000101110 10000000

如果編碼後的數據不足版本及糾錯級別的最大容量,則在尾部補充"11101100" 和"00010001",直到全部填滿。最後,版本1、Level H下的"ABCDE123" 的QR碼是:

00100000 01000001 11001101 01000101 00101001 1101110000101110 10000000 11101100

十進制表示法爲:

3265 205 69 41 220 46 128 236

 

QR碼編碼原理(日本漢字和中文編碼)

 

一、日本漢字(KANJI)是兩個字節表示的字符碼,編碼的方式是將其轉換爲13字節的二進制碼制。

轉換步驟爲:

1、對於JIS值爲8140(hex) 到9FFC(hex)之間字符:

a)將待轉換的JIS值減去8140(hex);

b)將高位字節乘以C0(hex);

c)將b)步驟生成的數據加上低位字節;

d)將結果轉換爲13位二進制串。

2、對於JIS值爲E040(hex)到EBBF(hex)之間的字符:

a)將待轉換的JIS值減去C140(hex);

b)將高位字節乘以C0(hex);

c)將b)步驟生成的數據加上低位字節;

d)將結果轉換爲13位二進制串。

 

二、中文漢字的與日文漢字轉換步驟相似:

1、對於第一字節爲0xA1~0xAA之間,第二字節在0xA1~0xFE之間字符:

a)第一字節減去0xA1;

b)上一步結果乘以0x60;

c)第二字節減去0xA1;

d)將b)步驟的結果加上c步驟的結果;

e)將結果轉換爲13位二進制串。

1、對於第一字節爲0xB0~0xFA之間,第二字節在0xA1~0xFE之間字符:

a)第一字節減去0xA6;

b)上一步結果乘以0x60;

c)第二字節減去0xA1;

d)將b)步驟的結果加上c步驟的結果;

e)將結果轉換爲13位二進制串。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章