Base64在我看來很重要的一個用途是將複雜的碼比如GBK、UTF8、MIME等複雜的碼，變成單字節的簡單ASCII字符，便於在各種不同環境（計算機）之間傳遞信息。這很好理解，只要是計算機，必須得支持ASCII標準，但不一定支持其它編碼。

編碼

Base64的編碼過程是將每三個字節即24個bit，變成以6個bit爲一組的組集，共有24/6=4組。每個組的6個bit最高能表示2^6即64個數，這也是Base64的由來。這64個數的表示區間爲[0，63]，建立一個字符索引表，輸入值爲[0，63]，輸出表中對應字符。不同的Base64變種在編碼過程主要是索引表不一樣。（可能你有個疑問，每輪需要3個byte，這必須使得需要編碼的byte長度整除3，不整除3怎麼辦？後面後講到）。

如圖所示，3個byte用紅、紫、綠表示，4個組A=A1 A2 A3 A4 A5 A6，B= B1 B2 B3 B4 B5 B6，C= C1 C2 C3 C4 C5 C6，D = D1 D2 D3 D4 D5 D6。因爲在絕大多數語言中，byte都爲最小操作單元，所以這四個組的輸出byte值將會是A’ = 0 0 A1 A2 A3 A4 A5 A6，B’ = 0 0 B1 B2 B3 B4 B5 B6 ， C’= 0 0 C1 C2 C3 C4 C5 C6，D’ = 0 0 D1 D2 D3 D4 D5 D6。一個byte只需要用到其中的6個bit，當然最高兩位要置0了。

應用一點點計算機編碼知識，假設紅byte爲R，紫byte爲P，綠byte爲G，那麼：

A’ = R >> 2，紅byte右移兩位，表示A取R的高六位。
B’ = (R << 4 & 0x3F) | P >> 4。R左移4位變爲A5 A6 B1 B2 0 0 0 0，看B’的紅色部分高兩位爲零，所以要 & 上0x3f，因爲0x3f的二進制表示爲0 0 1 1 1 1 1 1，這樣就變成 0 0 B1 B2 0 0 0 0 。P >> 4將P的高四位變爲低四位，高四位置0，變爲0 0 0 0 B3 B4 B5 B6。很顯然 0 0 B1 B2 0 0 0 0 | 0 0 0 0 B3 B4 B5 B6 = 0 0 B1 B2 B3 B4 B5 B6
C’ = (P << 2 & 0x3F) | G >> 6。P左移2位變爲B5 B6 C1 C2 C3 C3 C4 0 0，看C’的紅色部分高兩位爲零，所以要 & 上0x3f，這樣值爲0 0 C1 C2 C3 C3 C4 0 0。G右移6位爲 0 0 0 0 0 0 C5 C6。很顯然 0 0 C1 C2 C3 C3 C4 0 0 | 0 0 0 0 0 0 C5 C6 = 0 0 C1 C2 C3 C4 C5 C6。
D’ = G & 0x3F。只需將G的高兩位C5，C6置0，就是0 0 D1 D2 D3 D4 D5 D6。

不能整除3怎麼辦？

上面講的是byte長度能整除3，實際只有1/3概率可整除，另兩個1/3是餘數爲1和餘數爲2。對於不整除的情況，Base64的做法是補齊，不是補齊byte，而是補齊編碼之後的子串，使編碼字串能夠被4整除，因爲解碼只能是4個字符解成3個byte。補齊字串用了第65個字符 = 即等號。下面分別描述。

餘數爲1的情況

餘數爲1也就是上圖只能剩紅byte R了，那麼：

A’ = R >> 2。這個保持不變。
B’ = R << 4 & 0x3F。P沒有了，只能取R的最低兩位了。
C’ = '='，即C’爲填充字符= 。
D’ = '='，即D’爲填充字符= 。

餘數爲2的情況

餘數爲2也就是上圖有紅byte R，紫byte P，綠byte G沒有了。那麼：

A’ = R >> 2。這個保持不變。
B’ = (R << 4 & 0x3F) | P >> 4。這個也保持不變。
C’ = P << 2 & 0x3F。因爲G沒有了，只能取P的低四位。
D’ = '='，即D’爲填充字符= 。

前面講到，不同Base64編碼只是字符索引表不一樣，最正宗的Base64使用瞭如下字符索引表。

   1: static final char intToBase64[] = { 'A', 'B', 'C', 'D', 'E', 'F', /* 索引 0 ~ 5*/

   2:             'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S',  /* 索引6 ~ 18*/

   3:             'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',  /* 索引 19 ~ 31*/

   4:             'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's',  /* 索引 32 ~ 44*/

   5:             't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5',  /* 索引 45 ~ 57*/

   6:             '6', '7', '8', '9', '+', '/' };  /* 索引58 ~ 63*/

那麼一個Java Base64算法實現如下：

   1: private static String byteArrayToBase64(byte[] a) {

   2:     int aLen = a.length; //總長度

   3:     int numFullGroups = aLen / 3; //以3個byte組成以4個字符爲一組的組數

   4:     int numBytesInPartialGroup = aLen - 3 * numFullGroups; //餘數

   5:     int resultLen = 4 * ((aLen + 2) / 3); //輸出長度總是4倍數，如果有餘數，(aLen+2)/3保證將餘數包含，並有空間放置填充符=

   6:     StringBuffer result = new StringBuffer(resultLen);

7:

   8:     int inCursor = 0;

   9:     for (int i = 0; i < numFullGroups; i++) {

  10:         int byte0 = a[inCursor++] & 0xff;

  11:         int byte1 = a[inCursor++] & 0xff;

  12:         int byte2 = a[inCursor++] & 0xff;

  13:         result.append(intToBase64[byte0 >> 2]);

  14:         result.append(intToBase64[(byte0 << 4) & 0x3f | (byte1 >> 4)]);

  15:         result.append(intToBase64[(byte1 << 2) & 0x3f | (byte2 >> 6)]);

  16:         result.append(intToBase64[byte2 & 0x3f]);

  17:     }

  18:     //處理餘數

  19:     if (numBytesInPartialGroup != 0) {

  20:         int byte0 = a[inCursor++] & 0xff;

  21:         result.append(intToBase64[byte0 >> 2]);

  22:         //餘數爲1

  23:         if (numBytesInPartialGroup == 1) {

  24:             result.append(intToBase64[(byte0 << 4) & 0x3f]);

  25:             result.append("==");

  26:         } else {

  27:             // 餘數爲2

  28:             int byte1 = a[inCursor++] & 0xff;

  29:             result.append(intToBase64[(byte0 << 4) & 0x3f | (byte1 >> 4)]);

  30:             result.append(intToBase64[(byte1 << 2) & 0x3f]);

  31:             result.append('=');

  32:         }

  33:     }

  34:     return result.toString();

  35: }

解碼

解碼是將4個字符變成三個byte，編碼是通過字符表映射索引值到字符上，那麼顯然解碼就是將字符回索引值，即有個反向索引表，這個反向索引表與索引表一一對應，每個Base64變種修改一下這兩個表即可。反向索引表是以字符的ASCII碼碼值作爲下標查找索引表索引值。比如上圖的正向索引表intToBase64定義了加號+的索引值爲62，字符+的ASCII碼值爲43，那麼反向索引表下標值爲43的值一定是62。再比如字符A的索引表值爲0，A的ASCII碼值爲65，那麼反向索引表下標爲65的值一定是0。在基本Base64中，最大ASCII碼值爲z即122，那麼反向索引表的長度爲122+1=123。下面是對應前面的基本索引表的基本反向索引表。

   1: static final byte base64ToInt[] = { -1, -1, -1, -1, -1, -1, -1, -1,

   2:             -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,

   3:             -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,

   4:             -1, 62/* 符號+*/, -1, -1, -1, 63, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, -1,

   5:             -1, -1, -1, -1, -1, -1, 0 /* 符號A */, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

   6:             13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, -1, -1, -1, -1,

   7:             -1, -1, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,

   8:             41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 };

因爲編碼有餘數情況，所以解碼同樣要處理餘數情況。設這四個字符的對應的反向索引值爲Q1、Q2、Q3、Q4，要求解的3個byte分別爲M1，M2，M3。注意反向索引值最高爲63，所以其byte表示的最高兩位總爲0。

沒有餘數的情況

M1 = Q1 << 2 | Q2 >> 4。Q1可表示爲0 0 x x x x x x，左移兩位變成x x x x x x 0 0。Q2也表示爲 0 0 x x x x x x，右移四位變成0 0 0 0 0 0 x x 。那麼這兩個或一下正好是 x x x x x x x x。也就是由字符Q1的有效六位組成M1的高六位，然後用Q2的最高兩個有效位組成M2的最低兩位。
M2 = Q2 << 4 | Q3 >> 2。如M2所描述那樣，M2的高四位是Q2的低四位，低四位是Q3的高四位。Q2：0 0 x x x x x x –> x x x x 0 0 0 0，Q2：0 0 0 x x x x x x –> 0 0 0 0 x x x x。很顯然x x x x 0 0 0 0 | 0 0 0 0 x x x x = x x x x x x x x。
M3 = Q3 << 6 | Q4。M3的高兩位是Q3的最低兩位，低六位是Q4的有效六位。

餘數爲1的情況

餘數爲1即編碼的最後兩個字符都是=。也就是說只有Q1、Q2。只需要聯合Q1和Q2組成餘出來的1個字節M1即可。

M1 = Q1 << 2 | Q2 >> 4。

餘數爲2的情況

餘數爲2即編碼的只有最後一位是=。也就是說通過Q1，Q2，Q3組成餘下來的兩個字節M1，M2即可。

M1 = Q1 << 2 | Q2 >> 4。
M2 = Q2 << 4 | Q3 >> 2。

以下是解碼的Java實現。

   1: private static byte[] base64ToByteArray(String s) throws Exception {

   2:     //字符總長必須是4的倍數

   3:     int sLen = s.length();

   4:     int numGroups = sLen / 4;

   5:     if (4 * numGroups != sLen)

   6:         throw new IllegalArgumentException(

   7:                 "字串長度必須是4的倍數");

   8:     //餘1個byte則算漏了兩個byte，餘2個byte則算漏掉了1個byte

   9:     int missingBytesInLastGroup = 0;

  10:     int numFullGroups = numGroups;

  11:     if (sLen != 0) {

  12:         //餘2個byte的情況

  13:         if (s.charAt(sLen - 1) == '=') {

  14:             missingBytesInLastGroup++;

  15:             //如果有餘數發生，則完整3個byte組數少一個。

  16:             numFullGroups--;

  17:         }

  18:         //餘1個byte的情況

  19:         if (s.charAt(sLen - 2) == '=')

  20:             missingBytesInLastGroup++;

  21:     }

  22:     //總字節長度

  23:     byte[] result = new byte[3 * numGroups - missingBytesInLastGroup];

24:

  25:     try {

  26:         int inCursor = 0, outCursor = 0;

  27:         for (int i = 0; i < numFullGroups; i++) {

  28:             int ch0 = base64toInt(s.charAt(inCursor++), base64ToInt);

  29:             int ch1 = base64toInt(s.charAt(inCursor++), base64ToInt);

  30:             int ch2 = base64toInt(s.charAt(inCursor++), base64ToInt);

  31:             int ch3 = base64toInt(s.charAt(inCursor++), base64ToInt);

  32:             result[outCursor++] = (byte) ((ch0 << 2) | (ch1 >> 4));

  33:             result[outCursor++] = (byte) ((ch1 << 4) | (ch2 >> 2));

  34:             result[outCursor++] = (byte) ((ch2 << 6) | ch3);

  35:         }

  36:         if (missingBytesInLastGroup != 0) {

  37:             int ch0 = base64toInt(s.charAt(inCursor++), base64ToInt);

  38:             int ch1 = base64toInt(s.charAt(inCursor++), base64ToInt);

  39:             //不管餘1還是餘2個byte，肯定要解碼一個byte。

  40:             result[outCursor++] = (byte) ((ch0 << 2) | (ch1 >> 4));

41:

  42:             //如果餘2個，即差一個才構成3byte，那麼還要解碼第二個byte。

  43:             if (missingBytesInLastGroup == 1) {

  44:                 int ch2 = base64toInt(s.charAt(inCursor++), base64ToInt);

  45:                 result[outCursor++] = (byte) ((ch1 << 4) | (ch2 >> 2));

  46:             }

  47:         }

  48:     } catch (Exception e) {

  49:         throw e;

  50:     }

  51:     return result;

  52: }

53:

  54: private static int base64toInt(char c, byte[] alphaToInt) throws Exception {

  55:     int result = alphaToInt[c];

  56:     if (result < 0)

  57:         throw new Exception("非法索引值");

  58:     return result;

  59: }

變種

因爲Base64編解碼的變種只與索引表和反向索引表有關係，所以可以在ASCII碼(1字節範圍內）做任意變種。下面描述一個變種例子。

假如要將中文用基本Base64索引表編碼成字串，將其作爲參數在瀏覽器裏傳輸，很不幸，因爲基本表中會出現+和/字符，這個一般會被瀏覽器理解成空格和路徑分割符。所以爲了讓其工作正常，需要把索引表的最後兩個字符+和/分別替換成點 . 和下劃線 _ 。

正向索引表：

   1: static final char intToBase64[] = { 'A', 'B', 'C', 'D', 'E', 'F', /* 索引 0 ~ 5*/

   2:             'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S',  /* 索引6 ~ 18*/

   3:             'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',  /* 索引 19 ~ 31*/

   4:             'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's',  /* 索引 32 ~ 44*/

   5:             't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5',  /* 索引 45 ~ 57*/

   6:             '6', '7', '8', '9', '.'/*原先是字符+*/, '_'/*原先是字符/ */ };  /* 索引58 ~ 63*/

反向索引表改的稍微多點，字符. 的ASCII碼值爲46，下劃線碼值爲95。則需要將原來+和/ 的索引位置改成-1，將索引位置46從-1改成62，位置95處從-1改成63。

   1: static final byte base64ToInt[] = { -1, -1, -1, -1, -1, -1, -1, -1,

   2:             -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,

   3:             -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,

   4:             -1, -1/*原先是62*/, -1, -1, 62/*原先是-1*/, -1/*原先是63*/, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, -1,

   5:             -1, -1, -1, -1, -1, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,

   6:             13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, -1, -1, -1, -1,

   7:             63/*原先是-1*/, -1, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40,

   8:             41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 };

Base64編碼詳解及其變種(解決加號在URL變空格問題）

編碼

不能整除3怎麼辦？

餘數爲1的情況

餘數爲2的情況

解碼

沒有餘數的情況

餘數爲1的情況

餘數爲2的情況

變種

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

一位大師總結的東西---J2EE學習中一些值得研究的開源項目

db2數據庫進入命令控制端方法與過程（windows系統下）

web開發中cab文件使用

weblogic 部署war 和訪問路徑上下文設置

解決odbc連接oracle數據庫用localhost連不到數據的辦法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結