【拓展】868- 一文讀懂base64

一、爲什麼要使用 base64

我們知道一個字節可表示的範圍是 0 ~ 255(十六進制:0x00 ~ 0xFF), 其中 ASCII 值的範圍爲 0 ~ 127(十六進制:0x00 ~ 0x7F);而超過 ASCII 範圍的 128~255(十六進制:0x80 ~ 0xFF)之間的值是不可見字符。

ASCII(American Standard Code for Information Interchange,美國信息交換標準代碼)是基於拉丁字母的一套電腦編碼系統。它主要用於顯示現代英語,而其擴展版本延伸美國標準信息交換碼則可以部分支持其他西歐語言,並等同於國際標準 ISO/IEC 646。

在 ASCII 碼中 0 - 31和 127 是控制字符,共 33 個。以下是其中一部分控制字符:

其餘 95 個,即 32 - 126 是可打印字符,包括數字、大小寫字母、常用符號等。

當不可見字符在網絡上傳輸時,比如說從 A 計算機傳到 B 計算機,往往要經過多個路由設備,由於不同的設備對字符的處理方式有一些不同,這樣那些不可見字符就有可能被處理錯誤,這是不利於傳輸的。

爲了解決這個問題,我們可以先對數據進行編碼,比如 base64 編碼,變成可見字符,也就是 ASCII 碼可表示的可見字符,從而確保數據可靠傳輸。Base64 的內容是有 0 ~ 9,a ~ z,A ~ Z,+,/ 組成,正好 64 個字符,這些字符是在 ASCII 可表示的範圍內,屬於 95 個可見字符的一部分。

二、什麼是 base64

Base64 是一種基於 64 個可打印字符來表示二進制數據的表示方法。由於 2⁶ = 64 ,所以每 6 個比特爲一個單元,對應某個可打印字符。3 個字節有 24 個比特,對應於 4 個 base64 單元,即 3 個字節可由 4 個可打印字符來表示。相應的轉換過程如下圖所示:

Base64 常用於在處理文本數據的場合,表示、傳輸、存儲一些二進制數據,包括 MIME 的電子郵件及 XML 的一些複雜數據。在 MIME 格式的電子郵件中,base64 可以用來將二進制的字節序列數據編碼成 ASCII 字符序列構成的文本。使用時,在傳輸編碼方式中指定 base64。使用的字符包括大小寫拉丁字母各 26 個、數字 10 個、加號 + 和斜槓 /,共 64 個字符,等號  = 用來作爲後綴用途。Base64 相應的索引表如下:

瞭解完上述的知識,我們以編碼 Man 字符串爲例,來直觀的感受一下編碼過程。Man 由 M、a 和 n 3 個字符組成,它們對應的 ASCII 碼爲 77、97 和 110。

接着我們以每 6 個比特爲一個單元,進行 base64 編碼操作,具體如下圖所示:

由圖可知,Man (3字節)編碼的結果爲 TWFu(4字節),很明顯經過 base64 編碼後體積會增加 1/3。Man 這個字符串的長度剛好是 3,我們可以用 4 個 base64 單元來表示。但如果待編碼的字符串長度不是 3 的整數倍時,應該如何處理呢?

如果要編碼的字節數不能被 3 整除,最後會多出 1 個或 2 個字節,那麼可以使用下面的方法進行處理:先使用 0 字節值在末尾補足,使其能夠被 3 整除,然後再進行 base64 的編碼。

以編碼字符 A 爲例,其所佔的字節數爲 1,不能被 3 整除,需要補 2 個字節,具體如下圖所示:

由上圖可知,字符 A 經過 base64 編碼後的結果是 QQ==,該結果後面的兩個 = 代表補足的字節數。而最後個 1 個 base64 字節塊有 4 位是 0 值。

接着我們來看另一個示例,假設需編碼的字符串爲 BC,其所佔字節數爲 2,不能被 3 整除,需要補 1 個字節,具體如下圖所示:

由上圖可知,字符串 BC 經過 base64 編碼後的結果是 QkM=,該結果後面的 1 個 = 代表補足的字節數。而最後個 1 個 base64 字節塊有 2 位是 0 值。

三、base64 編碼的應用

3.1 顯示 base64 編碼的圖片

在編寫 HTML 網頁時,對於一些簡單圖片,通常會選擇將圖片內容直接內嵌在網頁中,從而減少不必要的網絡請求,但是圖片數據是二進制數據,該怎麼嵌入呢?絕大多數現代瀏覽器都支持一種名爲 Data URLs 的特性,允許使用 base64 對圖片或其他文件的二進制數據進行編碼,將其作爲文本字符串嵌入網頁中。

Data URLs 由四個部分組成:前綴(data:)、指示數據類型的 MIME 類型、如果非文本則爲可選的 base64 標記、數據本身:

data:[<mediatype>][;base64],<data>

mediatype 是個 MIME 類型的字符串,例如 "image/jpeg" 表示 JPEG 圖像文件。如果被省略,則默認值爲 text/plain;charset=US-ASCII。如果數據是文本類型,你可以直接將文本嵌入(根據文檔類型,使用合適的實體字符或轉義字符)。如果是二進制數據,你可以將數據進行 base64 編碼之後再進行嵌入。比如嵌入一張圖片:

<img alt="logo" src="...">

MIME(Multipurpose Internet Mail Extensions)多用途互聯網郵件擴展類型,是設定某種擴展名的文件用一種應用程序來打開的方式類型,當該擴展名文件被訪問的時候,瀏覽器會自動使用指定應用程序來打開。多用於指定一些客戶端自定義的文件名,以及一些媒體文件打開方式。

常見的 MIME 類型有:超文本標記語言文本 .html text/html、PNG圖像 .png image/png、普通文本 .txt text/plain 等。

但需要注意的是:如果圖片較大,圖片的色彩層次比較豐富,則不適合使用這種方式,因爲該圖片經過 base64 編碼後的字符串非常大,會明顯增大 HTML 頁面的大小,從而影響加載速度。 除此之外,利用 HTML FileReader API,我們也可以方便的實現圖片本地預覽功能,具體代碼如下:

<input type="file" accept="image/*" onchange="loadFile(event)">
<img id="output"/>
<script>
  const loadFile = function(event{
    const reader = new FileReader();
    reader.onload = function(){
      const output = document.querySelector('#output');
      output.src = reader.result;
    };
    reader.readAsDataURL(event.target.files[0]);
  };
</script>

在完成本地圖片預覽之後,可以直接把圖片對應的 Data URLs 數據提交到服務器。針對這種情形,服務端需要做一些相關處理,才能正常保存上傳的圖片,這裏以 Express 爲例,具體處理代碼如下:

const app = require('express')();

app.post('/upload'function(req, res){
  let imgData = req.body.imgData; // 獲取POST請求中的base64圖片數據
  let base64Data = imgData.replace(/^data:image\/\w+;base64,/"");
  let dataBuffer = Buffer.from(base64Data, 'base64');
  fs.writeFile("image.png", dataBuffer, function(err{
    if(err){
       res.send(err);
    }else{
       res.send("圖片上傳成功!");
    }
    });
});

3.2 瀏覽器端圖片壓縮

在一些場合中,我們希望在上傳本地圖片時,先對圖片進行一定的壓縮,然後再提交到服務器,從而減少傳輸的數據量。在前端要實現圖片壓縮,我們可以利用 Canvas 對象提供的 toDataURL() 方法,該方法接收 typeencoderOptions 兩個可選參數。

其中 type 表示圖片格式,默認爲 image/png。而 encoderOptions 用於表示圖片的質量,在指定圖片格式爲 image/jpegimage/webp 的情況下,可以從 0 到 1 的區間內選擇圖片的質量。如果超出取值範圍,將會使用默認值 0.92,其他參數會被忽略。

下面我們來看一下具體如何實現圖片壓縮:

// compress.js
const MAX_WIDTH = 800// 圖片最大寬度

function compress(base64, quality, mimeType{
  let canvas = document.createElement("canvas");
  let img = document.createElement("img");
  img.crossOrigin = "anonymous";
  return new Promise((resolve, reject) => {
    img.src = base64;
    img.onload = () => {
      let targetWidth, targetHeight;
      if (img.width > MAX_WIDTH) {
        targetWidth = MAX_WIDTH;
        targetHeight = (img.height * MAX_WIDTH) / img.width;
      } else {
        targetWidth = img.width;
        targetHeight = img.height;
      }
      canvas.width = targetWidth;
      canvas.height = targetHeight;
      let ctx = canvas.getContext("2d");
      ctx.clearRect(00, targetWidth, targetHeight);
      ctx.drawImage(img, 00, canvas.width, canvas.height);
      let imageData = canvas.toDataURL(mimeType, quality / 100);
      resolve(imageData);
    };
  });
}

對於返回的 Data URL 格式的圖片數據,爲了進一步減少傳輸的數據量,我們可以把它轉換爲 Blob 對象:

function dataUrlToBlob(base64, mimeType{
  let bytes = window.atob(base64.split(",")[1]);
  let ab = new ArrayBuffer(bytes.length);
  let ia = new Uint8Array(ab);
  for (let i = 0; i < bytes.length; i++) {
    ia[i] = bytes.charCodeAt(i);
  }
  return new Blob([ab], { type: mimeType });
}

在轉換完成後,我們就可以壓縮後的圖片對應的 Blob 對象封裝在 FormData 對象中,然後再通過 AJAX 提交到服務器上:

function uploadFile(url, blob{
  let formData = new FormData();
  let request = new XMLHttpRequest();
  formData.append("image", blob);
  request.open("POST", url, true);
  request.send(formData);
}

其實 Canvas 對象除了提供 toDataURL() 方法之外,它還提供了一個 toBlob() 方法,該方法的語法如下:

canvas.toBlob(callback, mimeType, qualityArgument)

toDataURL() 方法相比,toBlob() 方法是異步的,因此多了個 callback 參數,這個 callback 回調方法默認的第一個參數就是轉換好的 blob 文件信息。

介紹完上述的內容,我們來看一下本地圖片壓縮完整的示例:

<!DOCTYPE html>
<html>
  <head>
    <meta charset="UTF-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <title>本地圖片壓縮</title>
  </head>
  <body>
    <input type="file" accept="image/*" onchange="loadFile(event)" />
    <script src="./compress.js"></script>
    <script>
      const loadFile = function (event{
        const reader = new FileReader();
        reader.onload = async function ({
          let compressedDataURL = await compress(
            reader.result,
            90,
            "image/jpeg"
          );
          let compressedImageBlob = dataUrlToBlob(compressedDataURL);
          uploadFile("https://httpbin.org/post", compressedImageBlob);
        };
        reader.readAsDataURL(event.target.files[0]);
      };
    
</script>
  </body>
</html>

四、如何進行 base64 編碼和解碼

4.1 使用 btoa 與 atob 函數

在 JavaScript 中,有兩個函數被分別用來處理解碼和編碼 base64 字符串:

  • btoa():從字符串創建一個 base64 編碼的 ASCII 字符串,其中字符串中的每個字符都被視爲一個二進制數據字節。
  • atob():該函數能夠解碼通過 base64 編碼的字符串數據。
btoa 使用示例
const name = 'Semlinker';
const encodedName = btoa(name);
console.log(encodedName); // U2VtbGlua2Vy
atob 使用示例
const encodedName = 'U2VtbGlua2Vy';
const name = atob(encodedName);
console.log(name); // Semlinker

介紹完 btoaatob 這兩個函數,我們再來看一下它們的兼容性:

(圖片來源 —— https://caniuse.com/?search=atob)

由上圖可知,除了 IE6-9 和 Opera 10.1 這些版本的瀏覽器之外,主流的瀏覽器都支持 btoaatob 這兩個函數。

4.2 使用第三方庫

對於不支持 btoaatob 這兩個函數的瀏覽器來說,我們可以使用第三方庫,比如 js-base64 這個庫,來實現 base64 的編碼和解碼。

具體的使用示例如下:

<!DOCTYPE html>
<html lang="zh">
  <head>
    <meta charset="UTF-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <title>Base64 編碼與解碼示例</title>
    <script src="https://cdn.jsdelivr.net/npm/[email protected]/base64.min.js"></script>
  </head>
  <body>
    <h3>Base64 編碼與解碼示例</h3>
    <script>
      let name = Base64.encode("阿寶哥");
      console.log(name);
      console.log(Base64.decode(name));
    
</script>
  </body>
</html>

在前端進行二進制處理的場景中,你可能會遇到 Data URL 轉換成 Blob/File 對象的情形,接下來阿寶哥將彙總一下常用的轉換函數。

五、常用轉換函數

5.1 Data URL 轉 Blob 對象

function dataUrlToBlob(dataurl, mimeType{
  let bytes = window.atob(dataurl.split(",")[1]);
  let ab = new ArrayBuffer(bytes.length);
  let ia = new Uint8Array(ab);
  for (let i = 0; i < bytes.length; i++) {
    ia[i] = bytes.charCodeAt(i);
  }
  return new Blob([ab], { type: mimeType });
}

// 使用示例
let blob = dataUrlToBlob('data:text/plain;base64,aGVsbG8gd29ybGQ=','hello.txt');
console.log(blob);

5.2 Data URL 轉 File 對象

function dataUrlToFile(dataurl, filename{
  let arr = dataurl.split(","),
  mime = arr[0].match(/:(.*?);/)[1],
  bstr = atob(arr[1]),
  n = bstr.length,
  u8arr = new Uint8Array(n);
  while (n--) {
    u8arr[n] = bstr.charCodeAt(n);
  }
  return new File([u8arr], filename, { type: mime });
}

// 使用示例
let file = dataUrlToFile('data:text/plain;base64,aGVsbG8gd29ybGQ=','hello.txt');
console.log(file);

5.3 URL 轉 File 對象

function urlToFile(url, filename, mimeType{
  return fetch(url).then((res) => {
    return res.arrayBuffer();
  }).then((buffer) =>{
    return new File([buffer], filename, { type: mimeType });
  });
}

// 使用示例
urlToFile('data:text/plain;base64,aGVsbG8gd29ybGQ=''hello.txt','text/plain')
  .then(function(file)console.log(file);});

六、總結

Base64 是一種數據編碼方式,目的是爲了保障數據的安全傳輸。但標準的 base64 編碼無需額外的信息,即可以進行解碼,是完全可逆的。因此在涉及傳輸私密數據時,並不能直接使用 base64 編碼,而是要使用專門的對稱或非對稱加密算法。如果你對加密感興趣的話,可以閱讀 玩轉混合加密 這篇文章。

七、參考資源

  • 維基百科 - Base64
  • Base64 編碼原理與應用
  • 知乎 - 爲什麼要使用base64編碼,有哪些情景需求?

本文分享自微信公衆號 - 前端自習課(FE-study)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章