前端高級進階:javascript 代碼是如何被壓縮的

隨着前端的發展,特別是 ReactVue 等構造單頁應用的興起,前端的能力得以很大提升,隨之而來的是項目的複雜度越來越大。此時的前端的靜態資源也越來越龐大,而毫無疑問 javascript 資源已是前端的主體資源,對於壓縮它的體積至爲重要。

爲什麼說更小的體積很重要呢:更小的體積對於用戶體驗來說意味着更快的加載速度以及更好的用戶體驗,這也能早就企業更大的利潤。另外,更小的體積對於服務器來說也意味更小的帶寬以及更少的服務器費用。

前端構建編譯代碼時,可以使用 webpack 中的 optimization.minimizer 來對代碼進行壓縮優化。但是我們也需要了解如何它是壓縮代碼的,這樣當在生產環境的控制檯調試代碼時對它也有更深刻的理解。

如何查看資源的體積

對於我們所編寫的代碼,它在操作系統中是一個文件,根據文件系統中的 stat 信息我們可以查看該文件的大小。

stat 命令用來打印文件系統的信息:

$ stat config.js
  File: ‘config.js’
  Size: 3663            Blocks: 8          IO Block: 4096   regular file
  Device: fd01h/64769d    Inode: 806060      Links: 1
  Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)
  Access: 2020-02-13 13:43:54.851381702 +0800
  Modify: 2020-02-13 13:43:52.668417641 +0800
  Change: 2020-02-13 13:43:52.691417262 +0800
  Birth: -

stat 打印的信息過大,如果只用來衡量體積,可以使用 wc -c

$ wc -c config.js
  3663 config.js

如何壓縮代碼體積?

去除多餘字符: 空格,換行及註釋

// 對兩個數求和
function sum (a, b) {
  return a + b;
}

先把一個抽象的問題給具體化,如果是以上一段代碼,那如何壓縮它的體積呢:

此時文件大小是 62 Byte一般來說中文會佔用更大的空間

多餘的空白字符會佔用大量的體積,如空格,換行符,另外註釋也會佔用文件體積。當我們把所有的空白符合註釋都去掉之後,代碼體積會得到減少。

去掉多餘字符之後,文件大小已經變爲 30 Byte。 壓縮後代碼如下:

function sum(a,b){return a+b}

替換掉多餘字符後會有什麼問題產生呢?

有,比如多行代碼壓縮到一行時要注意行尾分號。 這就需要通過以下介紹的 AST 來解決。

壓縮變量名:變量名,函數名及屬性名

function sum (first, second) {
  return first + second;
}

如以上 firstsecond 在函數的作用域中,在作用域外不會引用它,此時可以讓它們的變量名稱更短。但是如果這是一個 module 中,sum 這個函數也不會被導出呢?那可以把這個函數名也縮短。

// 壓縮: 縮短變量名
function sum (x, y) {
  return x + y;
}

// 再壓縮: 去除空餘字符
function s(x,y){return a+b}

在這個示例中,當完成代碼壓縮 (compress) 時,代碼的混淆 (mangle) 也捎帶完成。但此時縮短變量的命名也需要 AST 支持,不至於在作用域中造成命名衝突。

更簡單的表達:合併聲明以及布爾值簡化

合併聲明的示例如下:

// 壓縮前
const a = 3;
const b = 4;

// 壓縮後
const a = 3, b = 4;

布爾值簡化的示例如下:

// 壓縮前
!b && !c && !d && !e

// 壓縮後
b||c||d||e

這個示例更是需要解析 AST 了

AST

AST,抽象語法樹,js 代碼解析後的最小詞法單元,而這個過程就是通過 Parser 來完成的。

那麼 AST 可以做什麼呢?

  • eslint: 校驗你的代碼風格
  • babel: 編譯代碼到 ES 低版本
  • taro/mpvue: 各種可以多端運行的小程序框架
  • GraphQL: 解析客戶端查詢

我們在日常工作中經常會不經意間與它打交道,如 eslintbabel,都會涉及到 js 與代碼中游走。不同的解析器會生成不同的 AST,司空見慣的是 babel 使用的解析器 babylon,而 uglify 在代碼壓縮中使用到的解析器是 UglifyJS

你可以在 AST Explorer[3] 中直觀感受到,如下圖:
在這裏插入圖片描述
那壓縮代碼的過程:code -> AST -> (transform)一顆更小的 AST -> code,這與 babeleslint 的流程一模一樣。
在這裏插入圖片描述

UglifyJS

不要重複造輪子!

於是我找了一個久負盛名的關於代碼壓縮的庫: UglifyJS3[4],一個用以代碼壓縮混淆的庫。那它是如何完成一些壓縮功能的,比如替換空白符,答案是 AST。

webpack 中內置的代碼壓縮插件就是使用了它,它的工作流程大致如下:

// 原始代碼
const code = `const a = 3;`

// 通過 UglifyJS 把代碼解析爲 AST
const ast = UglifyJS.parse(code);
ast.figure_out_scope();


// 轉化爲一顆更小的 AST 樹
compressor = UglifyJS.Compressor();
ast = ast.transform(compressor);

// 再把 AST 轉化爲代碼
code = ast.print_to_string();

而當你真正使用它來壓縮代碼時,你只需要面向配置編程即可,文檔參考 uglify 官方文檔[5]

{
  {
    ecma: 8,
  },
  compress: {
    ecma: 5,
    warnings: false,
    comparisons: false,
    inline: 2,
  },
  output: {
    ecma: 5,
    comments: false,
    ascii_only: true,
  }
}

在 webpack 中壓縮代碼

在知道代碼壓縮是怎麼完成的之後,我們終於可以把它搬到生產環境中去壓縮代碼。終於到了實踐的時候了,雖然它只是簡單的調用 API 並且調調參數。

一切與性能優化相關的都可以在 optimization 中找到,TerserPlugin 是一個底層基於 uglifyjs 的用來壓縮 JS 的插件。

optimization: {
  minimize: isEnvProduction,
  minimizer: [
    new TerserPlugin({
      terserOptions: {
        parse: {
          ecma: 8,
        },
        compress: {
          ecma: 5,
          warnings: false,
          comparisons: false,
          inline: 2,
        },
        output: {
          ecma: 5,
          comments: false,
          ascii_only: true,
        },
      },
      sourceMap: true
    })
  ]
}

參考資料

1. shfshanyue/blog
2. 前端工程化系列
3. AST Explorer
4. UglifyJS3
5. uglify 官方文檔

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章