Node多線程

從 Node 線程說起

一般人理解 Node 是單線程的，所以 Node 啓動後線程數應該爲 1，我們做實驗看一下。

setInterval(() => {
  console.log(new Date().getTime())
}, 3000)
複製代碼

可以看到 Node 進程佔用了 7 個線程。爲什麼會有 7 個線程呢？

我們都知道，Node 中最核心的是 v8 引擎，在 Node 啓動後，會創建 v8 的實例，這個實例是多線程的。

主線程：編譯、執行代碼。
編譯/優化線程：在主線程執行的時候，可以優化代碼。
分析器線程：記錄分析代碼運行時間，爲 Crankshaft 優化代碼執行提供依據。
垃圾回收的幾個線程。

所以大家常說的 Node 是單線程的指的是 JavaScript 的執行是單線程的，但 Javascript 的宿主環境，無論是 Node 還是瀏覽器都是多線程的。

Node 有兩個編譯器：
full-codegen：簡單快速地將 js 編譯成簡單但是很慢的機械碼。
Crankshaft：比較複雜的實時優化編譯器，編譯高性能的可執行代碼。

某些異步 IO 會佔用額外的線程

還是上面那個例子，我們在定時器執行的同時，去讀一個文件：

const fs = require('fs')

setInterval(() => {
    console.log(new Date().getTime())
}, 3000)

fs.readFile('./index.html', () => {})
複製代碼

線程數量變成了 11 個，這是因爲在 Node 中有一些 IO 操作（DNS，FS）和一些 CPU 密集計算（Zlib，Crypto）會啓用 Node 的線程池，而線程池默認大小爲 4，因爲線程數變成了 11。

我們可以手動更改線程池默認大小：

process.env.UV_THREADPOOL_SIZE = 64
複製代碼

一行代碼輕鬆把線程變成 71。

cluster 是多線程嗎？

Node 的單線程也帶來了一些問題，比如對 cpu 利用不足，某個未捕獲的異常可能會導致整個程序的退出等等。因爲 Node 中提供了 cluster 模塊，cluster 實現了對 child_process 的封裝，通過 fork 方法創建子進程的方式實現了多進程模型。比如我們最常用到的 pm2 就是其中最優秀的代表。

我們看一個 cluster 的 demo：

const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;

if (cluster.isMaster) {
  console.log(`主進程 ${process.pid} 正在運行`);
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`工作進程 ${worker.process.pid} 已退出`);
  });
} else {
  // 工作進程可以共享任何 TCP 連接。
  // 在本例子中，共享的是 HTTP 服務器。
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end('Hello World');
  }).listen(8000);
  console.log(`工作進程 ${process.pid} 已啓動`);
}
複製代碼

這個時候看下活動監視器：

一共有 9 個進程，其中一個主進程，cpu 個數 x cpu 核數 = 2 x 4 = 8 個子進程。

所以無論 child_process 還是 cluster，都不是多線程模型，而是多進程模型。雖然開發者意識到了單線程模型的問題，但是沒有從根本上解決問題，而且提供了一個多進程的方式來模擬多線程。從前面的實驗可以看出，雖然 Node （V8）本身是具有多線程的能力的，但是開發者並不能很好的利用這個能力，更多的是由 Node 底層提供的一些方式來使用多線程。Node 官方說：

You can use the built-in Node Worker Pool by developing a C++ addon. On older versions of Node, build your C++ addon using NAN, and on newer versions use N-API. node-webworker-threads offers a JavaScript-only way to access Node’s Worker Pool.

但是對於 JavaScript 開發者，一直沒有一個標準的、好用的方式來使用 Node 的多線程能力。

真 - Node 多線程

直到 Node 10.5.0 的發佈，官方纔給出了一個實驗性質的模塊 worker_threads 給 Node 提供真正的多線程能力。

先看下簡單的 demo：

const {
  isMainThread,
  parentPort,
  workerData,
  threadId,
  MessageChannel,
  MessagePort,
  Worker
} = require('worker_threads');

function mainThread() {
  for (let i = 0; i < 5; i++) {
    const worker = new Worker(__filename, { workerData: i });
    worker.on('exit', code => { console.log(`main: worker stopped with exit code ${code}`); });
    worker.on('message', msg => {
      console.log(`main: receive ${msg}`);
      worker.postMessage(msg + 1);
    });
  }
}

function workerThread() {
  console.log(`worker: workerDate ${workerData}`);
  parentPort.on('message', msg => {
    console.log(`worker: receive ${msg}`);
  }),
  parentPort.postMessage(workerData);
}

if (isMainThread) {
  mainThread();
} else {
  workerThread();
}
複製代碼

上述代碼在主線程中開啓五個子線程，並且主線程向子線程發送簡單的消息。

由於 worker_thread 目前仍然處於實驗階段，所以啓動時需要增加 --experimental-worker flag，運行後觀察活動監視器：

不多不少，正好多了五個子線程。

worker_thread 模塊

worker_thread 核心代碼

worker_thread 模塊中有 4 個對象和 2 個類。

isMainThread: 是否是主線程，源碼中是通過 threadId === 0 進行判斷的。
MessagePort: 用於線程之間的通信，繼承自 EventEmitter。
MessageChannel: 用於創建異步、雙向通信的通道實例。
threadId: 線程 ID。
Worker: 用於在主線程中創建子線程。第一個參數爲 filename，表示子線程執行的入口。
parentPort: 在 worker 線程裏是表示父進程的 MessagePort 類型的對象，在主線程裏爲 null
workerData: 用於在主進程中向子進程傳遞數據（data 副本）

來看一個進程通信的例子：

const assert = require('assert');
const {
  Worker,
  MessageChannel,
  MessagePort,
  isMainThread,
  parentPort
} = require('worker_threads');
if (isMainThread) {
  const worker = new Worker(__filename);
  const subChannel = new MessageChannel();
  worker.postMessage({ hereIsYourPort: subChannel.port1 }, [subChannel.port1]);
  subChannel.port2.on('message', (value) => {
    console.log('received:', value);
  });
} else {
  parentPort.once('message', (value) => {
    assert(value.hereIsYourPort instanceof MessagePort);
    value.hereIsYourPort.postMessage('the worker is sending this');
    value.hereIsYourPort.close();
  });
}
複製代碼

更多詳細用法可以查看官方文檔。

多進程 vs 多線程

根據大學課本上的說法：“進程是資源分配的最小單位，線程是CPU調度的最小單位”，這句話應付考試就夠了，但是在實際工作中，我們還是要根據需求合理選擇。

下面對比一下多線程與多進程：

屬性	多進程	多線程	比較
數據	數據共享複雜，需要用IPC；數據是分開的，同步簡單	因爲共享進程數據，數據共享簡單，同步複雜	各有千秋
CPU、內存	佔用內存多，切換複雜，CPU利用率低	佔用內存少，切換簡單，CPU利用率高	多線程更好
銷燬、切換	創建銷燬、切換複雜，速度慢	創建銷燬、切換簡單，速度很快	多線程更好
coding	編碼簡單、調試方便	編碼、調試複雜	多進程更好
可靠性	進程獨立運行，不會相互影響	線程同呼吸共命運	多進程更好
分佈式	可用於多機多核分佈式，易於擴展	只能用於多核分佈式	多進程更好

上述比較僅表示一般情況，並不絕對。

work_thread 讓 Node 有了真正的多線程能力，算是不小的進步。

作者：騰訊IVWEB團隊
鏈接：https://juejin.im/post/6844903775937757192
來源：掘金
著作權歸作者所有。商業轉載請聯繫作者獲得授權，非商業轉載請註明出處。

從 Node 線程說起

某些異步 IO 會佔用額外的線程

cluster 是多線程嗎？

真 - Node 多線程

worker_thread 模塊

多進程 vs 多線程

.NET開源強大、易於使用的緩存框架 - FusionCache

面試，有時候是個運氣活

淺入淺出 Android 安全（一）：Android

淺入淺出 Android 安全：第六章 Android 安全的其它話題

淺入淺出 Android 安全：第五章 Android 應用層安全

Android App 內存分配 heapsize & heapgrowthlimit

NodeJS源碼分析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結