命令行批量截圖Node腳本

批量截圖任務

作爲一個軟件工程師,不只是做好自己的本職工作(iOS),而是需要解決項目中的技術問題。這次就是解決自動截圖的問題
早期公司的數據工程師利用 phantomjs 來截圖,後期不斷髮現截圖效率低,加之開發者團隊不再維護,因此決定將截圖這部分跟你剝離開來,以後方便開發維護。我就承擔了這個工作

puppeteer

Puppeteer is a Node library which provides a high-level API to control Chrome or Chromium over the DevTools Protocol. Puppeteer runs headless by default, but can be configured to run full (non-headless) Chrome or Chromium.

安裝問題

一開始按照往常的套路(npm install --save puppeteer) 好幾次都卡住了,後期查找資料發現切換到國內的鏡像就可以順利下載

 PUPPETEER_DOWNLOAD_HOST=https://storage.googleapis.com.cnpmjs.org npm i --save puppeteer
  • To use Puppeteer in your project, run:

    PUPPETEER_DOWNLOAD_HOST=https://storage.googleapis.com.cnpmjs.org npm i --save puppeteer
  • Install some basic packages

    npm install 

Usage

const puppeteer = require('puppeteer'),
      fs = require('fs'),
      path = require('path'),
      request = require('request')

function mkdirsSync(dirname) {
  if (fs.existsSync(dirname)) {
    return true
  } else {
    if (mkdirsSync(path.dirname(dirname))) {
      fs.mkdirSync(dirname)
      return true
    }
  }
}

var snapShotFolerPath = path.join(__dirname, '../snspshot/')
mkdirsSync(snapShotFolerPath)

 function snapShot (taskInfo) {
  return new Promise(function (resolve, reject) {

    (async function(){
      // 啓動Chromium
      const browser = await puppeteer.launch({ignoreHTTPSErrors: true, headless:true, args: ['--no-sandbox']})
      // 打開新頁面
      const page = await browser.newPage()
      // 設置頁面分辨率
      await page.setViewport({width: 1920, height: 1080})

      // 訪問
      await page.goto(taskInfo.websiteUrl, {waitUntil: 'domcontentloaded'}).catch(err => console.log(err))
      await page.waitFor(1000)

      try {
        // 截圖
        await page.screenshot({path: snapShotFolerPath + taskInfo.imageName, fullPage:true}).catch(err => {
          console.log('截圖失敗: ' + err)
        });
        await page.waitFor(6000)
      } catch (e) {
        console.log('failed ' + e)
      } finally {
        await browser.close()

        fs.stat(snapShotFolerPath + taskInfo.imageName, function(err,stats){
          if (err) {
            reject('fail')
          } else {                                                                                                  
            if (stats.isFile()) {
              resolve('success')
            }
          }
        })
      }

    })()
  })
}

module.exports = snapShot

如何安裝 (Linux 、Unix 操作系統)

  • 如果你有翻牆環境

    1. 執行 npm install
    2. 執行 npm start
  • 如果你沒有翻牆環境

    1. 打開 package.json 文件,檢查 dependencies 項目,如果 key 爲 puppeteer 的條目,先刪除該條目。
    2. 進入工程命令行,輸入 PUPPETEER_DOWNLOAD_HOST=https://storage.googleapis.co... npm i --save puppeteer
    3. 執行 npm install 命令
    4. 執行 npm start

流程說明

  1. while 循環去調用接口去獲取當前的截圖任務

    • 在有截圖任務情況下繼續截圖
    • 沒有截任務的情況下,爲了避免浪費資源,程序休眠10分鐘後繼續下一次的獲取截圖任務
    • 如果遇到調用截圖任務接口500錯誤,則強制停止截圖任務,相應的服務端工程師去查詢失敗原因
  2. 如果有截圖任務那麼就去截圖

    • 截圖後將截圖圖片保存到文件夾,命令爲當前日期 yyyy-MM-dd-hh-mm-ss-S 格式。然後將結果上傳到服務端
    • 截圖失敗將當前任務結果保存到本地 failedTasks.json 文件夾一份,然後上傳到服務端
  3. 截圖成功不管失敗還是成功都去通知服務端。如果失敗將當前任務告訴服務端,如果成功將當前任務信息和截圖成功的絕對路徑告訴服務端

一些說明

Demo 中執行 npm start 真正執行的是 quickStart.js 中的代碼。完整的“獲取截圖任務、截圖、截圖上傳到OSS、失敗則將失敗任務上傳到服務”邏輯在 index.js 文件中

  • 工程是在沒有提供真正的接口獲取任務,而是採用隨機數獲取截圖任務
  • 截圖成功後將結果上傳到OSS這一個步驟是沒有的,採用 log 出來
  • 失敗的上傳也是不存在的,log 打印而已

todoList

  • 多線程高效率的去截圖
  • 一些寫法暫時比較粗糙,不優雅,待改進
  • puppeteer 很強大,大家可以去研究下

代碼地址

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章