簡單爬蟲-使用 puppeteer 爬取掘金的文章標題

puppeteer官網
如下圖(爬取掘金的文章標題):

在這裏插入圖片描述
在這裏插入圖片描述
主要是以下代碼:

index.js

const puppeteer = require('puppeteer')

;(async () => {
  const browser = await puppeteer.launch({
    ignoreDefaultArgs: ['--enable-automation'], // 破解個別反爬蟲
  })
  const page = await browser.newPage()
  await page.goto('https://juejin.im', {
    waitUntil: 'networkidle2',
  })
  let url_list = await page.$$eval('.title-row', (arts) => {
    let list = []
    for (let i = 0; i < arts.length; i++) {
      let item = arts[i]
      let title = item.querySelector('.title').innerHTML
      list.push(title)
    }
    return list
  })
  console.log(url_list)

  await browser.close()
})()

package.json

{
  "name": "demo_1",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "keywords": [],
  "author": "",
  "license": "ISC",
  "dependencies": {
    "puppeteer": "^3.1.0"
  }
}

puppeteer
完整代碼分享:reptile-juejin

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章