目標
經過前幾篇囉裏囉嗦的介紹與環境的搭建,下面我們正式開始入手一個例子開始我們的爬蟲之旅
主要學習以下知識點
方法名稱 | 方法說明 |
---|---|
puppeteer.launch | 啓動瀏覽器 |
page.goto(url) | 打開指定網站 |
page.screenshot | 把當前頁面截圖 |
詳細api 可參考
https://blog.csdn.net/mengxiangxingdong/article/details/99237204
開始
1.代碼
當前例子位於項目結構
代碼:
/*
基礎的方法演示 與註釋
*/
const puppeteer = require('puppeteer'); //引入puppeteer庫
(async () => {
const browser = await puppeteer.launch({ //啓動瀏覽器
headless: false, //代碼運行時打開瀏覽器方便觀察
// devtools:true //打開f12界面
});
const page = await browser.newPage(); //打開瀏覽器的一個tab 頁
await page.goto('https://www.baidu.com/'); //訪問網址 https://www.baidu.com/
await page.screenshot({path: 'screenshot/example.png'}); //將當前視圖所見截圖
await page.waitFor(5 * 1000); //睡眠5s'
await browser.close(); //關閉瀏覽器
})();
1.2運行效果
遇到的問題參考解決方案
1.WebStorm編寫代碼有些庫不提示的方法,例如puppeteer 相關的js麼有提示
https://blog.csdn.net/mengxiangxingdong/article/details/99102525
2.ERROR: Failed to download Chromium r609904! Set “PUPPETEER_SKIP_CHROMIUM_DOWNLOAD” env variable t…
https://blog.csdn.net/weixin_33721427/article/details/88452829
參考博客
https://blog.csdn.net/wd1024719195/article/details/79914030