nodejs實現的爬蟲，從百度貼吧爬取小說

原創

小迪的博客

2020-02-21 15:30

程序應該被用來改變生活

每天都得來回坐地鐵上下班，無聊的時候喜歡看些小說，還只看至尊系的。以前老用微信讀書，現在讀書送的書券都花完了，作爲一名程序猿怎麼可能去花錢買書券讀書。所以我想了寫個爬蟲爬小說的想法。

原理圖

github項目地址: networkReptile
程序依賴

superagent  --發送http請求
cheerio  --分析請求得到的html
node-schedule --定時運行爬蟲
mongoose  --將爬到的最終數據存入mongo

程序目錄

networkReptile----connectDB //數據庫代碼
|---node_modules
|---tools //工具類
|---config.js //配置文件
|---networkReptile.js //主程序
|---package.json //依賴包
|---result.txt //存儲爬到的html
|---README.md //使用說明

看程序之前，請務必看下cnodejs社區的nodejs入門的lession5、lession6，詳情請見註釋，請看代碼註釋。

小迪的博客

發佈了59 篇原創文章 · 獲贊 80 · 訪問量 36萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「實戰應用」如何用圖表控件LightningChart創建2D氣泡圖

LightningChartJS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空航

2024-04-25 11:36:06

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？

前端面試題 - NodeJS能用ES6模塊嗎？CommonJS 和 ES6模塊的區別是什麼？ JS能寫前端web，也能寫NodeJS。 Node.js 後端應用由模塊組成，其模塊系統採用 CommonJS 規範，它並不是 JavaScri

2024-04-24 23:51:06

推薦一個下載nodejs的地址

清華大學鏡像地址 https://mirrors.tuna.tsinghua.edu.cn/nodejs-release/v14.15.0/ 還有一個地址，看名字像是官方的 https://registry.npmmirror.co

2024-04-18 22:14:15

JSON Stream

1. 需求背景在日常開發中經常會遇到大對象或者大文件處理, 比如在nodejs開發中, 一個算法包可能範圍了一個長度爲好幾萬長度的一個對象, 這個對象使用Restful API不好傳遞, 肯定會把這個處理結果保存爲文件, 然後通過通過文件

2024-04-12 23:17:15

「實戰應用」如何用圖表控件LightningChart創建JS堆疊條形圖？

LightningChartJS是Web上性能特高的圖表庫，具有出色的執行性能 - 使用高數據速率同時監控數十個數據源。 GPU加速和WebGL渲染確保您的設備的圖形處理器得到有效利用，從而實現高刷新率和流暢的動畫，常用於貿易，工程，航空航

2024-04-10 11:34:32

不同項目要求不同的node版本-- Node 版本管理——NVM

解決問題：我有個舊的vue2的項目使用的事node的版本比較低才能使用，可是現在最新的react要求的node的版本必須是16起。答：使用Node的管理工具（NVM ），可以自由切換不同的Node.js版本。 nvm （Node Vers

2024-03-21 21:13:21

HarmonyOS-安裝篇（DevEco Studio）

一、下載可通過官網下載： https://developer.harmonyos.com/cn/develop/devevo-studio 二、安裝（經過實踐了）

2024-03-12 00:39:32

解讀 EventBridge Transform，數據轉換和處理的靈活能力

阿里雲 EventBridge 提供了強大而靈活的事件總線服務，它可以連接應用程序、阿里云云服務和阿里雲 Serverless 服務來快速構建 EDA（Event-driven Architectures）事件驅動架構，驅動應用與應用，應用

2024-02-20 01:34:42

go c nodejs csharp 可能不太準確的性能測試

斐波那契數列 (百度百科) 斐波那契數列（Fibonacci sequence），又稱黃金分割數列、因數學家列昂納多·斐波那契（Leonardoda Fibonacci）以兔子繁殖爲例子而引入，故又稱爲“兔子數列”，指的是這樣一個

2020-07-08 12:33:27

後端 Java 程序員眼中的 Vue——（一）創建及運行

現在 Vue 用的越來越多，工作上有時前後端都要搞，作爲後端程序員接手 Vue 該如何做呢，下面來記錄一下基礎的東西，並創建一個 Vue 項目談 Vue 不能避開的 3 個東西 Node.js npm vue-cli No

2020-07-08 11:50:38

Nodejs 環境下.env配置環境變量（附源碼分析）

背景介紹在使用阿里雲的函數計算時，使用了其一鍵部署工具fun， fun 在使用時需要配置 ACCOUNT_ID、REGION、ACCESS_KEY_ID、ACCESS_KEY_SECRET=xxxxxxxxxx等信息。在使用

奋斗的小绿萝

2020-07-08 11:45:04

nodejs後端實現登錄系統後模擬上傳文件

標題實現邏輯：登錄系統獲取cookie 判斷cookie是否有變化，有變化，更新cookie，沒有變化，使用舊的登錄cookie 開始進行發送報文或者文件上傳 2. 導入庫 const request = require(

2020-07-08 08:23:44

使用端口轉發解決nodejs在80端口上的監聽權限問題

由於linux的系統限制，普通用戶是無法打開1024以下端口的，這裏面就包括http的默認端口80，這就使得很多用戶使用root權限來執行node，這帶來了不可預計的安全問題，所以這並不是一個好辦法。其實我們可以使用iptables的端

2020-07-08 08:17:28

linux安裝nodejs環境

下載和安裝 wget https://nodejs.org/dist/v12.18.2/node-v12.18.2-linux-x64.tar.xz mv node-v12.18.2-linux-x64.tar.xz /opt

2020-07-08 05:40:55

windows安裝nodejs環境

windows安裝NodeJs 安裝安裝Node環境時，剛開始我使用zip壓縮包，但是各種配置都不能正常使用，可能是首次安裝，有些東西少配置了，於是我下載msi的安裝包進行安裝，其中有一步是勾選必要的tools，我沒有勾選，勾選

2020-07-08 05:40:55

24小時熱門文章

最新文章

最新評論文章