Springboot項目RZSpider3.3.8版本發佈-網頁爬蟲後臺管理

 一.項目介紹

   二.使用方式

1.基本功能

2.網頁爬蟲

  • 基本認知:此爬蟲系統內置5個已寫好爬蟲,後臺ID分別是10001-10005,請不要隨意修改,支持語言JAVA,JAVASCRIPT,PYTHON等,可自定義,但後臺安全需要另行配置
  • 權限認知:超級管理員和管理員可以定義爬蟲類型和添加編寫自定義爬蟲,普通用戶可添加已有的爬蟲管理及爬蟲任務
  • 自定義爬蟲:接口已寫好,源碼資源文件已內置文件流的jar包和源碼,以及連接數據庫的jar包和源碼,自定義爬蟲有示例代碼,後臺編譯運行,注意安全
  • 爬蟲任務:添加爬蟲任務可修改默認參數,爬蟲管理自帶一個默認參數,請根據格式修改內容,可設置任務啓動頻次
  • 啓動任務:定時任務和固有頻次任務會自動添加至任務詳情並啓動,只執行一次的任務需設置啓動時間並啓用任務,每次任務詳情ID表示一次任務,對應啓動會覆蓋原有數據
  • 導出數據:數據格式以excel爲主,內置爬蟲及自定義爬蟲可解析則以excel輸出,無法解析的則以文本格式輸出,下載包括準確任務數據以及未篩選全數據,可選擇下載
  • 其他認知:內置爬蟲使用htmlunit,後臺ID段是10001-19999,自定義爬蟲後臺ID段是20001-29999

3.博客管理

4.圖書管理

  • 基本認知:此係統屬個人系統,未添加借閱管理,可自行添加,支持批量上傳,請下載模板以供參考,支持導出excel

5.通用工具

  • 基本認知:已內置了幾個簡單的工具,如二維碼生成,解析,計算器,OCR,文本格式化,代碼格式化等等,可自定義添加,需修改代碼
  • 權限認知:超級管理員和管理員可以添加工具,普通員工可添加已有工具並運行和下載
  • 添加工具:分爲網頁版和客戶端版工具,網頁版可包含客戶端,網頁版可直接運行,可上傳源碼,安裝包等,但對應文件只能一個
  • 啓用工具:工具啓用都是網頁版,下載的源碼及安裝版等則屬於客戶端版,但上傳文件可自行添加

6.簡單遊戲

  • 與通用工具目錄相同,使用同上

7.聊天工具

  • 基本認知:尚未完善

8.配置文件

  • 基本認知:基本配置詳見bootdo和若依系統源碼
  • 添加配置:主要是文件application.yml的filepath配置
  • 詳情配置:uploadPath:上傳圖片文件所在位置,必填。uploadCachePath:緩存文件夾,必填。uploadToolPath:上傳工具文件所在位置,必填。 uploadGamePath:上傳遊戲文件所在位置。customSpiderPath:自定義爬蟲文件所在位置,必填。javaCompilerPath:java編譯器所在位置(tool.jar目錄),選填,不填則默認系統編譯器。jreRunPath:java運行環境(jre)所在位置(jre目錄),選填,不填則使用系統java環境。後期將簡化配置,使用默認文件夾

9.基礎設置

  • 基礎設置包括主題設置,下載管理直鏈管理,包括登錄背景設置,首頁介紹,代碼包名前綴,示例代碼,手冊,音樂插件設置等等
  • 登錄背景可設置內置特效,首頁介紹即首頁顯示內容,代碼包名前綴即自定義爬蟲代碼包名,示例代碼即創建自定義爬蟲時的默認代碼,手冊即介紹,音樂插件使用zplayer,鳴謝!
  • 下載管理,可自定義下載文件並生成下載外鏈,設置下載限制次數時間等等
  • 直鏈管理,可自定義音頻,視頻,圖片,zip,html等文件,生成直鏈,可在線瀏覽文件內容
  • 系統工具有清理緩存功能,會將配置文件下無用文件清除,數據庫中自定義爬蟲測試數據清除等等

10.注意事項

  • 配置文件不要只寫盤符,儘量使用不同的文件夾,目錄均不添加斜槓“/”“”
  • 自定義爬蟲是將前臺書寫的代碼傳到後臺編譯運行,需要自行設置服務器安全,或者修改源碼
  • 系統工具有清理緩存功能,會將配置文件下無用文件清除,因此配置文件的目錄一定要慎配

 三.聯繫方式

1.基本方式

 四.更新日誌

1.v3.3.8  2018年10月26

  • 新增博客瀏覽日誌,記錄瀏覽博客的基本信息
  • 新增博客概覽,對博客網站進行數據統計
  • 新增公告管理
  • 新增博客搬家功能,目前僅支持CSDN博客搬入
  • 新增文章中代碼高亮
  • 優化博客瀏覽
  • 修復其他若干bug

2.v3.3.2  2018年10月16

  • 新增直鏈管理,可在線查看網頁
  • 新增專欄圖標
  • 新增編輯器代碼高亮
  • 新增文章下載功能
  • 調整手機屏幕自適應
  • 優化博客瀏覽
  • 修復其他若干bug

3.v3.2.16  2018年10月10

  • 新增博客模塊
  • 新增博客管理,博客設置,文章管理,標籤管理,專欄管理等
  • 新增博客網站高度自定義
  • 新增網站圖標網站名稱自定義
  • 新增網站樣式設置,顏色設置,左右側邊欄設置等
  • 新增網站圖標網站名稱自定義
  • 修復其他若干bug

4.v3.2.14  2018年9月29

  • 新增博客模塊
  • 新增博客管理,博客設置,文章管理,標籤管理,專欄管理等
  • 新增博客網站高度自定義
  • 新增網站圖標網站名稱自定義
  • 修復其他若干bug

5.v3.2.3  2018年9月10

  • 新增下載管理,可生成外鏈供他人無登錄下載
  • 新增網站設置,ip,端口,域名等保存
  • 新增郵件服務設置,默認發件人等
  • 添加自定義爬蟲編程前驗證項目文件
  • 修復其他若干bug

6.v3.2.1  2018年9月5

  • 新增音樂搜索添加,搜索網易雲音樂添加
  • 新增音樂導出JSON
  • 更新zbplay音樂插件
  • 支持註冊成Windows服務
  • 添加自定義爬蟲對nodejs支持
  • 修復其他bug

6.v3.2.0  2018年8月31

  • 新增表格搜索框提示功能
  • 新增自定義爬蟲參數可視化添加
  • 新增爬蟲自定義參數自動可視化顯示
  • 新增自定義爬蟲字段描述和版本號
  • 新增爬蟲代碼備份,查看及導出
  • 新增5個內置爬蟲,ID:10003~10007
  • 新增爬蟲任務數據預覽
  • 新增工具箱,無需登錄

  五.圖片預覽

 

 

 

 

 

 

 

 

歡迎交流學習!

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章