一.項目介紹
- 此項目建立在開源項目bootdo和若依系統基礎上,如有侵權請及時與我聯繫,其詳情請見:https://gitee.com/lcg0124/bootdo.git,https://gitee.com/y_project/RuoYi
- Springboot作爲基礎框架,使用mybatis作爲持久層框架,使用官方推薦的thymeleaf做爲模板引擎,shiro作爲安全框架詳情請見:https://github.com/search?utf8=%E2%9C%93&q=springboot&type=
- 在此基礎上,添加爬蟲目錄,工具目錄,遊戲目錄以及聊天系統,添加網址設置等
- 爲什麼不叫crawler而叫spider,因爲喜歡Spider-Man!
- 此項目源碼請見:https://github.com/ricozhou/RZSpider3.0
二.使用方式
1.基本功能
2.網頁爬蟲
- 基本認知:此爬蟲系統內置5個已寫好爬蟲,後臺ID分別是10001-10005,請不要隨意修改,支持語言JAVA,JAVASCRIPT,PYTHON等,可自定義,但後臺安全需要另行配置
- 權限認知:超級管理員和管理員可以定義爬蟲類型和添加編寫自定義爬蟲,普通用戶可添加已有的爬蟲管理及爬蟲任務
- 自定義爬蟲:接口已寫好,源碼資源文件已內置文件流的jar包和源碼,以及連接數據庫的jar包和源碼,自定義爬蟲有示例代碼,後臺編譯運行,注意安全
- 爬蟲任務:添加爬蟲任務可修改默認參數,爬蟲管理自帶一個默認參數,請根據格式修改內容,可設置任務啓動頻次
- 啓動任務:定時任務和固有頻次任務會自動添加至任務詳情並啓動,只執行一次的任務需設置啓動時間並啓用任務,每次任務詳情ID表示一次任務,對應啓動會覆蓋原有數據
- 導出數據:數據格式以excel爲主,內置爬蟲及自定義爬蟲可解析則以excel輸出,無法解析的則以文本格式輸出,下載包括準確任務數據以及未篩選全數據,可選擇下載
- 其他認知:內置爬蟲使用htmlunit,後臺ID段是10001-19999,自定義爬蟲後臺ID段是20001-29999
3.博客管理
- 基本認知:附帶一個博客模塊,詳見:https://blog.csdn.net/rico_zhou/article/details/83617549
4.圖書管理
- 基本認知:此係統屬個人系統,未添加借閱管理,可自行添加,支持批量上傳,請下載模板以供參考,支持導出excel
5.通用工具
- 基本認知:已內置了幾個簡單的工具,如二維碼生成,解析,計算器,OCR,文本格式化,代碼格式化等等,可自定義添加,需修改代碼
- 權限認知:超級管理員和管理員可以添加工具,普通員工可添加已有工具並運行和下載
- 添加工具:分爲網頁版和客戶端版工具,網頁版可包含客戶端,網頁版可直接運行,可上傳源碼,安裝包等,但對應文件只能一個
- 啓用工具:工具啓用都是網頁版,下載的源碼及安裝版等則屬於客戶端版,但上傳文件可自行添加
6.簡單遊戲
- 與通用工具目錄相同,使用同上
7.聊天工具
- 基本認知:尚未完善
8.配置文件
- 基本認知:基本配置詳見bootdo和若依系統源碼
- 添加配置:主要是文件application.yml的filepath配置
- 詳情配置:uploadPath:上傳圖片文件所在位置,必填。uploadCachePath:緩存文件夾,必填。uploadToolPath:上傳工具文件所在位置,必填。 uploadGamePath:上傳遊戲文件所在位置。customSpiderPath:自定義爬蟲文件所在位置,必填。javaCompilerPath:java編譯器所在位置(tool.jar目錄),選填,不填則默認系統編譯器。jreRunPath:java運行環境(jre)所在位置(jre目錄),選填,不填則使用系統java環境。後期將簡化配置,使用默認文件夾
9.基礎設置
- 基礎設置包括主題設置,下載管理直鏈管理,包括登錄背景設置,首頁介紹,代碼包名前綴,示例代碼,手冊,音樂插件設置等等
- 登錄背景可設置內置特效,首頁介紹即首頁顯示內容,代碼包名前綴即自定義爬蟲代碼包名,示例代碼即創建自定義爬蟲時的默認代碼,手冊即介紹,音樂插件使用zplayer,鳴謝!
- 下載管理,可自定義下載文件並生成下載外鏈,設置下載限制次數時間等等
- 直鏈管理,可自定義音頻,視頻,圖片,zip,html等文件,生成直鏈,可在線瀏覽文件內容
- 系統工具有清理緩存功能,會將配置文件下無用文件清除,數據庫中自定義爬蟲測試數據清除等等
10.注意事項
- 配置文件不要只寫盤符,儘量使用不同的文件夾,目錄均不添加斜槓“/”“”
- 自定義爬蟲是將前臺書寫的代碼傳到後臺編譯運行,需要自行設置服務器安全,或者修改源碼
- 系統工具有清理緩存功能,會將配置文件下無用文件清除,因此配置文件的目錄一定要慎配
三.聯繫方式
1.基本方式
- 此項目建立在開源項目bootdo和若依系統基礎上,點擊鏈接加入羣聊【BootDo交流二羣】:614726589【若依交流二羣】:1389287 感謝!
- 本人聯繫方式,QQ:2320095772
- 郵箱,QQ郵箱:[email protected]
- 博客:http://www.rzspider.top/rzblog
- 在線預覽:https://www.rzspider.top 用戶名:testadmin 密碼:testadmin 開源項目請勿攻擊! 謝謝!
四.更新日誌
1.v3.3.8 2018年10月26
- 新增博客瀏覽日誌,記錄瀏覽博客的基本信息
- 新增博客概覽,對博客網站進行數據統計
- 新增公告管理
- 新增博客搬家功能,目前僅支持CSDN博客搬入
- 新增文章中代碼高亮
- 優化博客瀏覽
- 修復其他若干bug
2.v3.3.2 2018年10月16
- 新增直鏈管理,可在線查看網頁
- 新增專欄圖標
- 新增編輯器代碼高亮
- 新增文章下載功能
- 調整手機屏幕自適應
- 優化博客瀏覽
- 修復其他若干bug
3.v3.2.16 2018年10月10
- 新增博客模塊
- 新增博客管理,博客設置,文章管理,標籤管理,專欄管理等
- 新增博客網站高度自定義
- 新增網站圖標網站名稱自定義
- 新增網站樣式設置,顏色設置,左右側邊欄設置等
- 新增網站圖標網站名稱自定義
- 修復其他若干bug
4.v3.2.14 2018年9月29
- 新增博客模塊
- 新增博客管理,博客設置,文章管理,標籤管理,專欄管理等
- 新增博客網站高度自定義
- 新增網站圖標網站名稱自定義
- 修復其他若干bug
5.v3.2.3 2018年9月10
- 新增下載管理,可生成外鏈供他人無登錄下載
- 新增網站設置,ip,端口,域名等保存
- 新增郵件服務設置,默認發件人等
- 添加自定義爬蟲編程前驗證項目文件
- 修復其他若干bug
6.v3.2.1 2018年9月5
- 新增音樂搜索添加,搜索網易雲音樂添加
- 新增音樂導出JSON
- 更新zbplay音樂插件
- 支持註冊成Windows服務
- 添加自定義爬蟲對nodejs支持
- 修復其他bug
6.v3.2.0 2018年8月31
- 新增表格搜索框提示功能
- 新增自定義爬蟲參數可視化添加
- 新增爬蟲自定義參數自動可視化顯示
- 新增自定義爬蟲字段描述和版本號
- 新增爬蟲代碼備份,查看及導出
- 新增5個內置爬蟲,ID:10003~10007
- 新增爬蟲任務數據預覽
- 新增工具箱,無需登錄
五.圖片預覽
歡迎交流學習!