原创 SpringBoot問題摘記

1.導入SpringBoot項目:File->new->Project from Exiting Source->web 2. 配置Tomcat 3.項目部署Tomcat出錯:warning no artifacts confi

原创 移動硬盤安裝Ubuntu18.04 LST

背景: 1.戴爾 i5-5558筆記本 2.Windows10 家庭版 64位 3.雙硬盤(1T機械+240g固態),原生系統安裝在 機械硬盤,之後重裝在固態中 4.BIOS啓動模式:Legacy(傳統模式,非UEFI);sercuri

原创 Python爬蟲學習筆記(應對反爬蟲)

1.爬蟲被網站識別的特徵: 爬取幾次後需要進行驗證 響應時間、速度變慢了 返回錯誤的狀態碼 2.規避反爬蟲 加入user-agent、cookie、referer等信息 減緩爬蟲速度,降低請求頻率,設置下載等待時間 使用Chrome

原创 Python爬蟲學習筆記(使用代理及代理池——解決返回狀態碼302即IP被封的問題)

1.requests庫 import requests#如果代理需要認證,可以使用proxy='username:password@IP:port'proxyHttps = '121.33.220.158' #端口:808proxyHt

原创 Python爬蟲學習筆記(文件存儲:TXT存儲)

open()方法常用寫入方式:     import requestsfrom pyquery import PyQuery as pqurl = 'https://www.zhihu.com/explore'headers = {

原创 Git學習筆記(4)

Bug分支:暫時儲存當前工作,重新分配bug分支完成修復 Git還提供了一個stash功能,可以把當前工作現場“儲藏”起來,等以後恢復現場後繼續工作: $ git stash Saved working directory and ind

原创 Python爬蟲學習筆記(實例:scrapy框架基礎)

scrapy爬蟲框架 命令行格式:scrapy<command>[option][args] 常用命令: 全局命令 startproject 語法: scrapy startproject <project_name>[dir] 這個命令

原创 Python爬蟲學習筆記(那段在win10下安裝Docker的不堪回首的往事)

“捕鯨”的教訓: 1.搞計算機的還是儘量用Linux系統吧 2.實在不行,下次重裝系統請裝專業版的Windows 3.安裝Docker、數據庫這類東西最好還是別輕易更改安裝路徑 4.如果你的是Windows家庭版的系統,想用虛擬機,咱還

原创 Python爬蟲學習筆記(Mysql 存儲)

1.連接數據庫 import pymysqldb = pymysql.connect(host='localhost',user='root',password='lj960802',port=3306) #聲明MySQL連接對象dbc

原创 Python爬蟲學習筆記(Selenium(3))

9.幾種等待方式 固定等待:time.sleep(seconds) 隱式等待:driver.implicitly_wait(seconds) 顯示等待(推薦): from selenium import webdriverfro

原创 Python爬蟲學習筆記(補充:正則表達式基礎:Re庫)

常用正則表達式   re.match():只能從字符串開頭匹配,返回第一和符合的re.match():只能從字符串開頭匹配,返回第一個符合的 import recontent = 'Hello 123 4567 World_This

原创 Python爬蟲學習筆記(Urllib庫)

使用urllib庫爬蟲並不方便,所以在此基礎上產生了requests庫,瞭解即可   urllib.request:請求模塊   urllib.error:異常處理   urllib.parse:url解析模塊,提供處理方法   url

原创 Python爬蟲學習筆記(實例:股票信息定向爬蟲及優化)

#要求URL對應的股票數據顯性的填充在HTML代碼中 import requests from bs4 import BeautifulSoup import traceback import re def getHTMLText

原创 Python爬蟲學習筆記(正則表達式基礎:Re庫)

正則表達式:是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。 re 模塊使 Python 語言擁有全部的正則表達式功能,安裝參考requests。 compile 函數根據一個模式字符串和可選的標誌參數生成一個正則

原创 Python爬蟲學習筆記(文件存儲:CSV存儲)

CSV:以純文本的形式寫入表格數據 #寫入CSV文件import csvwith open('data.csv','w',encoding='utf-8') as csvFile:    writer = csv.writer(csvF