原创 Python爬蟲bug_unable to decode value

一、問題描述 Form Data表單裏面出現參數值爲:unable to decode value ,導致python爬蟲時返回頁面源代碼丟失內容 網站源碼編碼爲GBK 二、解決方法 提交的form表單參數值編碼轉換 :

原创 Python爬蟲requests後的html亂碼解決(gzip, deflate, br)

目錄1、問題如下2、解決問題 1、問題如下 亂碼bug集1 前提:resp.encoding編碼與網頁源碼編碼一致;本例編碼爲’utf-8’; 直接輸出reponse.text會報異常:UnicodeEncodeError: ‘

原创 Python_datetime模塊使用

目錄第15章_datetime1、datetime對象2、datetime對象的屬性3、timedelta數據類型4、將datetime對象轉換爲字符串strftime()5、將字符串轉換爲datetime()對象strptime

原创 python相關渲染庫Selenium、Puppeteer、Splash安裝

目錄1、Selenium2、Puppeteer3、Splash 1、Selenium Selenium是一個用於Web應用程序的測試的工具,我們可以通過它驅動瀏覽器執行特定的操作,例如點擊、下滑、資源加載與渲染等。 安裝步驟1

原创 Python_深度學習環境配置

大概linux下的安裝步驟,細節可能不完整1、NVIDIA顯卡驅動安裝2、CUDA Toolkit的安裝3、cuDNN的安裝4、深度學習PyTorch庫5、深度學習框架Darknet6、圖片標註工具Labellmg 1、NVIDI

原创 python常見反爬蟲類型(App反爬蟲等)

目錄注:筆記大部分來源書本,僅供學習交流:【Python3反爬蟲原理與繞過實戰—韋世東】5、App反爬蟲(1)App抓包軟件(2)APK文件反編譯(3)App代碼混淆反爬蟲(4)App應用加固知識擴展(5)App應用程序自動化測試

原创 Python_極驗滑動驗證碼識別

目錄極驗滑動驗證碼1、準備工作2、識別思路2、主程序思路流程3、注意點4、通用關鍵代碼 極驗滑動驗證碼 1、準備工作 安裝好Selenium庫,Chrome瀏覽器,配置ChromeDriver 目標:用程序來識別並通過極驗驗證碼

原创 python檢查字符串是否只包含中文

漢字unicode編碼範圍 匹配簡體和繁體 :\u4E00-\u9FFF 匹配簡體 :\u4E00-\u9FA5 def is_contain_chinese(check_str): """

原创 Python_定時任務apscheduler

目錄1、 import apscheduler2、 import scheduler 1、 import apscheduler 推薦apscheduler 使用apscheduler from apscheduler.sch

原创 Python_用Pillow操作圖像

用Pillow操作圖像1、顏色和RGBA值(1) ImageColor.getcolor獲取某種顏色的RGBA值2、座標和Box元組3、用Pillow操作圖像(1).open加載圖像、.size獲取寬高、.filename名稱、.

原创 網站爬取心得2_Cookie

目錄網站爬取思路總結21、Cookie介紹2、應對生成的cookie常用解決方法3、通過requests的session會話對象來進行處理cookie參數4、通過chrome的headless配合selenium獲得cookie參

原创 Python某電影字體反爬

目錄貓眼電影字體反爬一、原理介紹二、依賴包三、代碼 貓眼電影字體反爬 一、原理介紹 將所有uni的x、y座標收集,並利用KNN算法預測uni對應的真實值。 參考這篇文章:原理介紹 二、依賴包 下載whl文件安裝:地址 依賴包

原创 python常見反爬蟲類型(信息校驗型、動態渲染、文本混淆、特徵識別反爬蟲等)

目錄注:筆記大部分來源書本,僅供學習交流:【Python3反爬蟲原理與繞過實戰—韋世東】1、信息校驗型反爬蟲(1)User-Agent、Host、Referer等反爬蟲(2)Cookie反爬蟲(3)簽名驗證反爬蟲(4)WebSoc

原创 python模擬鼠標/鍵盤點擊pymouse

目錄1、 安裝2、 from pymouse import PyMouse3、 from pykeyboard import PyKeyboard 1、 安裝 先下載並安裝pyHook,pip install D:\Softwa

原创 八爪魚_數據採集器學習流程

目錄1、入門教程2、Xpath教程3、正則4、其他功能點5、API數據導出 1、入門教程 (0)入門教程 (1)自定義配置採集數據 (2)採集單個數據 (3)採集列表數據:打開網頁》選中列表》選擇子元素》選中全部 (4)採集表格