原创 pyecharts 在地圖上打點碰到的坑

版本 pyecharts v1 版本 碰到的問題 由於自己的數據 和pyecharts地圖數據不一致, 當輸入pyecharts不存在的地點時Geo就會報錯, 而且還不提示是哪一個地點造成的, 此問題困擾了我好幾天 解決辦

原创 二分查找的python實現

二分查找是有條件的,首先是有序,因爲二分查找操作的是下標,所以要求是順序表 二分查找: 在一段數字內,找到中間值,判斷要找的值和中間值大小的比較。 如果中間值大一些,則在中間值的左側區域繼續按照上述方式查找。 如果中間值小一些

原创 python:運算符與流程控制結構

運算符與分支結構 運算符 賦值運算符 用’='表示,左邊只能是變量。 算術運算符 +、-、*:加、減、乘 /:除法,結果是浮點數 //:除法,結果是整數 %:求餘 **:求冪,也可以使用函數pow 複合運算符

原创 爬蟲:使用接口地址實現有道翻譯

使用火狐或者chrome瀏覽器打開有道翻譯 右鍵 -> 檢查元素 在彈出的調試界面選擇網絡 找到響應是json類型的地址,一般情況下市我們的接口地址 選中相應接口地址,點擊參數,下面的表單數據中使我們要提交的數據 分析表單中的接

原创 爬蟲Requests基本使用

爬蟲Requests Requests 庫的基本使用 首先安裝Requests庫#打開終端,注意本機的虛擬環境保持和項目環境一致 pip3 install requests 使用requests庫進行最基本的下載# 下載百度

原创 python基礎:循環結構

python流程控制 循環結構 while 循環 格式 while 表達式 語句塊 執行流程:當程序執行到while語句時,首先判斷表達式的真假。若表達式的值爲真,則執行縮進的語句塊,之後返回表達式繼續判斷;若表達式的值

原创 使用openpyxl時遇到的坑

最近在用python處理Excel表格是遇到了一些問題 1, xlwt最多隻能寫入65536行數據, 所以在處理大批量數據的時候沒法使用 2, openpyxl 這個庫, 在使用的時候一直報錯, 看下面代碼 from open

原创 python基礎之正則表達式

前言:正則匹配的一些相關知識點 應用場景如下: 特定規律字符串的查找、切割、替換等 特定格式(郵箱、手機號、IP、URL)等的校驗 爬蟲項目中,提取特定內容 使用原則: 只要使用字符串函數能夠解決的問題就不要使用正則 正則的

原创 sudo: 無法解析主機:出現原因以及解決辦法

今天在使用linux終端命令的時候出現了這麼一句話:sudo: 無法解析主機 :xxxxx 原因:修改了主機的ubuntu設備名稱,後面沒有配置好hosts文件,導致linux無法解析到您的主機地址 sudo: 無法解析主機:

原创 scrapy-splash 爬取Taobao頁面

開發環境 Windows 10 python3 vs code docker docker 安裝 下載 Docker Toolbox 具體安裝方法請百度, 教程很多, 這裏就不多介紹啦 安裝 scrapy-splas

原创 python基礎: 字符串操作

字符串 定義: 使用引號括起來的一串字符 一對單引號、一對雙引號、三對單引號、三對雙引號 轉義:使用 ‘\’,使原來有特殊含義的字符變成普通字符,也可以在定義字符串的前面加一個’r’ 字符串拼接 s1 = 'hello' s

原创 矩陣相乘的實現-python

第一個數組的列和第二個數組的行一樣的時候才能相乘 相乘原則:第一個數組的行乘以第二個數組的列然後相加放入對應位置. import numpy as np def matrix_multi(m1,m2): # 首先建立一個值

原创 splash + scrapy 抓取京東科幻小說頁面

抓取地址 https://search.jd.com/Search?keyword=%E7%A7%91%E5%B9%BB%E5%B0%8F%E8%AF%B4&enc=utf-8&suggest=1.def.0.V16--feat

原创 爬蟲:信息的抽取

使用xpath 和 cssselect進行信息抽取 使用xpath 什麼是xpath xml中, 通向某個節點的一個路徑,例如: //div/ul/li/a, 例子中爲通向a節點的一個路徑 基本用法 取出所有的li中的a

原创 selenium模擬爬蟲

1.爲什麼使用selenium 很多網站使用了ajax技術進行異步加載,直接使用requests抓取,只能抓取靜態內容,無法抓取異步加載的ajax 2.selenium的基本加載和使用 # 需要安裝 $ pip install