原创 Python使用xpath爬取51job

爲了更快捷,使用多線程爬取 import requests from lxml import etree import threading def get_request(page): url = "https://searc

原创 Python使用正則爬取51job

爲了更快捷,使用多線程 import requests import re def get_request(page): url = "https://search.51job.com/list/190200,000000,

原创 微信小程序雲開發獲取微信運動開放數據

微信運動屬於敏感數據,如果直接調用wx.getWeRunData接口的話獲取到的數據是加密後的,所以用雲開發的話,步驟如下: 1. 開通雲開發後,新建一個Node.js雲函數: 2. 獲取開放數據必須得用戶授權登錄,因此要先調用wx.l

原创 微信小程序播放音頻一直報10004錯誤碼MediaError

這幾天在研究小程序裏面使用訊飛語音平臺的文字轉語音功能,當連接成功後臺返回地址後,地址明明是有的,但一直報錯,附上錯誤提示: 地址明明是正確的,在瀏覽器裏可以打開,而且在代碼裏面把地址寫死,不通過request獲取的話就可以播放,着實讓

原创 Python的Numpy基礎語法-01

一些numpy裏面的基本方法 import numpy as np ar = np.array([[1,2,3,4,5,6],[2,3,4,5,6,7],[3,4,5,6,7,8]]) #創建一個二維數組 ar1 = np.aran

原创 Python使用scrapy框架編寫自動爬蟲爬取京東商品信息並寫入數據庫

目標:京東商品詳情頁的商品標題、商店名、商店鏈接、價格。 隨意進入京東一款商品詳情頁面,查看源碼可以看到商品標題、商店名、商店鏈接就在源碼裏面,可以直接獲得,但是源碼裏面沒有商品的價格,說明隱藏了,需要進行抓包分析 商品的鏈接: htt

原创 pandas基礎知識---3

DataFrame的行標籤(index)和列標籤(columns) import numpy as np import pandas as pd #Dataframe帶有index(行標籤)和columns(列標籤) data = {

原创 pandas基礎知識---4

索引: import numpy as np import pandas as pd #選擇行與列 df = pd.DataFrame(np.random.rand(12).reshape(3,4)*100,

原创 pandas基礎知識---2

數據查看/重新索引/對齊/添加、修改、刪除值 數據查看: 從前面查看數據和從後面查看數據 import numpy as np import pandas as pd s = pd.Series(np.random.rand(15))

原创 pandas基礎知識--1

Series數據結構: Series是帶有標籤的一維數組,可以保存任何數據類型(整數,字符串,浮點數Python對象等),軸標籤統稱爲索引 import numpy as np import pandas as pd ar = np.

原创 Numpy基礎語法--linspace與zeros與ones

linspace():返回在間隔[開始,停止]上計算的num個均勻間隔的樣本 import numpy as np print(np.linspace(10,20,num = 21)) #10到20之內,分成21個均勻的數字 pr

原创 Python的Numpy基本用法-01

一些numpy裏面的基本方法 import numpy as np ar = np.array([[1,2,3,4,5,6],[2,3,4,5,6,7],[3,4,5,6,7,8]]) #創建一個二維數組 ar1 = np.aran

原创 Python爬取淘寶商品信息

頁面分析 打開淘寶搜索衛衣男 查看源代碼 我們這裏可以找到幾個關鍵詞 通過分析我們可以找到價格,郵費,商家地址,付款人數,商家ID,店鋪名稱。 分析URL 我們可以看到 第一頁url:https://s.taobao.com/searc

原创 Python爬蟲--urllib

urllib包含模塊:        -urllib.request:打開和讀取urls        -urllib.error:包含urllib.request產生的常見的錯誤,使用try捕捉        -urllib.parse

原创 運行Django,Python崩潰

這幾天學到Django,發現有時候一運行程序Python就會崩潰,停止工作 問了很多朋友,都不知道怎麼回事,今天無意間發現,是端口的問題,如果你打開了酷狗聽歌,然後又運行程序,那麼Python就會崩潰。那是因爲Django默認的是使用80