原创 HTTP 405 錯誤 – 方法不被允許 (Method not allowed)

HTTP 協議定義一些方法,以指明爲獲取客戶端(如您的瀏覽器或我們的 CheckUpDown 機器人)所指定的具體網址資源而需要在 Web 服務器上執行的動作。則這些方法如下: OPTIONS( 選項 ) :查找適用於一個特定網址資源的

原创 Python爬蟲(三)Urllib庫的高級用法

1.設置Headers 有些網站不會同意程序直接用上面的方式進行訪問,如果識別有問題,那麼站點根本不會響應,所以爲了完全模擬瀏覽器的工作,我們需要設置一些Headers 的屬性。 可以打開Chrome瀏覽器,調試瀏覽器F12,打開網絡監聽

原创 Python 爬蟲(一)綜述

開始爬蟲之前先看看這些來打個底吧~ 1.首先,什麼是爬蟲呢? 爬蟲(spider),可以理解爲在網絡上爬行的一隻蜘蛛,爬蟲在互聯網這張網上爬來爬去地找資源,如果它遇到想要的資源,就會把它抓取下來。至於什麼資源是想要的抓取的?這個由你來控制

原创 pandas讀取csv處理時報錯:ParserError: Error tokenizing data. C error: Expected 1 fields in line 29, saw 2

csv文件默認的是以逗號爲分隔符,但是中文中逗號的使用率很高,爬取中文數據時就容易造成混淆,所以使用pandas寫入csv時可以設置參數 sep=’\t’ ,即以tab爲分隔符寫入。畢竟tab在中文習慣裏用的很少嘛。 那這樣在後面讀取c

原创 Python 在當前目錄以及其子目錄下查找文件名包含指定字符串的文件,並打印出相對路徑。

import os def search_file(dir,sname): if sname in os.path.split(dir)[1]: #檢驗文件名裏是否包含sname print(os.path.r

原创 Python 判斷回數(例如12321、909)

回數是指從左向右讀和從右向左讀都是一樣的數,例如12321,909。 現在用Python來實現 方法一: # 判斷回數 def is_palindrome(n): s=str(n) for i in range((len

原创 python 函數返回多個值

(廖雪峯Python教程學習筆記) 函數體內部的語句在執行時,一旦執行到return,函數就執行完畢,並將結果返回。 如果沒有return語句,函數執行完畢後也會返回結果,只是結果爲None。 return None可以簡寫爲retu

原创 pandas讀取csv文件進行處理時報錯: TypeError: invalid type comparison

在Python中用pandas讀取csv文件並對csv裏面的數據進行處理的時候,有可能會遇到這樣的錯誤: TypeError: invalid type comparison 無效的類型比較 這時可以去打印一下你的dataframe中的數

原创 Python StringIO和BytesIO

(廖雪峯教程筆記) 1、StringIO 很多時候,數據讀寫不一定是文件,也可以在內存中讀寫。 StringIO顧名思義就是在內存中讀寫str。 要把str寫入StringIO,我們需要先創建一個StringIO,然後,像文件一樣寫入

原创 Python常見的錯誤類型及其繼承關係

Python所有的錯誤都是從BaseException類派生的。 下面是Python常見的錯誤類型及其繼承關係: BaseException +– SystemExit +– KeyboardInterrupt +– Gen

原创 Python 用一個生成器函數實現楊輝三角

楊輝三角定義如下: 1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1