Python爬蟲從入門到放棄 02 | Python爬蟲中的常用語法與模塊

此博客僅爲我業餘記錄文章所用,發佈到此,僅供網友閱讀參考,如有侵權,請通知我,我會刪掉。
本文章純野生,無任何借鑑他人文章及抄襲等。堅持原創!!

前言

你好。這裏是Python爬蟲從入門到放棄系列文章。我是SunriseCai。

本文章是我平時學習Python中常用到的一些知識點,不可做爲Python的系統學習。

Python常用基本用法

Python基本數據結構

這個比較簡單,建議點擊鏈接直達去查看用法。

數據結構 特徵
列表list 可變,有序
元組tuple 不可變,不可增刪改
字典dict 以鍵值對存在
集合set 可變, 無序

Python佔位符與format()

定義:

佔位符 表示類型
%s 字符串
%d 整數
%f 浮點數
format() 把%替換爲{}來實現格式化輸出

佔位符%示例:

name = input('輸入你的名字:')	# SunriseCai
age = input('輸入你的年齡:')	# 20
weight= input('輸入你的體重:')	# 65.432
print('你的名字是%s,年齡是%d,身高是%.2f公斤' % (name, int(age), float(weight)))	
# 你的名字是SunriseCai,年齡是20,體重是65.43公斤
# %.2f意思是取2位小數

format()格式化示例:

name = input('輸入你的名字:')	# SunriseCai
age = input('輸入你的年齡:')	# 20
weight = input('輸入你的工資:')	# 65.432
print('你的名字是{},年齡是{},體重是{}公斤'.format(name, age, weight))
# 你的名字是SunriseCai,年齡是20,體重是65.432公斤

Python條件語句

Python 編程中 if 語句用於控制程序的執行,基本形式爲:

if 判斷條件 1:
    執行語句 A
elif 判斷條件 2:
	執行語句 B
else:
    執行語句 C

理解起來就是:如果滿足條件1則執行A,不滿足條件1但滿足條件2則執行B,兩個都不滿足就執行C
示例:

num = 10
if num > 10:		# 判斷num
    print('我大於10')
elif num < 10:		# num小於10就輸出
    print('我小於10')
else:				# 上面都不滿足就輸出
    print('我等於10')
# 最終輸出  我等於10

Python循環語句

這裏引用自菜鳥教程的Python 循環語句

  • Python 提供了 for 循環和 while 循環:
循環類型 描述
while循環 在給定的判斷條件爲true時執行循環,否則推出循環體
for 循環 重複執行語句

while 循環示例:

  • 一直打印輸入的字符串,直到輸入end 退出循環。
while True:
    string = input('輸入字符串:')
    if string == 'end':
        break			# 退出循環
    print(string)

for 循環示例:

  • 重複100遍打印Hello World
for i in range(100):
	print('Hello World')

Python的join()、split()、strip()

方法 描述
Python join() 用於將序列中的元素以指定的字符連接生成一個新的字符串。
Python strip() 用於移除字符串頭尾指定的字符(默認爲空格或換行符)或字符序列。
Python split() 指定分隔符對字符串進行切片,如果參數 num 有指定值,則分隔 num+1 個子字符串

示例:

  • Python join() :
string = ['SunriseCai', 'SunriseCai', 'SunriseCai']
print('--'.join(string))	# SunriseCai--SunriseCai--SunriseCai
  • Python strip():
string = '%#SunriseCai%#'
print(string.strip('%#'))	# SunriseCai
  • Python split():
string = '%#SunriseCai%#'
print(string.split('%#'))	# ['', 'SunriseCai', '']

Python異常處理

Python中常用try/except語句取捕捉異常。
常見用法:

  • 正常執行A,如果報錯就執行B,C則不管有沒有報錯都會執行。
try:
	執行語句 A
except Exception as e:
    執行語句 B
# raise NameError	# 一旦raise執行,raise後面的語句都不再執行
finally:
    執行語句 C

示例:

try:
    print(1 / 0)	# 1除以0 會報錯
except Exception as e:
    print(e)
finally:
    print('SunriseCai')
# division by zero
# SunriseCai

常用模塊

模塊調用的方法:

方法 作用
import module 導入模塊
import module as xx 將導入模塊更名爲xx
from module import xx 導入模塊的xx函數
from module import xx as bb 將導入的模塊函數xx更名爲bb

time 模塊

  • 休眠10秒:
import time
time.sleep(10)		# 此處Python程序會休眠10
  • 獲取當前時間戳,即1970.01.01到現在經過了多少秒:
import time
print(time.time())	# 1578838874.4708762
  • 獲取當前年月日:
import time

stamp = time.time()
print(time.strftime('%Y-%m-%d', time.localtime(stamp)))	# 2020-01-12
  • 獲取當前年月日 時分秒
import time

stamp = time.time()
print(time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(stamp)))	# 2020-01-12 22:20:20

os 模塊

  • os模塊提供了非常豐富的方法用來處理文件和目錄。常用的方法如下表所示:
方法 描述
os.listdir(path) 返回path指定的文件夾包含的文件或文件夾的名字的列表。
os.path.exists(path) 判斷該文件(文件夾)存在與否
os.makedirs(path) 遞歸文件夾創建函數
os.removedirs(path) 遞歸刪除目錄。
os.rmdir(path) 刪除path指定的空目錄,如果目錄非空,則拋出錯誤
os.remove(path) 刪除路徑爲path的文件。如果path 是一個文件夾,將拋出錯誤

一般是os的這兩個方法os.path.exists(path)os.makedirs(path) 用的最多。判斷文件存在與否,然後再判斷下一步文件是否需要創建。

json 模塊

  • json 模塊主要用到一下兩個方法:
函數 描述
json.dumps Python對象編碼成 JSON 字符串
json.loads 將已編碼的 JSON 字符串解碼爲 Python 對象

以上,是在Python爬蟲中常用的很少一部分知識點。
會用到的知識點和模塊有很多很多,這裏只記一些用的最多的。


最後來總結一下本章的內容:

  1. 介紹了Python基本數據結構
  2. 介紹了佔位符format()
  3. 介紹了條件語句循環語句異常處理
  4. 介紹了joinsplitstrip處理序列及字符串的用法
  5. 最後介紹了timeosjson模塊的基本用法

sunrisecai

  • 感謝你的耐心觀看,點關注,不迷路。
  • 爲方便菜雞互啄,歡迎加入QQ羣組織:648696280

下一篇文章,名爲 《Python爬蟲從入門到放棄 03 | Python爬蟲中的高級用法》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章