網絡爬蟲之實戰 4-1 正則表達式庫Re入門

文章截圖均來自中國大學mooc Python網絡爬蟲與信息提取的教程,以上僅作爲我的個人學習筆記。

下面是教程鏈接:https://www.icourse163.org/learn/BIT-1001870001?tid=1450316449#/learn/content?type=detail&id=1214620493&cid=1218397635&replay=true
 


正則表達式的使用:

---編譯:將符合表達式語法的字符串轉換成正則表達式特徵

  • 例子1: 無窮字符串組

  • 例子2:有窮加限制特點的

正則表達式的語法:

  • 正則表達式常用的操作符:

  • 常用實例:

  • 經典正則表達式實例:

  • 匹配ip地址的正則表達式:4個0-255的範圍

Re庫的基本使用:python的標準庫

-使用 raw string 類型(原生字符類型:和字符串類型不同的就是在字符串之前加上一個小寫的r)

-也可以使用string類型,但是會比較繁瑣,有的時候需要轉義

Re庫主要的功能函數:

功能函數詳細:

  

Re庫的另外一種等價用法:

Re庫的match對象:

Re庫的貪婪匹配和最小匹配:默認採用貪婪匹配、加上問號變成最小匹配

單元小結:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章