Python實戰從入門到精通第十講——字符串與文本4之字符串搜索和替換

在字符串中搜索和匹配指定的文本模式

對於簡單的字面模式,直接使用 str.replace() 方法即可,比如:

>>> text = 'yeah, but no, but yeah, but no, but yeah'
>>> text.replace('yeah', 'yep')
'yep, but no, but yep, but no, but yep'

對於複雜的模式,請使用 re 模塊中的 sub() 函數。 爲了說明這個,假設你想將形式爲 11/27/2012 的日期字符串改成 2012-11-27 。示例如下:

>>> text = 'Today is 11/27/2012. PyCon starts 3/13/2013.'
>>> import re
>>> re.sub(r'(\d+)/(\d+)/(\d+)', r'\3-\1-\2', text)
'Today is 2012-11-27. PyCon starts 2013-3-13.'

sub() 函數中的第一個參數是被匹配的模式,第二個參數是替換模式。反斜槓數字比如 \3 指向前面模式的捕獲組號。

如果你打算用相同的模式做多次替換,考慮先編譯它來提升性能。比如:

>>> import re
>>> datepat = re.compile(r'(\d+)/(\d+)/(\d+)')
>>> datepat.sub(r'\3-\1-\2', text)
'Today is 2012-11-27. PyCon starts 2013-3-13.'

 

發佈了367 篇原創文章 · 獲贊 188 · 訪問量 51萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章