Python字符串處理

原文鏈接

http://apps.hi.baidu.com/share/detail/15536521

 

 

python字符串處理
轉載至:http://hi.baidu.com/fishhatta/blog/item/458ac900d4a64f054bfb51f4.html

#Python中的字符串處理——2009-12-5

1.字符串的對齊方式:
①:center(int[,str])
>>> string = 'Fishhat'
>>> string.center(55)
' Fishhat '
>>> string.center(55,'*')
'************************Fishhat************************'

②:ljust(int[,str])
>>> string.ljust(55)
'Fishhat '
>>> string.ljust(55,'*')
'Fishhat************************************************'

③:rjust(int[,str])
>>> string.ljust(55)
' Fishhat'
>>> string.ljust(55,'*')
'************************************************Fishhat'

④:%(int)s
>>> print '% 55s' % string
Fishhat


2.字符串中的轉義字符:
\\ 斜槓
\' 單引號
\" 雙引號
\a 系統喇叭
\b 退格符
\n 換行符
\t 橫向製表符
\v 縱向製表符
\r 回車符
\f 換頁符
\o 八進制數代表的字符#還搞不懂...
\x 十六進制數代表的字符#還搞不懂...
\000 終止符,忽略\000後的全部字符

 

3.字符串中的轉義符過濾函數:
①:strip()--過濾字符串中所有的轉義符
②:lstrip()--過濾字符串中第一個轉義符
③:rstrip()--過濾字符串中最後的轉義符
後記:在使用的時候返回的結果不是預想中的正確結果.還待查詢相關具體資料

 

4.字符串的連接
①:Python中可以使用'+'、'+='、連接若干個字符串,如果是以下情況,Python則自動連接:
>>> str = 'fish' 'hat' #若干個字符串之間如果只有空格,Python會自動連接
>>> print str
fishhat
>>> str += ' learning Python!' #使用運算符追加字符串
>>> print str
fishhat learning Python

②:使用str2.join(str)函數進行連接,其中str爲需要連接的字符串序列或者一個字符串,str2爲連接中填補的字符:
>>> string = ('apple','banana','china')
>>> print '-'.join(string) #向string這個元組中的多個字符串元素之間加上'-'然後輸出
apple-banana-china
>>> print ''.join(string) #加入的字符也可以是空的
applebananachina
>>> print '-'.join('fishhat') #直接使用
f-i-s-h-h-a-t #自動在每個子字符中加入'-'

 

5.用split(str[,int])函數截取字符串
>>> string = 'f-i-s-h-h-a-t'
>>> string.split('-') #按'-'作爲截取子字符串的符號,也就是說遇到一個'-'則截取一個子字符
['f','i','s','h','h','a','t'] #最後返回一個截取得到的子字符列表
>>> string.split('-',2) #在按'-'截取子字符的時候,當截取到第2個'-'的時候就停止截取,後面的字符全部按一個子字符返回(也就是說不管有沒有'-'Python都不會理 了,它認爲你只指定了2個'-'有效)
['f','i','s-h-h-a-t'] #實際上返回了三個子字符,因爲在Python找到第一個'-'之前已經有一個'f'就把'f'做子字符


後記:這裏很容易混淆,後面的整數參數(不提供系統默認截取所有的)其實就相當於你要在字符串中畫多少條 界,相當於切一條蛋糕,你切兩刀是不是得三塊?至於每塊蛋糕的長短,就取決於你在蛋糕上做好的標記,也就相當於剛纔的'-'

 

6.startswith()函數和endswith()函數
①:startswith(substring[,start[,end]])--用於判斷字符串是否以substring字符開始的,start和 end需要對比的字符區間,默認是整個字符串,成功返回True失敗返回False
>>> str = 'fishhat'
>>> str.startswith('fi')
True
>>> str.startswith('sh',2,4)
True
>>> str.startswith('sh',)

②:endswith(substring[,start[,end]])--用於判斷字符串是否以substring字符結束的,start和end是 需要對比的字符區間,默認是整個字符串,成功返回True失敗返回False
>>> str.endswith('hat')
True
>>> str.endswith('ha',4,6)
True

#Python中的字符串處理(2)——2009-12-8
前記:前兩天的筆記沒有堅持寫.現在繼續.COME ON!今後爭取每天都要寫一篇筆記(就算沒有東西寫了也要扯出來)

1.實現字符串的反轉,由於Python目前沒有專門用於字符串反轉的函數所以自定義一個,實現方法是通過從字符串的尾部開始取得子字符,然後逐個 連接起來後返回一個完整的反轉字符串:

>>> def reverse(str):
>>> ... rstr = '' #定義一個用於連接字符串後返回的變量
>>> ... lstr = list(str) #將字符串分解成一個列表,即一個子字符爲列表的一個元素
>>> ... for i in range(len(str),0,-1): #反向遍歷索引,起始值爲字符串的長度(就是以尾部到首部的順序生成索引)
>>> ... rstr += ''.join(lstr[i-1]) #注意這裏的索引得減去1,否則原字符串的第一個字符就不能返回(因爲是0)
>>> ... return rstr #返回經過反向遍歷字符串重新連接起來的反向字符串
>>> ...
>>> string = 'Fishhat'

>>> list(string) #這裏先補上剛纔接觸到list()函數的用法與功能
>>> ['F','i','s','h','h','a','t'] #返回一個子字符集合的列表
>>> print reverse(string) #試試剛纔自定義的字符串反轉函數怎麼樣
tahhsiF #好樣的,我們成功的把字符反過來了

後記:不知道是不是Python'蓄意'跟我搞了個烏龍(汗死了~~囧!!!):

>>> def reverse(str): #這個函數比上面那個精簡了一些
>>> ... lstr = list(str) #解包--把字符串分解成子字符組成的列表
>>> ... lstr.reverse() #使用列表的reverse()方法對列表內的元素倒序排列
>>> ... rstr = ''.join(lstr) #打包--把列表內的子字符重新連接起來
>>> ... return rstr #返回連接後的結果
>>> string = 'ABCDE'
>>> print reverse(string)
EDCBA


讓我更囧的東西還在下面....Python這小子竟然再次耍我:

>>> def reverse(str): #比上面的都精簡.看到這裏我就無語了~~
>>> ... return str[::-1] #直接返回通過索引倒序排序的結果
>>> ...
>>> string = 'ABCDE'
>>> print reverse(string)
EDCBA

2.字符串的查找與替換--可以用兩個函數實現:find()、rfind(),這兩個函數的不同之處只是查找的順序不同
①find(substring[,start[,end]])--在字符串中查找子字符substring,後面的兩個可選參數是進行切片查找
如果在字符串中找到substring則返回索引(如果字符串中有多個結果則返回第一次出現的索引),沒找到返回-1


>>> string = 'I am Fishhat'
>>> print string.find('F')
#記住.在查找的時候是區分大小寫的
5
>>> print string.find('f') #試試看小寫
-1 #找不到,所以是區分大小寫的
>>> print string.find('h',2,5)
-1 #索引2至5之間沒找到'h'
>>> print string.find('h',5,-1)# 索引5到字符串的最後一個索引
8 #找到了,在第8個索引

②rfind(substring[,start[,end]])--跟上面的沒什麼兩樣,只是在查找子字符串的時候是從字符串的尾部開始找的,下 面例子很好:


>>> string = 'I am Fishhat'
>>> print string.find('h')
#先看看find()方法的結果
8 #找到了,在第八個索引
>>> print string.rfind('h') #然後試試rfind()方法看看跟上面有什麼不一樣的
9 #注意到了沒?'I am Fishhat'中是不是有兩個'h'呢?
#因爲find()從左至右(順序)開始查找的,找到的第一個'h'是在第8個索引,索引find()就返回咯
#而rfind()不一樣,它是從右至左(倒序)進行查找的,找到的第一個'h'是在第9個索引.那就返回倒序查找先發現的咯,當然是9了

 

1.替換字符串--replace(old,new[,max]):替換字符串中找到的old爲new,如果字符串中找到了多個old字串,則可使 用max指定替換多少個old(默認是替換所有),再有的就是.如果在字符串沒有找到old字串.則返回原字符串

>>> str = 'AAAAABBBBBDDDDD'
>>> str.replace('D','C') #把字符串中所有的D替換爲C
'AAAAABBBBBCCCCC'
>>> str.replace('A','a',3)
#替換字符串中的3個A爲a
'aaaAABBBBCCCCC' #replace()函數的操作不會影響原字符串.只是拷貝原字符串然後進行操作而已

2.字符串與時間格式的轉換

首先看看格式化日期的時候常用到的標記
%a 英文星期的簡寫
%A 英文星期的完整拼寫
%b 英文月份的簡寫
%B 英文月份的完整拼寫
%c 本地當前的日期與時間
%d 日期數,1-31之間
%H 小時數,00-23之間
%I 小時數,01-12之間
%m 月份,01-12之間
%M 分鐘數,01-59之間
%j 本年從第1天開始計數到當天的天數
%w 星期數,0-6之間(0是週日)
%W 當天屬於本年的第幾周,週一作爲一週的第一天進行計算
%x 本地的當天日期
%X 本地的當前時間
%y 年份,0-99之間
%Y 年份的完整拼寫

①時間轉爲字符串--strftime(format[,tuple]),其中format爲轉換格式類型tuple爲一個時間元組

>>> import time #由於獲取時間和使用轉換函數需用到time模塊.所以必須導入
>>> str = time.strftime('%Y-%m-%d %X',time.localtime())#time,localtime()返回以本地時間的所有參數爲元素的元組
>>> print str
2009-12-09 21:36:35

②字符串轉爲時間--需要用到time模塊strptime()函數和datetime模塊datetime()函數
strptime(string,format)--把字符串string以format的格式返回一個時間的元組(元組內有齊全的時間元素,但是如果字 符串中只有幾個有用的時間信息,其他的元素默認或取本地時間的一些信息)
>>> str = '2009/12/09'
>>> str = time.strptime(str,'%Y/%m/%d')
#注意後面的獲取字符串中的時間的格式.對應原字符串中年月日之間的間隔符號
>>> print str
time.struct_time(tm_year=2009, tm_mon=12, tm_mday=9, tm_hour=0, tm_min=0, tm_sec
=0, tm_wday=2, tm_yday=343, tm_isdst=-1)
#可以注意到元組中前三個元素都是剛纔字符串中得到的值,後面的信息都沒沒獲取到

datetime(year,month,day[,hour[,minute[,second[,microsecend[,tzinfo]]]]]) 函數返回一個datetime類型的變量,這是一種特殊的變量,也就是說,時間型的

>>> str = datetime.datetime(2009,12,9) #定義一個datetime變量,注意後面參數中的月或日,只能單寫也就是說,9月或9日不能寫成09月或09日,必須單寫
>>> print str
2009-12-09 00:00:00
#但顯示卻會顯示完整的,比如其中的9日顯示爲了09日,還有,默認時分秒爲0
>>> type(str)
<type 'datetime.datetime'>
#這裏可以看到剛纔定義的str爲這種類型的變量

最後再把上面這兩個函數結合起來完整的完成字符串到時間的轉換:

>>> import time,datetime #首先導入兩個使用到的模塊
>>> string = '2009-12-09'
>>> string = time.strptime(string,'%Y-%m-%d')
#首先把字符串使用strptime()返回一個時間元素構成的元組
>>> y, m, d = string[0:3] #把得到的時間元組前三個元素賦值給三個變量(也就是年月日)
>>> string = datetime.datetime(y, m, d) #最後使用datetime把剛纔得到的時間變量轉爲正式的時間格式變量
>>> print string
2009-12-09 00:00:00
#至此,可以說完成了字符串到時間的轉換(注意是變量類型轉換的過程)

 

 

發佈了15 篇原創文章 · 獲贊 9 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章