python tips(1~2)

來源:https://segmentfault.com/a/1190000003721694

https://segmentfault.com/a/1190000004341701


python tips(1)

給dict設置默認值

這樣能設置所有key的默認值爲[],包括新添的key

from collections import defaultdict
context = defaultdict(list)

setdefault一次只能設置一個值,但好處是能使用鏈式語法,但defaultdict更快一些

context = {}
context.setdefault('name_list', []).append('Fiona')

或者用fromkeys,用法dict.fromkeys(seq[, value]))value默認是國際慣例的None

name_list = ['kevin', 'robin']
context = {}.fromkeys(name_list, 9)
# {'kevin': 9, 'robin': 9}

context = dict.fromkeys([1, 2], True)  
# {1: True, 2: True}

列表去重的快速方法

比用set要快,來自:http://www.peterbe.com/plog/uniqifiers-benchmark

{}.fromkeys(mylist).keys()

列表深複製

a = [3, 2, 1]
b = a[:]

字典深複製

a = {'male':0, 'female': 1}
b = a.copy()

時間轉換相關

獲取今天的年月日時間(date)

兩種代碼效果相同

from datetime import datetime

n_date = datetime.now().date()
n_date = datetime.today().date()

date -> datetime

from datetime import datetime

b = datetime.combine(n_date, datetime.min.time())
# datetime.datetime(2015, 9, 8, 0, 0)

datetime -> date

比較簡單,直接使用datetime_object.date()即可

# datetime.datetime(2015, 6, 5, 11, 45, 45, 393548)
a = datetime.datetime()
# datetime.datetime(2016, 6, 5)
b = a.date()

time.struct_time -> datetime

一般time.localtime()或者用time.striptime()得到的就是time.struct_time

使用位置參數

structTime = time.localtime()
datetime.datetime(*structTime[:6])
# datetime.datetime(2009, 11, 8, 20, 32, 35)

或者使用datetime.fromtimestamp,但是要注意此處的時間不能早於1970-01-01 00:00

from time import mktime
from datetime import datetime

dt = datetime.fromtimestamp(mktime(struct))

計算日期之差

from datetime import date

d0 = date(2008, 8, 18)
d1 = date(2008, 9, 26)
delta = d0 - d1
print delta.days

獲取milliseconds(13位數字)

import time
from datetime import datetime

time.time()  # 1441769033.549239
int(time.time() * 1000)   # 1441769033549

# or
def unix_time_milliseconds:
    time_gap = datetime.utcnow() - datetime.utcfromtimestamp(0)
    return int(time_gap.total_seconds() * 1000)   # 1441769033549

使用map作iterator

當將func設置爲None時,可起到iterator的作用,結果類似於使用了zip,唯一的區別是map可以按最長的列表擴展。
python2.x中的itertools.zip_longest可以起到與此處map相同的效果

map(None, xrange(3), xrange(10,12))
# [(0, 10), (1, 11), (2, None)]
zip(xrange(3), xrange(10,12))
# [(0, 10), (1, 11)]

判斷奇數

自然是使用位操作最快了

if a & 1:
    print 'it is even'

dict刪除key

要刪除的key數量較多(超多一半)的話,建議重新生成dict;如果數量較少,在popdel都可以的情況下,del稍快一些

python -m timeit -s "d = {'f':1,'foo':2,'bar':3}" "d1 = d.copy()" "for k in d1.keys():" "  if k.startswith('f'):" "    del d1[k]"
# 1000000 loops, best of 3: 0.827 usec per loop
python -m timeit -s "d = {'f':1,'foo':2,'bar':3}" "d1 = d.copy()" "for k in d1.keys():" "  if k.startswith('f'):" "    d1.pop(k)"
# 1000000 loops, best of 3: 0.96 usec per loop


python tips(2)


join函數的使用

一般的字符串組合操作都建議使用join, 字符串操作經常使用的就joinsplitreplace, 另外還有partition
join裏面可以寫成一個列表解析的形式

m = map(str, range(9))
','.join(x for x in m if x != '3')

# 而不是
','.join([x for x in m if x != '3'])

從列表中刪除多個相同的元素

list.remove是不行的, 只能刪除從左到右找到的第一個元素, 後面的不會刪除
自認爲兩種比較好的方式如下

m = ['a', 'b', 'c', 'a']
m = filter(lambda x: x !='a', m)

或者

m[:] = (x for x in m if x != 'a')

隨機生成n位字符串

import random
import string

rand_str = "".join([random.choice(string.letters+string.digits) for _ in xrange(n)])

引用類型的問題

函數參數

函數默認參數,只在定義時參數求值了一次,函數的多個調用將使用同一個可變參數

def test(data, x=[]):
    x.append(data)
    return x
print test(3)
# [3]
print test(4)
# [3, 4]

dict.fromkeys設置默認值的問題

和函數參數問題一樣,多個鍵值對應的value將調用同一個列表。設置爲{}自然也是一樣的結果

>>> a = dict.fromkeys('bc', [])
>>> a['b'].append(6)
>>> a
{'b': [6], 'c': [6]}

多個變量聲明

一般會有聲明多個空list和空dict的需求
將導致多個變量共享同一個[]{}的錯誤的做法

a = b = []
c = d = {}

正確的方式

a, b = [], []
# for a lot of var
c, d, e, f = [{} for _ in xrange(4)]

其它intstrbool等沒有此問題,可直接寫成

a = b = True

del的時候一次可以刪除多個

>>> a = range(3)
>>> del a[2], a[0]
>>> a
[1]

切片操作

可以用-1來反轉列表

>>> a = range(7)
>>> a[::-1]
[6, 5, 4, 3, 2, 1, 0]
>>> a[::2]
[0, 2, 4, 6]

用切片刪除某一段序列,等同於del a[1:4]

>>> a = [1, 2, 3, 4, 5, 6, 7]
>>> a[1:4] = []
>>> a
[1, 5, 6, 7]

去除偶數索引

>>> a = [0, 1, 2, 3, 4, 5, 6, 7]
>>> del a[::2]
>>> a
[1, 3, 5, 7]

關於省略號

主要用於多維矩陣中,減少定位操作時的複雜度,用得不多,更仔細的說明見這裏

>>> class C(object):
...  def __getitem__(self, item):
...   return item
...
>>> C()[1:2, ..., 3]
(slice(1, 2, None), Ellipsis, 3)

文件操作

一次讀取整個文件

使用二進制模式,如rb模式, 使用r則只能讀取到一部分

with open(path, 'rb') as f:
    return f.read()

按行讀取

將文件對象看錯iterator

with open(path, 'r') as f:
    for line in f:
        print line


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章