Python學習手冊:
1.python語法:列表推導式
2.numpy 一些函數
3.matplotlib 一些函數
4.matplotlib 高階函數
5.線程/進程 函數
6.Cython的使用
7.LMDB的讀取
python讀寫LMDB文件的方法 LMDB的全稱是Lightning Memory-Mapped Database(快如閃電的內存映射數據庫),它的文件結構簡單,包含一個數據文件和一個鎖文件:
LMDB文件可以同時由多個進程打開,具有極高的數據存取速度,訪問簡單,不需要運行單獨的數據庫管理進程,只要在訪問數據的代碼裏引用LMDB庫,訪問時給文件路徑即可。
讓系統訪問大量小文件的開銷很大,而LMDB使用內存映射的方式訪問文件,使得文件內尋址的開銷非常小,使用指針運算就能實現。數據庫單文件還能減少數據集複製/傳輸過程的開銷。
在python中使用lmdb: linux中,可以使用指令‘pip install lmdb’ 安裝lmdb包。
- 生成一個空的lmdb數據庫文件
# -*- coding: utf-8 -*-
import lmdb
# 如果train文件夾下沒有data.mbd或lock.mdb文件,則會生成一個空的,如果有,不會覆蓋
# map_size定義最大儲存容量,單位是kb,以下定義1TB容量
env = lmdb.open("./train",map_size=1099511627776)
env.close()
- LMDB數據的添加、修改、刪除
# -*- coding: utf-8 -*-
import lmdb
# map_size定義最大儲存容量,單位是kb,以下定義1TB容量
env = lmdb.open("./train", map_size=1099511627776)
txn = env.begin(write=True)
# 添加數據和鍵值
txn.put(key = '1', value = 'aaa')
txn.put(key = '2', value = 'bbb')
txn.put(key = '3', value = 'ccc')
# 通過鍵值刪除數據
txn.delete(key = '1')
# 修改數據
txn.put(key = '3', value = 'ddd')
# 通過commit()函數提交更改
txn.commit()
env.close()
- 查詢lmdb數據庫內容
# -*- coding: utf-8 -*-
import lmdb
env = lmdb.open("./train")
# 參數write設置爲True纔可以寫入
txn = env.begin(write=True)
############################################添加、修改、刪除數據
# 添加數據和鍵值
txn.put(key = '1', value = 'aaa')
txn.put(key = '2', value = 'bbb')
txn.put(key = '3', value = 'ccc')
# 通過鍵值刪除數據
txn.delete(key = '1')
# 修改數據
txn.put(key = '3', value = 'ddd')
# 通過commit()函數提交更改
txn.commit()
############################################查詢lmdb數據
txn = env.begin()
# get函數通過鍵值查詢數據
print txn.get(str(2))
# 通過cursor()遍歷所有數據和鍵值
for key, value in txn.cursor():
print (key, value)
############################################
env.close()
- 讀取已有.mdb文件內容
# -*- coding: utf-8 -*-
import lmdb
env_db = lmdb.Environment('trainC')
# env_db = lmdb.open("./trainC")
txn = env_db.begin()
# get函數通過鍵值查詢數據,如果要查詢的鍵值沒有對應數據,則輸出None
print txn.get(str(200))
for key, value in txn.cursor(): #遍歷
print (key, value)
env_db.close()