說明
Hash table
翻譯過來就是Hash表
,是一種提供了類似於關聯數組的數據結構,可以通過key
執行搜索、插入和刪除操作。Hash表
由一些列桶(buckets)
組成,而每一個bucket
都是由key-value
的形式組成。存儲時都是以key-value
存儲的,因爲當要定位一個value
時,需要把key
傳給一個散列函數(hash函數)
,這個函數返回一個數(索引),代表查找的value
位於哪一個bucket
中。同理,當我們要從所有的buckets
中取回key-value
時,一樣是先把key
傳給散列函數
,再由返回的索引取到value
。
在數組中,通過下標(索引)獲取值時,複雜度爲O(1)
,所以Hash表
上查找和存儲數據會很快。
我們這個簡易的Hash表
會使用字符串作爲key
和value
,這種方法也適用於任意其他類型的key
和value
。本教程只支持ASCII
中的字符串,unicode
類型比較複雜已經超出了本教程的範圍。
本教程中的Hash表
支持的API
本教程中,關聯數組是一個未排序過的key-value
集合,不允許重複的key
,支持一下操作:
search(a, k)
: 如果關聯數組a
中存在k
對應的v
,就返回v
,不存在就返回NULL
insert(a, k, v)
: 向關聯數組a
中插入k-v
delete(a, k)
: 根據k
刪除一條記錄,如果k
不存在則什麼也不做
本教程代碼目錄結構
本教程中所有的代碼都會按如下目錄結構存放:
.
├── build
└── src
├── hash_table.c
├── hash_table.h
├── prime.c
└── prime.h
src
目錄存放我們的源代碼,build
目錄存放編譯過的二進制文件。
教程中的一些名詞解釋
本文中所涉及到的一些名詞解釋:
-
關聯數組:實現了上面的API的一種抽象數據結構,也稱
映射(Map)
、符號表(symbol table)
或字典(dictionary)
-
Hash表:使用了散列函數實現關聯數組的一種數據結構,也稱爲哈希映射,映射,哈希或字典
關聯數組可以用許多不同的底層數據結構實現。可以通過簡單地將值存儲在數組中並在搜索時迭代數組來實現(非高性能的)。關聯數組和散列表經常被混淆,因爲關聯數組經常被實現爲散列表。
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。