C語言實現一個簡易的Hash table(一)

說明

Hash table翻譯過來就是Hash表,是一種提供了類似於關聯數組的數據結構,可以通過key執行搜索、插入和刪除操作。Hash表由一些列桶(buckets)組成,而每一個bucket都是由key-value的形式組成。存儲時都是以key-value存儲的,因爲當要定位一個value時,需要把key傳給一個散列函數(hash函數),這個函數返回一個數(索引),代表查找的value位於哪一個bucket中。同理,當我們要從所有的buckets中取回key-value時,一樣是先把key傳給散列函數,再由返回的索引取到value

在數組中,通過下標(索引)獲取值時,複雜度爲O(1),所以Hash表上查找和存儲數據會很快。

我們這個簡易的Hash表會使用字符串作爲keyvalue,這種方法也適用於任意其他類型的keyvalue。本教程只支持ASCII中的字符串,unicode類型比較複雜已經超出了本教程的範圍。

本教程中的Hash表支持的API

本教程中,關聯數組是一個未排序過的key-value集合,不允許重複的key,支持一下操作:

  • search(a, k): 如果關聯數組a中存在k對應的v,就返回v,不存在就返回NULL
  • insert(a, k, v): 向關聯數組a中插入k-v
  • delete(a, k): 根據k刪除一條記錄,如果k不存在則什麼也不做

本教程代碼目錄結構

本教程中所有的代碼都會按如下目錄結構存放:

 

.
├── build
└── src
    ├── hash_table.c
    ├── hash_table.h
    ├── prime.c
    └── prime.h

src目錄存放我們的源代碼,build目錄存放編譯過的二進制文件。

教程中的一些名詞解釋

本文中所涉及到的一些名詞解釋:

  • 關聯數組:實現了上面的API的一種抽象數據結構,也稱映射(Map)符號表(symbol table)字典(dictionary)

  • Hash表:使用了散列函數實現關聯數組的一種數據結構,也稱爲哈希映射,映射,哈希或字典

關聯數組可以用許多不同的底層數據結構實現。可以通過簡單地將值存儲在數組中並在搜索時迭代數組來實現(非高性能的)。關聯數組和散列表經常被混淆,因爲關聯數組經常被實現爲散列表。


著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章