hash原理

hash原理

原創

xy913741894

2018-08-22 07:49

通過hash函數將數據映射爲索引（下標），便於查找，在hash衝突做得好且數據較少的情況下可達到O（1）。

常用的hash函數有除留餘數法，線性探測，二次探測，開鏈法，在大部分情況下基本就是用開鏈法：

hash的負載因子：元素個數/hash表長度一般控制在0.7 -0. 8

如何提高hash查找的效率

設置好的hash函數，衝突儘量少
空間換時間，增大表長
STL使用素數表
hash桶掛紅黑樹

hash表擴容

容量擴張（Expand）& 分攤轉移

Hash表中每次發現loadFactor到一定程度時（比如大於0.8），就開闢一個原來桶數組的兩倍空間（稱爲新桶數組），然後把原來的桶數組中元素所有轉移過來到新的桶數組中。注意這裏轉移是須要元素一個個又一次哈希到新桶中。

這樣的方法的缺點是，容量擴張是一次完畢的，期間要花非常長時間一次轉移hash表中的全部元素

Memcached的擴容條件是當表中元素個數超過Hash容量的1.5倍時就進行擴容，擴容過程由獨立的線程來完成，擴容過程中會採用2個Hash表，將老表中的數據通過Hash算法映射到新表中，每次移動的桶的數目可以配置，默認是每次移動老表中的1個桶。

這樣的策略就把第一個hash表全部元素的轉移分攤爲多次轉移，並且每次轉移的期望時間複雜度爲O(1)。

參考：深入理解hash

一致性hash，線性hash

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

如何提高hash查找的效率

hash表擴容

EXCEL中下拉菜單中添加新選項或者刪除選項

號稱能打敗MLP的KAN到底行不行？數學核心原理全面解析

同事使用 insert into select 遷移數據，開開心心上線，上線後被公司開除！

Git使用經驗總結5-修改提交信息

Python 爬蟲：Spring Boot 反爬蟲的成功案例

京東科技數字化營銷能力的演進與最佳實踐| 京東雲技術團隊

Git使用經驗總結4-撤回上一次本地提交

Java中止線程的方式

壓榨數據庫的真實處理速度

國內SaaS遇冷？未來企業服務賽道是否還有機會？

網絡編程（編寫一個小型服務器）--csapp11章

逆時針填充正方形（遞歸循環）

理解重定向之dup，dup2

CRC校驗

反轉字符串

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結