数据结构——散列表

什么是散列表

       散列表也叫做哈希表(hash table),这种数据结构提供了键和值的映射关系。根据key可以快速的查找他所匹配的value,时间复杂度接近于O(1)。

散列表的实现

       散列表本质上就是一个数组,这也是为啥散列表为啥查找速度快。

       数组的下标是0,1,2,3....这样的,散列表的key一般都是字符串类型的,所以我们需要一个“中转站”,通过这个中转站把key与数组下标进行转换。这种中转站就叫作哈希函数

       在java及大多数面向对象的语言中,每个 对象都有属于自己的hashcode,无论对象自身的类型是什么,他们的hashcode都是一个整型变量。既然是整型变量,想要转换成数组下标就非常简单了。最简单的方法就是按照数组长度取模运算 ,也有利用位运算的方式来优化性能的。

散列表的读写操作

写操作(put)

步骤:

        第一步:通过哈希函数,把key转化成数组下标。

        第二步:如果转换成的数组下标对应的位置没有元素,就把这个键值对(不仅仅是value)填充到这个位置。

       在第二步中很可能出现一种情况,就是转化的数组下标的地方已经存在元素的了,这种情况就叫作哈希冲突。哈希冲突是不可避免的,所以只能想办法解决哈希冲突。解决哈希冲突主要有两种方式:开放寻址法链表法

开放寻址法:

        开放寻址法的原理就是,当一个key通过哈希函数获得对应的数组下标已被占用时,我们可以“另谋高就”,寻找下一个空档位置。

        寻址方式有很多种,并不是只有向后寻找一个元素这么一种,但是大概原理都一样。

链表法:

        这种方法的实现原理就是,数组中每个元素不仅仅是存的键值对对象,还是一个链表的头节点。每个对象通过next指针指向他的下一个对象节点。当新来的键值对映射的下标产生冲突时,只需要插入到对应的链表即可。

读操作(get)

步骤:

        第一步:通过哈希函数,把key转化成数组下标。

        第二步:找到数组下标所对应的元素,如果这个元素的key是我们要读取的,那么就找到了;如果不是,就顺着相应的链表往下找,找到与查找key对应的节点。

扩容(resize)

        因为散列表本质就是数组,数组有一定的长度,长度不够用需要扩容,所以哈希表也有扩容操作。散列表达到一定的饱和度(不同的地方定义不一样)就需要扩容。

步骤:

        第一步:扩容,创建一个新的空数组,长度是原数组的2倍。

        第二步:重新Hash,遍历原数组,把所有元素重新hash到新的数组中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章