1、基本概念:
散列表(Hash Table,又叫哈希表),是根據關鍵碼值(Key Value)而直接進行訪問的數據結構。也就是說,它通過把關鍵碼值映射到表中一個位置來訪問記錄,以加快查找的速度。這個映射函數叫做散列函數,存放記錄的數組叫做散列表。
2、散列表思想:
(1)使用散列函數將給定鍵轉化爲一個“數組的索引”,理想情況下,不同的key會被轉化爲不同的索引,但是在實際情況中,我們會遇到不同的鍵轉化爲相同索引的情況,這種情況叫做散列衝突/碰撞,後文中會詳細講解;
(2)得到了索引後,我們就可以像訪問數組一樣,通過這個索引訪問到相應的鍵值對。
3、散列表
用的是數組支持按照下標隨機訪問數據的特性,所以散列表其實就是數組的一種擴展,由數組演化而來,可以說,如果沒有數組,就沒有散列表。
4、散列函數
散列函數(又叫哈希函數),顧名思義,它是一個函數。我們可以把它定義爲hash(key),其中key表示元素的鍵值,hasn(key)的鍵表示經過散列函數計算得到的散列值。
5、爲什麼要用散列表?
數組的特點是:尋址容易,插入和刪除困難;
鏈表的特點是:尋址困難,插入和刪除容易;
那麼能不能綜合兩者的特性,做出一種尋址容易,插入和刪除也容易的數據結構?答案是肯定的,這就是我們要了解的散列表,也叫哈希表
6、使用散列表的注意事項:
①key-value成對數據添加到散列表
②key不可以重複,value可以重複
③key-value規定爲一個條目(Entry)
④散列表中散列數組的大小稱爲容量
⑤key-value數量稱爲size
⑥size/容量稱爲加載因子,要小於75%,如果大於75%,會自動擴容
⑦自動擴容會影響put添加性能,可以事先通過設置初始容量,提高put的性能
⑧散列表的默認初始容量是16,默認加載因子是75%,建議不要修改加載因子
7、散列衝突有兩種常用的解決辦法:
開放尋址法和鏈表法;
例子: google 公司的一個上機題:
有一個公司,當有新的員工來報道時,要求將該員工的信息加入(id,性別,年齡,名字,住址..),當輸入該員工的 id 時,要求查找到該員工的 所有信息.
要求:
1) 不使用數據庫,,速度越快越好=>哈希表(散列)
2) 添加時,保證按照 id 從低到高插入 [課後思考:如果 id 不是從低到高插入,但要求各條鏈表仍是從低到高,怎麼解決?]
3) 使用鏈表來實現哈希表, 該鏈表不帶表頭[即: 鏈表的第一個結點就存放僱員信息]
4) 思路分析並畫出示意圖
代碼實現:
package com.nmys.story.hash;
import java.util.Scanner;
/**
* @Auther: Jia
* @Date: 2019/9/15 19:49
* @Description:
*/
public class HashTabDemo {
public static void main(String[] args) {
//創建哈希表
HashTab hashTab = new HashTab(7);
//寫一個簡單的菜單
String key = "";
Scanner scanner = new Scanner(System.in);
while (true) {
System.out.println("add: 添加僱員");
System.out.println("list: 顯示僱員");
System.out.println("find: 查找僱員");
System.out.println("exit: 退出系統");
key = scanner.next();
switch (key) {
case "add":
System.out.println("輸入id");
int id = scanner.nextInt();
System.out.println("輸入名字");
String name = scanner.next();
//創建 僱員
Emp emp = new Emp(id, name);
hashTab.add(emp);
break;
case "list":
hashTab.list();
break;
case "find":
System.out.println("請輸入要查找的id");
id = scanner.nextInt();
hashTab.findEmpById(id);
break;
case "exit":
scanner.close();
System.exit(0);
default:
break;
}
}
}
}
//創建HashTab 管理多條鏈表
class HashTab{
private LinkedList[] link;
private int size;//表示多少條鏈表
public HashTab(int size){
this.size = size;
//初始化
link = new LinkedList[size];
//分別初始化每個鏈表
for(int i = 0; i < size; i++) {
link[i] = new LinkedList();
}
}
//添加
public void add(Emp emp){
//根據員工的id ,得到該員工應當添加到哪條鏈表
int no = hash(emp.id);
//將emp 添加到對應的鏈表中
link[no].add(emp);
}
//遍歷所有的鏈表,遍歷hashtab
public void list() {
for(int i = 0; i < size; i++) {
link[i].list(i);
}
}
//根據輸入的id,查找僱員
public void findEmpById(int id) {
//使用散列函數確定到哪條鏈表查找
int empLinkedListNO = hash(id);
Emp emp = link[empLinkedListNO].findById(id);
if(emp != null) {//找到
System.out.printf("在第%d條鏈表中找到 僱員 id = %d\n", (empLinkedListNO + 1), id);
}else{
System.out.println("在哈希表中,沒有找到該僱員~");
}
}
//編寫散列函數, 簡單取魔法
public int hash(int id){
return id % size;
}
}
//表示一個僱員
class Emp{
public int id;
public String name;
public Emp next;//next 默認爲null
public Emp(int id , String name){
super();
this.id = id;
this.name = name;
}
}
//創建一個鏈表
class LinkedList{
//頭指針,執行第一個Emp,因此我們這個鏈表的head 是直接指向第一個Emp
private Emp head;//默認null
//添加僱員到鏈表,假定,當添加僱員時,id 是自增長,即id的分配總是從小到大
//因此我們將該僱員直接加入到本鏈表的最後即可
public void add(Emp emp){
//如果是添加第一個僱員
if(head == null) {
head = emp;
return;
}
//如果不是第一個僱員,則使用一個輔助的指針,幫助定位到最後
Emp cur = head;
while (true){
//說明到鏈表最後
if(cur.next == null){
break;
}
cur = cur.next;//後移
}
//退出時直接將emp 加入鏈表
cur.next = emp;
}
//遍歷
public void list(int no){
if(head == null){
System.out.println("第"+(no+1)+"鏈表爲空");
return;
}
System.out.print("第 "+(no+1)+" 鏈表的信息爲");
Emp cur = head;//輔助指針
while (true){
System.out.printf(" => id=%d name=%s\t", cur.id, cur.name);
//說明curEmp已經是最後結點
if(cur.next == null){
break;
}
cur = cur.next;//後移,遍歷
}
System.out.println();
}
//根據id查找僱員
//如果查找到,就返回Emp, 如果沒有找到,就返回null
public Emp findById(int id) {
//判斷鏈表是否爲空
if(head == null) {
System.out.println("鏈表爲空");
return null;
}
//輔助指針
Emp cur = head;
while(true) {
if(cur.id == id) {//找到
break;//這時curEmp就指向要查找的僱員
}
//退出
if(cur.next == null) {//說明遍歷當前鏈表沒有找到該僱員
cur = null;
break;
}
cur = cur.next;//以後
}
return cur;
}
}