一、基本概念
給定N個權值作爲N個葉子結點,構造一棵二叉樹,若該樹的帶權路徑長度達到最小,稱這樣的二叉樹爲最優二叉樹,也稱爲哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近。
- 路徑和路徑長度:在一棵樹中,從一個結點往下可以達到的孩子或孫子結點之間的通路,稱爲路徑。通路中分支的數目稱爲路徑長度。若規定根結點的層數爲1,則從根結點到第L層結點的路徑長度爲L-1
- 結點的權及帶權路徑長度:若將樹中結點賦給一個有着某種含義的數值,則這個數值稱爲該結點的權。結點的帶權路徑長度爲:從根結點到該結點之間的路徑長度與該結點的權的乘積
- 樹的帶權路徑長度:樹的帶權路徑長度規定爲所有葉子結點的帶權路徑長度之和,記爲WPL(weighted path length) ,權值越大的結點離根結點越近的二叉樹纔是最優二叉樹。
- WPL最小的就是赫夫曼樹
二、構成赫夫曼樹的步驟
- 將數組從小到大進行排序, 將每一個數據,每個數據都是一個節點 , 每個節點可以看成是一顆最簡單的二叉樹。
- 取出根節點權值最小的兩顆二叉樹 。
- 組成一顆新的二叉樹, 該新的二叉樹的根節點的權值是前面兩顆二叉樹根節點權值的和。
- 再將這顆新的二叉樹,以根節點的權值大小 再次排序, 不斷重複 1-2-3-4 的步驟,直到數列中,所有的數據都被處理,就得到一顆赫夫曼樹。
例:
arrays : {11,15,5,7,2}
1.進行排序 {2,5,7,11,15}
第一輪過後數組剩餘 {7,11,15}
第二輪過後數組剩餘{11,15}
第三輪過後數組剩餘{15}
第四輪完成,此時的二叉樹就是哈夫曼樹
三、代碼實現
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
public class HuffmanTree {
public static void main(String[] args) {
int arrays[] = {14, 2, 5, 6, 9, 19};
Node root = createHuffmanTree(arrays);
preOrder(root);
}
public static void preOrder(Node root) {
if (root != null) {
root.preOrder();
} else {
System.out.println("tree is empty");
}
}
/**
* @param arr 需要創建成赫夫曼數的數組
* @return 赫夫曼樹的root結點
*/
public static Node createHuffmanTree(int[] arr) {
/**
* 1.遍歷arr數組
* 2.將arr的每個元素構成一個Node
* 3.將Node放入到ArrayList中
*/
List<Node> nodeList = new ArrayList<Node>();
for (int value : arr) {
nodeList.add(new Node(value));
}
//開始創建赫夫曼樹
while (nodeList.size() > 1) {
//將數組進行排序
Collections.sort(nodeList);
//輸出結點
// System.out.println("nodeList=" + nodeList);
//取出根節點權值最小的兩顆二叉樹
// 1. 取出最小的結點
Node leftNode = nodeList.get(0);
//2. 取出次小的結點
Node rightNode = nodeList.get(1);
//3.構建一個新的二叉樹
Node parent = new Node(leftNode.value + rightNode.value);
parent.leftNode = leftNode;
parent.rightNode = rightNode;
//4. 從ArrayList刪除處理過的二叉樹
nodeList.remove(leftNode);
nodeList.remove(rightNode);
//5. 將parent結點加入到nodeList中
nodeList.add(parent);
}
//返回哈夫曼樹的root結點
return nodeList.get(0);
}
}
/**
* 創建結點類
* 實現Comparable接口可以讓Node對象持續排序
*/
class Node implements Comparable<Node> {
//結點權值
int value;
//指向左子結點
Node leftNode;
//指向右子結點
Node rightNode;
public Node(int value) {
this.value = value;
}
@Override
public String toString() {
return "Node{value=" + value + '}';
}
@Override
public int compareTo(Node o) {
//表示從小到大排序
return this.value - o.value;
}
//前序遍歷
public void preOrder() {
System.out.println(this);
if (this.leftNode != null) {
this.leftNode.preOrder();
}
if (this.rightNode != null) {
this.rightNode.preOrder();
}
}
}
哈夫曼樹最廣泛的應用是哈夫曼編碼,用於壓縮數據。