哈夫曼樹以及編解碼

這一篇要總結的是樹中的最後一種，即哈夫曼樹，我想從以下幾點對其進行總結：

1，什麼是哈夫曼樹？

2，如何構建哈夫曼樹？

3，哈夫曼編碼？

4，算法實現？

回到頂部

一，什麼是哈夫曼樹

什麼是哈夫曼樹呢？

哈夫曼樹是一種帶權路徑長度最短的二叉樹，也稱爲最優二叉樹。下面用一幅圖來說明。

它們的帶權路徑長度分別爲：

圖a： WPL=5*2+7*2+2*2+13*2=54

圖b： WPL=5*3+2*3+7*2+13*1=48

可見，圖b的帶權路徑長度較小，我們可以證明圖b就是哈夫曼樹(也稱爲最優二叉樹)。

回到頂部

二，如何構建哈夫曼樹

一般可以按下面步驟構建：

1，將所有左，右子樹都爲空的作爲根節點。

2，在森林中選出兩棵根節點的權值最小的樹作爲一棵新樹的左，右子樹，且置新樹的附加根節點的權值爲其左，右子樹上根節點的權值之和。注意，左子樹的權值應小於右子樹的權值。

3，從森林中刪除這兩棵樹，同時把新樹加入到森林中。

4，重複2，3步驟，直到森林中只有一棵樹爲止，此樹便是哈夫曼樹。

下面是構建哈夫曼樹的圖解過程：

三，哈夫曼編碼

利用哈夫曼樹求得的用於通信的二進制編碼稱爲哈夫曼編碼。樹中從根到每個葉子節點都有一條路徑，對路徑上的各分支約定指向左子樹的分支表示”0”碼，指向右子樹的分支表示“1”碼，取每條路徑上的“0”或“1”的序列作爲各個葉子節點對應的字符編碼，即是哈夫曼編碼。

就拿上圖例子來說：

A，B，C，D對應的哈夫曼編碼分別爲：111，10，110，0

用圖說明如下：

記住，設計電文總長最短的二進制前綴編碼，就是以n個字符出現的頻率作爲權構造一棵哈夫曼樹，由哈夫曼樹求得的編碼就是哈夫曼編碼。

摘自http://www.cnblogs.com/mcgrady/p/3329825.html#_label0

在電報通訊中，電文是以二進制的0、1序列傳送的。字符集中的字符的使用頻率是不同的（比如e和t的使用較之q和z要頻繁得多），哈夫曼編碼可以使得編碼的總長最短，從而相同的位長可以傳送更多的信息。

本程序以下面的字符及使用頻率爲例：

字符	權值
a	0.12
b	0.40
c	0.15
d	0.08
e	0.25

首先建立哈夫曼樹：

i	0	1	2	3	4	5	6	7	8
tree[i].ch	a	b	c	d	e
tree[i].weight	0.12	0.40	0.15	0.08	0.25	0.20	0.35	0.60	1.00
tree[i].parent	5	8	6	5	7	6	7	8	0
tree[i].lchild	-1	-1	-1	-1	-1	3	2	4	1
tree[i].rchild	-1	-1	-1	-1	-1	0	5	6	7

得到哈夫曼樹和哈夫曼編碼如下：

下面是哈夫曼編碼的存儲結構：

序號	bits				ch	start
0	1	1	1	1	a	2
1				0	b	5
2		1	1	0	c	3
3	1	1	1	0	d	2
4			1	0	e	4

程序清單如下：

#include<stdio.h>
#define n 5  //葉子數目
#define m (2*n-1)    //結點總數
#define maxval 10000.0
#define maxsize 100   //哈夫曼編碼的最大位數
typedef struct
{
char ch;
float weight;
int lchild,rchild,parent;
}hufmtree;
typedef struct
{
char bits[n];   //位串
int start;      //編碼在位串中的起始位置
char ch;        //字符
}codetype;

void huffman(hufmtree tree[]);//建立哈夫曼樹
void huffmancode(codetype code[],hufmtree tree[]);//根據哈夫曼樹求出哈夫曼編碼
void decode(hufmtree tree[]);//依次讀入電文，根據哈夫曼樹譯碼

void main()
{
printf("                            ——哈夫曼編碼——\n");
printf("總共有%d個字符\n",n);
hufmtree tree[m];
codetype code[n];
int i,j;//循環變量
huffman(tree);//建立哈夫曼樹
huffmancode(code,tree);//根據哈夫曼樹求出哈夫曼編碼
printf("【輸出每個字符的哈夫曼編碼】\n");
for(i=0;i<n;i++)
{
  printf("%c: ",code[i].ch);
  for(j=code[i].start;j<n;j++)
   printf("%c ",code[i].bits[j]);
  printf("\n");
}
printf("【讀入電文，並進行譯碼】\n");
decode(tree);//依次讀入電文，根據哈夫曼樹譯碼
}

void huffman(hufmtree tree[])//建立哈夫曼樹
{
int i,j,p1,p2;//p1,p2分別記住每次合併時權值最小和次小的兩個根結點的下標
float small1,small2,f;
char c;
for(i=0;i<m;i++)    //初始化
{
  tree[i].parent=0;
  tree[i].lchild=-1;
  tree[i].rchild=-1;
  tree[i].weight=0.0;
}
printf("【依次讀入前%d個結點的字符及權值(中間用空格隔開)】\n",n);
for(i=0;i<n;i++)  //讀入前n個結點的字符及權值
{
  printf("輸入第%d個字符爲和權值",i+1);
  scanf("%c %f",&c,&f);
  getchar();
  tree[i].ch=c;
  tree[i].weight=f;
}
for(i=n;i<m;i++)      //進行n-1次合併，產生n-1個新結點
{
  p1=0;p2=0;
  small1=maxval;small2=maxval;   //maxval是float類型的最大值
  for(j=0;j<i;j++)    //選出兩個權值最小的根結點
   if(tree[j].parent==0)
    if(tree[j].weight<small1)
    {
     small2=small1;  //改變最小權、次小權及對應的位置
     small1=tree[j].weight;
     p2=p1;
     p1=j;
    }
    else
     if(tree[j].weight<small2)
     {
      small2=tree[j].weight;  //改變次小權及位置
      p2=j;
     }
  tree[p1].parent=i;
  tree[p2].parent=i;
  tree[i].lchild=p1;  //最小權根結點是新結點的左孩子
  tree[i].rchild=p2;  //次小權根結點是新結點的右孩子
  tree[i].weight=tree[p1].weight+tree[p2].weight;
}
}//huffman

void huffmancode(codetype code[],hufmtree tree[])//根據哈夫曼樹求出哈夫曼編碼
//codetype code[]爲求出的哈夫曼編碼
//hufmtree tree[]爲已知的哈夫曼樹
{
int i,c,p;
codetype cd;   //緩衝變量
for(i=0;i<n;i++)
{
  cd.start=n;
  cd.ch=tree[i].ch;
  c=i;       //從葉結點出發向上回溯
  p=tree[i].parent;   //tree[p]是tree[i]的雙親
  while(p!=0)
  {
   cd.start--;
   if(tree[p].lchild==c)
    cd.bits[cd.start]='0';   //tree[i]是左子樹，生成代碼'0'
   else
    cd.bits[cd.start]='1';   //tree[i]是右子樹，生成代碼'1'
   c=p;
   p=tree[p].parent;
  }
  code[i]=cd;    //第i+1個字符的編碼存入code[i]
}
}//huffmancode

void decode(hufmtree tree[])//依次讀入電文，根據哈夫曼樹譯碼
{
int i,j=0;
char b[maxsize];
char endflag='2';    //電文結束標誌取2
i=m-1;             //從根結點開始往下搜索
printf("輸入發送的編碼(以'2'爲結束標誌)：");
gets(b);
printf("譯碼後的字符爲");
while(b[j]!='2')
{
  if(b[j]=='0')
   i=tree[i].lchild;   //走向左孩子
  else
   i=tree[i].rchild;   //走向右孩子
  if(tree[i].lchild==-1)     //tree[i]是葉結點
  {
   printf("%c",tree[i].ch);
   i=m-1;      //回到根結點
  }
  j++;
}
printf("\n");
if(tree[i].lchild!=-1&&b[j]!='2')   //電文讀完，但尚未到葉子結點
  printf("\nERROR\n");  //輸入電文有錯
}//decode

貼出一例運行結果：

摘自http://blog.sina.com.cn/s/blog_686d0fb001012qmh.html

後腦勺

發佈了18 篇原創文章 · 獲贊 322 · 訪問量 46萬+

私信關注

哈夫曼樹以及編解碼

一，什麼是哈夫曼樹

二，如何構建哈夫曼樹

移位操作搞定兩數之商

如何基於surging跨網關跨語言進行緩存降級

2024合集

程序員天天 CURD，怎麼才能成長，職業發展的思考(2)

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

通用代碼生成器簡介

lightdb 單機模式下數據庫平移

千兆寬帶實際網速能到達多少？

STL---heap概述，make_heap,sort_heap,pop_heap,push_heap

SVM 詳解2

SVM 詳解6

SVM 詳解4

SVM 詳解7

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結