數據結構之C語言實現哈夫曼樹

来源:http://www.cnblogs.com/zhangming-blog/archive/2016/04/15/5395950.html
-Advertisement-
Play Games

1、基本概念 a、路徑和路徑長度 若在一棵樹中存在著一個結點序列 k1,k2,……,kj, 使得 ki是ki+1 的雙親(1<=i<j),則稱此結點序列是從 k1 到 kj 的路徑。 從 k1 到 kj 所經過的分支數稱為這兩點之間的路徑長度,它等於路徑上的結點數減1. b、結點的權和帶權路徑長度 ...


1、基本概念

a、路徑和路徑長度

若在一棵樹中存在著一個結點序列 k1,k2,……,kj, 使得 ki是ki+1 的雙親(1<=i<j),則稱此結點序列是從 k1 到 kj 的路徑。

從 k1 到 kj 所經過的分支數稱為這兩點之間的路徑長度,它等於路徑上的結點數減1.

 

b、結點的權和帶權路徑長度

在許多應用中,常常將樹中的結點賦予一個有著某種意義的實數,我們稱此實數為該結點的權,(如下麵一個樹中的藍色數字表示結點的權)

結點的帶權路徑長度規定為從樹根結點到該結點之間的路徑長度與該結點上權的乘積。

 

c、樹的帶權路徑長度

樹的帶權路徑長度定義為樹中所有葉子結點的帶權路徑長度之和,公式為:

 

其中,n表示葉子結點的數目,wi 和 li 分別表示葉子結點 ki 的權值和樹根結點到 ki 之間的路徑長度。

如下圖中樹的帶權路徑長度 WPL = 9 x 2 + 12 x 2 + 15 x 2 + 6 x 3 + 3 x 4 + 5 x 4  =  122

 

 

d、哈夫曼樹

哈夫曼樹又稱最優二叉樹。它是 n 個帶權葉子結點構成的所有二叉樹中,帶權路徑長度 WPL 最小的二叉樹。

如下圖為一哈夫曼樹示意圖。

 

2、構造哈夫曼樹

 

假設有n個權值,則構造出的哈夫曼樹有n個葉子結點。 n個權值分別設為 w1、w2、…、wn,則哈夫曼樹的構造規則為:


(1) 將w1、w2、…,wn看成是有n 棵樹的森林(每棵樹僅有一個結點);


(2) 在森林中選出兩個根結點的權值最小的樹合併,作為一棵新樹的左、右子樹,且新樹的根結點權值為其左、右子樹根結點權值之和;


(3)從森林中刪除選取的兩棵樹,並將新樹加入森林;


(4)重覆(2)、(3)步,直到森林中只剩一棵樹為止,該樹即為所求得的哈夫曼樹。

 

 如:對 下圖中的六個帶權葉子結點來構造一棵哈夫曼樹,步驟如下:

 

註意:為了使得到的哈夫曼樹的結構儘量唯一,通常規定生成的哈夫曼樹中每個結點的左子樹根結點的權小於等於右子樹根結點的權。

具體演算法如下:

/**
 * 創建哈夫曼樹
 */
PtrHuffman createHuffmanTree(ElemType arr[]){
    PtrHuffman ptrArr[LENGTH];
    PtrHuffman ptr,pRoot=NULL;  

    for (int i = 0; i < LENGTH; i++){  //初始化結構體指針數組,數組中每一個元素為一個結構體指針類型
        ptr = (PtrHuffman)malloc(sizeof(HuffmanTreeNode));  
        ptr->data = arr[i];  
        ptr->left = ptr->right = NULL; 
        ptrArr[i] = ptr;
    }
    
    for(i = 1; i < LENGTH; i++){  //進行 n-1 次迴圈建立哈夫曼樹  
        //k1表示森林中具有最小權值的樹根結點的下標,k2為次最小的下標
        int k1 = -1, k2;
        for(int j = 0; j < LENGTH; j++){  
            if (ptrArr[j] != NULL && k1 == -1){  
                k1 = j;  
                continue;  
            }  
            if (ptrArr[j] != NULL){  
                k2 = j;  
                break;  
            }  
        }  
        //將指針數組中的指針指向的最小值賦值給索引號為k1的,次小值賦值給索引號為k2的
        for (j = k2; j < LENGTH; j++){
            if(ptrArr[j] != NULL){
                if(ptrArr[j]->data < ptrArr[k1]->data){
                    k2 = k1;
                    k1 = j;
                }else if(ptrArr[j]->data < ptrArr[k2]->data){
                    k2 = j;
                }
            }
        }
        //由最小權值樹和次最小權值樹建立一棵新樹,pRoot指向樹根結點
        pRoot = (PtrHuffman)malloc(sizeof(HuffmanTreeNode));
        pRoot->data = ptrArr[k1]->data + ptrArr[k2]->data;
        pRoot->left = ptrArr[k1];
        pRoot->right = ptrArr[k2];

        ptrArr[k1] = pRoot; //將指向新樹的指針賦給ptrArr指針數組中k1位置
        ptrArr[k2] = NULL; //k2位置為空
    }

    return pRoot;
}

3、哈夫曼編碼

在電報通信中,電文是以二進位的0、1序列傳送的,每個字元對應一個二進位編碼,為了縮短電文的總長度,採用不等長編碼方式,構造哈夫曼樹,

將每個字元的出現頻率作為字元結點的權值賦予葉子結點,每個分支結點的左右分支分別用0和1編碼,從樹根結點到每個葉子結點的路徑上

所經分支的0、1編碼序列等於該葉子結點的二進位編碼。如上文所示的哈夫曼編碼如下:

a 的編碼為:00

b 的編碼為:01

c 的編碼為:100

d 的編碼為:1010

e 的編碼為:1011

f 的編碼為:11

 

4、哈夫曼樹的操作運算

以上文的哈夫曼樹作為具體實例,用詳細的程式展示哈夫曼樹的操作運算:

/** 哈夫曼樹編碼 **/
#include<stdio.h>
#include<stdlib.h> 
#define LENGTH 6

typedef int ElemType;  

typedef struct HuffmanTreeNode{  
    ElemType data;  //哈夫曼樹中節點的權值
    struct HuffmanTreeNode* left;  
    struct HuffmanTreeNode* right;  
}HuffmanTreeNode,*PtrHuffman;  


/**
 * 創建哈夫曼樹
 */
PtrHuffman createHuffmanTree(ElemType arr[]){
    PtrHuffman ptrArr[LENGTH];
    PtrHuffman ptr,pRoot=NULL;  

    for (int i = 0; i < LENGTH; i++){  //初始化結構體指針數組,數組中每一個元素為一個結構體指針類型
        ptr = (PtrHuffman)malloc(sizeof(HuffmanTreeNode));  
        ptr->data = arr[i];  
        ptr->left = ptr->right = NULL; 
        ptrArr[i] = ptr;
    }
    
    for(i = 1; i < LENGTH; i++){  //進行 n-1 次迴圈建立哈夫曼樹  
        //k1表示森林中具有最小權值的樹根結點的下標,k2為次最小的下標
        int k1 = -1, k2;
        for(int j = 0; j < LENGTH; j++){  
            if (ptrArr[j] != NULL && k1 == -1){  
                k1 = j;  
                continue;  
            }  
            if (ptrArr[j] != NULL){  
                k2 = j;  
                break;  
            }  
        }  
        //將指針數組中的指針指向的最小值賦值給索引號為k1的,次小值賦值給索引號為k2的
        for (j = k2; j < LENGTH; j++){
            if(ptrArr[j] != NULL){
                if(ptrArr[j]->data < ptrArr[k1]->data){
                    k2 = k1;
                    k1 = j;
                }else if(ptrArr[j]->data < ptrArr[k2]->data){
                    k2 = j;
                }
            }
        }
        //由最小權值樹和次最小權值樹建立一棵新樹,pRoot指向樹根結點
        pRoot = (PtrHuffman)malloc(sizeof(HuffmanTreeNode));
        pRoot->data = ptrArr[k1]->data + ptrArr[k2]->data;
        pRoot->left = ptrArr[k1];
        pRoot->right = ptrArr[k2];

        ptrArr[k1] = pRoot; //將指向新樹的指針賦給ptrArr指針數組中k1位置
        ptrArr[k2] = NULL; //k2位置為空
    }

    return pRoot;
}

/**
 * 計算哈夫曼樹帶權路徑長度WPL
 */
ElemType calculateWeightLength(PtrHuffman &ptrTree,int len){
    if(ptrTree==NULL){ //空樹返回0
        return 0;
    }else{
        if(ptrTree->left==NULL && ptrTree->right==NULL){ //訪問到葉子節點
            return ptrTree->data * len;
        }else{
            return calculateWeightLength(ptrTree->left,len+1) + calculateWeightLength(ptrTree->right,len+1); //向下遞歸計算
        }
    }
}


/**
 * 哈夫曼樹編碼(葉子節點按中序方式依次列印其編碼)
 */
void HuffmanCoding(PtrHuffman &ptrTree,int len){
    //靜態局部變數相當於全局變數(只是只有在這個函數中能訪問,但是生命周期是和全局變數差不多的)函數退出之後變數還在,而且只在第一次進入的時候做初始化,以後會跳過初始化語句,保留原來的值
    static int arr[20];  
    if(ptrTree != NULL){
        if(ptrTree->left==NULL && ptrTree->right==NULL){
           printf("結點權值為%d的編碼: ", ptrTree->data); 
           for(int i = 0; i < len; i++){
               printf("%d", arr[i]);      
           }   
           printf("\n"); 
        }else{
            arr[len] = 0;
            HuffmanCoding(ptrTree->left,len+1);
            arr[len] = 1;
            HuffmanCoding(ptrTree->right,len+1);
        }
    }
}


/**
 * 列印哈夫曼樹中各個節點的孩子節點
 * 若為葉子節點,則只顯示提示信息
 * @param node 需要顯示孩子節點的父節點
 */
void printHuffmanTreeChildNode(PtrHuffman node){
    if(node->left == NULL && node->right == NULL){
        printf("x=%d是哈夫曼樹中的葉子節點",node->data);
        printf("\n\n");
        return;
    }
    if(node->left != NULL){
        printf("x=%d在哈夫曼樹中的左孩子節點是lchild=%d",node->data,node->left->data);
        printf("\n");
    }
    if(node->right != NULL){
        printf("x=%d在哈夫曼樹中的右孩子節點是rchild=%d",node->data,node->right->data);
        printf("\n");
    }
    printf("\n");
}


/**
 * 中序列印哈夫曼樹的節點
 */
void midOrderprintHuffmanTreeNode(PtrHuffman &pRoot){
    if(pRoot==NULL){
        return;
    }else{
        midOrderprintHuffmanTreeNode(pRoot->left);
        printf("%d ",pRoot->data);
        midOrderprintHuffmanTreeNode(pRoot->right);
    }
}

/**
 * 先序列印哈夫曼樹的節點
 */
void PreOrderprintHuffmanTreeNode(PtrHuffman &pRoot){
    if(pRoot==NULL){
        return;
    }else{
        printHuffmanTreeChildNode(pRoot); //依次列印哈夫曼樹中各個節點的孩子節點
        PreOrderprintHuffmanTreeNode(pRoot->left);
        PreOrderprintHuffmanTreeNode(pRoot->right);
    }
}


/**
 * 測試程式入口
 */
int main(){
    ElemType arr[] = {3,9,5,12,6,15};
    PtrHuffman pRoot = createHuffmanTree(arr);  //返回指向哈夫曼樹根節點的指針

    printf("==========中序列印哈夫曼樹節點數據==========\n");
    midOrderprintHuffmanTreeNode(pRoot);
    printf("\n\n");

    printf("==========先序列印哈夫曼樹節點關係==========\n");
    PreOrderprintHuffmanTreeNode(pRoot);

    printf("==========計算帶權路徑長度==========\n");
    printf("WeightLength=%d\n",calculateWeightLength(pRoot,0));
    printf("\n");

    printf("==========各節點的哈夫曼樹編碼==========\n");
    HuffmanCoding(pRoot,0);

    fprintf(stdout,"\n");
    
    return 0;
}

 

運行結果截圖:

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 最近使用關係型資料庫實現了用戶之間的關註,於是思考換一種思路,使用Redis實現用戶之間的關註關係。 綜合考慮了一下Redis的幾種數據結構後,覺得可以用集合實現一下。 假設“我”的ID是1,“別人”的ID是2。 一、添加關註 添加關註分為兩步:1、將對方id添加到自己的關註列表中;2、將自己的id ...
  • 第一節 CountDownLatch (1)初識CountDownLatch (2)詳述CountDownLatch CountDownLatch是通過一個計數器來實現的,計數器的初始值為線程的數量。每當一個線程完成了自己的任務後,計數器的值就會減1,當計數器值到達0時,它表示所有的線程已經完成了任 ...
  • 單鏈表的結構有多種 這裡介紹的鏈表有頭結點、有尾節點並且尾節點指向頭結點 單鏈表的每個結點的地址存放在其直接前驅結點的指針域中。其中第一個結點沒有前驅結點,因此需要一個頭指針指向第一個節點,便於我們對整個鏈表進行操作;這裡的單鏈表的最後一個節點的指針域存放的是頭結點的地址。 單鏈表不能隨意存取,必要 ...
  • 目標網站:http://www.netbian.com/ 目的:實現對壁紙各分類的第一頁壁紙的獲取 一:分析網站,編寫代碼: (ps:源代碼在文章的最後) 1.獲取網站目錄部分的一大段代碼,下一步再進行仔細匹配網址與標題. 如圖: 2.進行分類的標題與鏈接的匹配。 如下圖所示: 3.從爬取到的目錄進 ...
  • 今天碰到一個非常奇怪的問題,機器環境是JDK8、Tomcat8,把jQuery MiniUI ( for Java Eclipse)下載後導入到Eclipse中,首頁可以顯示,但運行操作資料庫的頁面出錯。在該項目下新建一個簡單的jsp頁面,發現也不能運行,出現錯誤提示: org.apache.jas ...
  • 使用python的Flask框架時,參考《Flask Web開發》一書時,發現書中可以在全局使用Permission.FOLLOW變數。 但是自己在嘗試是,確提示變數沒有定義。經過搜索,找到了答案。 在Flask框架中,把變數註冊到全局,有兩個方法: 1、在主app或者藍本中通過裝飾器註冊 2、添加 ...
  • 本文主要針對java反射進行學習,以java.lang.reflect包中的介面和類進行學習和理解。文章目錄如下: 1. java反射概念 2. java反射包介面詳解 3. java發射包中類詳解 4. java反射的應用例子 一:java反射概念 JAVA反射機制是在運行狀態中,對於任意一個類, ...
  • 1、問題使用jQuery的ajax請求 Servlet 時,返回沒有進入ajax的success回調函數,瀏覽器控制台顯示 [HTTP/1.1 405 Method not allowed]。 2、解決方法網上調查,大多都是如下解釋 Apache、IIS、Nginx等絕大多數web伺服器,都不允許靜 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...