$哈夫曼编码为存放一串字符所需的最少的二进制编码 \ 一般通过构造哈夫曼树(最优二叉树)来得到哈夫曼编码$
分支取0/1, 统计权值大小(或出现频率,总之数值大小) 构造哈夫曼树(最优二叉树)
即带权路径长度WPL最小,路径的0/1边到对应叶子结点的字母,即为该字母对应的哈夫曼编码
如图:
经典例题-合并果子
在一个果园里,达达已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。 达达决定把所有的果子合成一堆。 每一次合并,达达可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。 可以看出,所有的果子经过 n−1 次合并之后,就只剩下一堆了。 达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。 因为还要花大力气把这些果子搬回家,所以达达在合并果子时要尽可能地节省体力。 假定每个果子重量都为 1,并且已知果子的种类数和每种果子的数目,你的任务是设计出合并的次序方案,使达达耗费的体力最少,并输出这个最小的体力耗费值。 例如有 3 种果子,数目依次为 1,2,9。 可以先将 1、2 堆合并,新堆数目为 3,耗费体力为 3。 接着,将新堆与原先的第三堆合并,又得到新的堆,数目为 12,耗费体力为 12。 所以达达总共耗费体力=3+12=15。 可以证明 15 为最小的体力耗费值。 输入格式 输入包括两行,第一行是一个整数 n,表示果子的种类数。 第二行包含 n 个整数,用空格分隔,第 i 个整数 ai 是第 i 种果子的数目。 输出格式 输出包括一行,这一行只包含一个整数,也就是最小的体力耗费值。 输入数据保证这个值小于 $2^{31}$。 数据范围 1≤n≤10000, 1≤ai≤20000
输入样例: 3 1 2 9
输出样例: 15
哈夫曼树算法构造过程: 每次选取最小的两个带权结点组成新的带权结点(2合1),重复以上操作直到只剩下一个结点
代码实现利用STL库:小根堆【优先队列】 (允许任意两堆合并)
#include <iostream>
#include <algorithm>
#include <queue>
using namespace std;
int main()
{
int n;
scanf("%d", &n);
priority_queue<int, vector<int>, greater<int>> heap;
while (n -- )
{
int x;
scanf("%d", &x);
heap.push(x);
}
int res = 0;
while (heap.size() > 1)
{
int a = heap.top(); heap.pop(); //调用函数之间只能用分号隔开
int b = heap.top(); heap.pop();
res += a + b;
heap.push(a + b);
}
printf("%d\n", res);
return 0;
}