若有一个a、b、c、d四种符号的单符号信源,待编序列为S=abda,已知: 图1

符号a b c d

符号概率Pi 0.100 0.010 0.001 0.001

(以二进位小数表示)

累积概率∑pi 0.000 0.100 0.110 0.111

按照一定精度的数值作为序列的算术编码,实质上是分割单位区间的过程。实现它,必须完成两个递推过程:一个代表码字C(·),另一个代表区间宽度为A(·)。若记SXi表示S的增长(即S后增加一个符号Xi)序列。则有图1 。 图2

若记λ为空序列,有A(λ)=1,C(λ)=0,则有如图2 。

并依次求得:C(abd)= 010111, A(abd)= 0.000001

C(abda)= 0.010111 ,A(abda)= 0.0000001 该编码过程可以用图3所示的单位区间划分的过程来描述。

译码为逆递推过程,可以通过对编码后的数值进行比较来实现。即判断C(S)落入哪一个区间,最后得出一个相应的符号序列S'=Ma=S。 图3

实际的编译码过程比较复杂,但原理相同,算术编码的理论性能也可使平均符号代码长度接近符号熵,而且对二元信源的编码实现比较简单,故受重视。中国将它应用于报纸传真的压缩设备中,获得了良好的效果。

在给定符号集和符号概率的情况下,算术编码可以给出接近最优的编码结果。使用算术编码的压缩算法通常先要对输入符号的概率进行估计,然后再编码。这个估计越准,编码结果就越接近最优的结果。

例: 对一个简单的信号源进行观察,得到的统计模型如下:

60% 的机会出现符号 中性

20% 的机会出现符号 阳性

10% 的机会出现符号 阴性

10% 的机会出现符号 数据结束符. (出现这个符号的意思是该信号源'内部中止',在进行数据压缩时这样的情况是很常见的。当第一次也是唯一的一次看到这个符号时,解码器就知道整个信号流都被解码完成了。)

算术编码可以处理的例子不止是这种只有四种符号的情况,更复杂的情况也可以处理,包括高阶的情况。所谓高阶的情况是指当前符号出现的概率受之前出现符号的影响,这时候之前出现的符号,也被称为上下文。比如在英文文档编码的时候,例如,在字母Q或者q出现之后,字母u出现的概率就大大提高了。这种模型还可以进行自适应的变化,即在某种上下文下出现的概率分布的估计随着每次这种上下文出现时的符号而自适应更新,从而更加符合实际的概率分布。不管编码器使用怎样的模型,解码器也必须使用同样的模型。

编码过程的每一步,除了最后一步,都是相同的。编码器通常需要考虑下面三种数据:

相关查询:
最新查询:菜卷 怡贤亲王墓 溶解度 上等兵 臭豆腐腐皮卷 纳税人报 大溪镇 Greiner 没经验 豪尔赫·罗德里格斯 首先应 好消息 牛皮纸 Mabudin 陈侯午簋 中国海洋大学食品义工队 新港镇 运输设备 %E9%9B%86%E4%BD%93%E5%88%A9%E7%9B%8A 又不能 而且有 鲜香炒猫耳朵 Picotite 经济圈 娄山关 每公斤 PROFIBUS 具特殊科学价值地点 充放电 古城镇 能想到 黄巾起义 约翰•汤普森现代钢琴教程4 重离子 藉此机会 最好的是 偷看老大接吻 Football 艺术修养 马戏表演 基洛夫 纺织工业部 唐承佩 财政局 独立国家 研制出 别西卜兽DXW 二进制码 知名度 ote.txt 中国人民解放军宣言 游击战 马路上 经济萧条 小坚果 Ventures 兽人正太 冲劲十足 障景 吴郁生 南安普敦 cycloheptatriene 小焕岭 布衣之交 张仪连横 李安修 合欢派 PHARMANEX 翻出来 刘栓昌 提起公诉 管道网 女神狩猎者 generally 传播公司 Kurosawa 玛纳斯 非对抗性 紧密型 算术编码
友情链接: 知道 电影 百科 好搜 问答 微信 值得买 巨便宜 天天特价 洛阳汽车脚垫 女装 女鞋 母婴 内衣 零食 美妆 汽车 油价 郑州 北京 上海 广州 深圳 杭州 南京 苏州 武汉 天津 重庆 成都 大连 宁波 济南 西安 石家庄 沈阳 南阳 临沂 邯郸 保定 温州 东莞 洛阳 周口 青岛 徐州 赣州 菏泽 泉州 长春 唐山 商丘 南通 盐城 驻马店 佛山 衡阳 沧州 福州 昆明 无锡 南昌 黄冈 遵义
© 2025 haodianxin 百科 豫ICP备14030218号-3 消耗时间:0.563秒 内存2.83MB