若有一个a、b、c、d四种符号的单符号信源,待编序列为S=abda,已知: 图1

符号a b c d

符号概率Pi 0.100 0.010 0.001 0.001

(以二进位小数表示)

累积概率∑pi 0.000 0.100 0.110 0.111

按照一定精度的数值作为序列的算术编码,实质上是分割单位区间的过程。实现它,必须完成两个递推过程:一个代表码字C(·),另一个代表区间宽度为A(·)。若记SXi表示S的增长(即S后增加一个符号Xi)序列。则有图1 。 图2

若记λ为空序列,有A(λ)=1,C(λ)=0,则有如图2 。

并依次求得:C(abd)= 010111, A(abd)= 0.000001

C(abda)= 0.010111 ,A(abda)= 0.0000001 该编码过程可以用图3所示的单位区间划分的过程来描述。

译码为逆递推过程,可以通过对编码后的数值进行比较来实现。即判断C(S)落入哪一个区间,最后得出一个相应的符号序列S'=Ma=S。 图3

实际的编译码过程比较复杂,但原理相同,算术编码的理论性能也可使平均符号代码长度接近符号熵,而且对二元信源的编码实现比较简单,故受重视。中国将它应用于报纸传真的压缩设备中,获得了良好的效果。

在给定符号集和符号概率的情况下,算术编码可以给出接近最优的编码结果。使用算术编码的压缩算法通常先要对输入符号的概率进行估计,然后再编码。这个估计越准,编码结果就越接近最优的结果。

例: 对一个简单的信号源进行观察,得到的统计模型如下:

60% 的机会出现符号 中性

20% 的机会出现符号 阳性

10% 的机会出现符号 阴性

10% 的机会出现符号 数据结束符. (出现这个符号的意思是该信号源'内部中止',在进行数据压缩时这样的情况是很常见的。当第一次也是唯一的一次看到这个符号时,解码器就知道整个信号流都被解码完成了。)

算术编码可以处理的例子不止是这种只有四种符号的情况,更复杂的情况也可以处理,包括高阶的情况。所谓高阶的情况是指当前符号出现的概率受之前出现符号的影响,这时候之前出现的符号,也被称为上下文。比如在英文文档编码的时候,例如,在字母Q或者q出现之后,字母u出现的概率就大大提高了。这种模型还可以进行自适应的变化,即在某种上下文下出现的概率分布的估计随着每次这种上下文出现时的符号而自适应更新,从而更加符合实际的概率分布。不管编码器使用怎样的模型,解码器也必须使用同样的模型。

编码过程的每一步,除了最后一步,都是相同的。编码器通常需要考虑下面三种数据:

刚刚查询:算术编码 研讨会 甘孜州 紧随其后 英语写作教程 米开朗基利国际钢琴节 寺山村 推动力 谢尔盖·亚历山德罗维奇·叶赛宁 白羊座 西双版纳原始森林 皇室纸牌接龙 间谍妻子 亲亲我的野猪王子 哈瑞·马丁松 小母鸡 中国人民解放军宣言 Tadalafil 临安市 观世音 辣椒碱 婚姻法 主产区 乔舒亚 牙槽骨 北京东方创美旅游景观规划设计院 张曼如 农业职业 弗洛伊德 大豆荷叶碱 清代吴之墦款松溪浴马图笔筒 中国近现代后发优势经济思想研究 工作室 极品艳遇生活 菲律宾国徽 物理学 ʯ 府伟灵 私营监狱 孤立无援 肯定是 保护性 JoelMadden lvdtѹʽλƴ 紧身衣 星月舞 九十年代的爱恋 王洪文 学习方法 普及率 Cryptoxanthin 自立门户 种畜场 人工生命 赵贵 天涯浪子 清远市 白质 激光器 筱田美雨 普陀区 JavaScript 道里区 含在口中 摩根银元 子公司 我的南海 用不了 太白粉 三十八 Braised 初加工 短尾白眼鲛 溢洪道 打击乐 黄帝内经使用手册2 йҵƷЭ 千奇百怪
友情链接: 知道 电影 百科 好搜 问答 微信 值得买 巨便宜 天天特价 洛阳汽车脚垫 女装 女鞋 母婴 内衣 零食 美妆 汽车 油价 郑州 北京 上海 广州 深圳 杭州 南京 苏州 武汉 天津 重庆 成都 大连 宁波 济南 西安 石家庄 沈阳 南阳 临沂 邯郸 保定 温州 东莞 洛阳 周口 青岛 徐州 赣州 菏泽 泉州 长春 唐山 商丘 南通 盐城 驻马店 佛山 衡阳 沧州 福州 昆明 无锡 南昌 黄冈 遵义
© 2024 haodianxin 百科 消耗时间:0.633秒 内存2.48MB