1990年开始研发;
1994年正式发布1.0版本;
2024年9月10日发布16.0.0版本。[2]
2024年5月22日,Unicode 联盟开启了 Unicode 16 的测试审查,此次审查将一直持续到 2024年7 月 2 日。[3]
如果把各种文字编码形容为各地的方言,那么统一码就是世界各国合作开发的一种语言。
在这种语言环境下,不会再有语言的编码冲突,在同屏下,可以显示任何语言的内容,这就是统一码的最大好处。就是将世界上所有的文字用2个字节统一进行编码。那样,像这样统一编码,2个字节就已经足够容纳世界上所有语言的大部分文字了。
Universal Multiple-Octet Coded Character Set,简称为UCS。
现在用的是UCS-2,即2个字节编码,而UCS-4是为了防止将来2个字节不够用才开发的。
统一码是一种在计算机上使用的字符编码,1990年开始研发,1994年正式公布。随着计算机工作能力的增强,统一码也在面世以来的十多年里得到普及。
统一码是基于通用字符集(Universal Character Set)的标准来发展,同时也以出版物的形式(The 统一码 Standard,第五版由Addison-Wesley Professional出版,ISBN-10: 0321480910)对外发表。
2005年3月31日推出4.1.0版本。
2024年9月10日发布16.0.0版本。[2]
Universality:提供单一、综合的字符集,编码一切现代与大部分历史文献的字符。
Efficiency:易于处理与分析。
Characters, not glyphs:字符,而不是字形。
Semantics:字符要有良好定义的语义。
Plain text:仅限于文本字符。
Logical order:默认内存表示是其逻辑序。
Unification:把不同语言的同一书写系统(scripts)中相同字符统一起来。
Dynamic composition:附加符号可以动态组合。
Stability:已分配的字符与语义不再改变。
Convertibility:统一码与其他著名字符集可以精确转换。