Java认证之Java中编码以及Unicode总结（4）

会计考友 · 发表于 2012-8-4 12:44:44

Java认证之Java中编码以及Unicode总结（4）
CP1252
　　1100
　　SAP Latin-1 – ISO8859-1 – code page
　　ISO-8859-2
　　1402
　　SAP Latin-2 – ISO8859-2
　　ISO-8859-5
　　1500
　　SAP Cyrillic – ISO8859-5
　　CP1254
　　1610
　　SAP Turkish – ISO8859-9
　　CP1253
　　1700
　　SAP Greek – ISO8859-7 – Not a complete match
　　CP1255
　　1800
　　SAP Hebrew – ISO8859-8 – Not a complete match
　　CP932
　　8000
　　6
　　SAP Shift-JIS
　　CP950
　　8300
　　SAP Taiwanese
　　CP936
　　8400
　　SAP Chinese
　　CP949
　　8500
　　SAP Korean
　　CP874
　　8600
　　SAP Thai
　　3、
　　Unicode历史
　　1991年，Unicode联盟与ISO的工作组终于开始讨论Unicode与UCS的合并问题。最终，两者统一了抽象字符集（即任何一个在 Unicode中存在的字符，在UCS中也存在），对于码空间，两者同意以一百一十万为限，Unicode将码空间扩展到了一百一十万，而UCS将永久性的不使用一百一十万以后的码位。UCS和Unicode都指的是编码字符集，而不是字符集编码。
　　字符集编码决定了如何将一个字符的整数编号对应到一个二进制的整数值，有的编码方案简单的将该整数值直接作为其在计算机中的表示而存储，例如英文字符就是这样，几乎所有的字符集编码方案中，英文字母的整数编号与其在计算机内部存储的二进制形式都一致。当初Unicode与UCS还没成家之时，UCS也是需要人爱，需要人疼的，没有自己的字符集编码怎么成。UCS-2与UCS-4就扮演了这样的角色。 UCS-4与UTF-32除了名字不同以外，思想完全一样。而UCS-2与UTF-16在对前65536个字符的处理上也完全相同，唯一的区别只在于 UCS-2 不支持surrogate pair机制，即是说，UCS-2只能对前65536个字符编码，对其后的字符毫无办法。

		自动登录	找回密码
密码			立即注册

[专业语言] Java认证之Java中编码以及Unicode总结（4）