Java认证：Java中编码以及Unicode总结（4）

会计考友 · 发表于 2012-8-4 12:44:44

Java认证之Java中编码以及Unicode总结（4）
CP1252
　　1100
　　SAP Latin-1 – ISO8859-1 – code page
　　ISO-8859-2
　　1402
　　SAP Latin-2 – ISO8859-2
　　ISO-8859-5
　　1500
　　SAP Cyrillic – ISO8859-5
　　CP1254
　　1610
　　SAP Turkish – ISO8859-9
　　CP1253
　　1700
　　SAP Greek – ISO8859-7 – Not a complete match
　　CP1255
　　1800
　　SAP Hebrew – ISO8859-8 – Not a complete match
　　CP932
　　8000
　　6
　　SAP Shift-JIS
　　CP950
　　8300
　　SAP Taiwanese
　　CP936
　　8400
　　SAP Chinese
　　CP949
　　8500
　　SAP Korean
　　CP874
　　8600
　　SAP Thai
　　3、
　　Unicode历史
　　1991年，Unicode联盟与ISO的工作组终于起头谈判Unicode与UCS的合并问题。最终，两者统一了抽象字符集（即任何一个在 Unicode中存在的字符，在UCS中也存在），对于码空间，两者赞成以一百一十万为限，Unicode将码空间扩展到了一百一十万，而UCS将永远性的不使用一百一十万往后的码位。UCS和Unicode都指的是编码字符集，而不是字符集编码。
　　字符集编码抉择了若何将一个字符的整数编号对应到一个二进制的整数值，有的编码方案简单的将该整数值直接作为其在计较机中的暗示而存储，例如英文字符就是这样，几乎所有的字符集编码方案中，英文字母的整数编号与其在计较机内部存储的二进制形式都一致。当初Unicode与UCS还没成家瞬息，UCS也是需要人爱，需要人疼的，没有自己的字符集编码怎么成。UCS-2与UCS-4就饰演了这样的脚色。 UCS-4与UTF-32除了名字分歧以外，思惟完全一样。而UCS-2与UTF-16在对前65536个字符的措置上也完全不异，独一的区别只在于 UCS-2 不撑持surrogate pair机制，即是说，UCS-2只能对前65536个字符编码，对厥后的字符毫无法子。

		自动登录	找回密码
密码			立即注册

[专业语言] Java认证：Java中编码以及Unicode总结（4）