会计考友 发表于 2012-8-4 12:44:44

Java认证:Java中编码以及Unicode总结(4)

Java认证之Java中编码以及Unicode总结(4)
CP1252
  1100
  SAP Latin-1 – ISO8859-1 – code page
  ISO-8859-2
  1402
  SAP Latin-2 – ISO8859-2
  ISO-8859-5
  1500
  SAP Cyrillic – ISO8859-5
  CP1254
  1610
  SAP Turkish – ISO8859-9
  CP1253
  1700
  SAP Greek – ISO8859-7 – Not a complete match
  CP1255
  1800
  SAP Hebrew – ISO8859-8 – Not a complete match
  CP932
  8000
  6
  SAP Shift-JIS
  CP950
  8300
  SAP Taiwanese
  CP936
  8400
  SAP Chinese
  CP949
  8500
  SAP Korean
  CP874
  8600
  SAP Thai
  3、
  Unicode历史
  1991年,Unicode联盟与ISO的工作组终于起头谈判Unicode与UCS的合并问题。最终,两者统一了抽象字符集(即任何一个在 Unicode中存在的字符,在UCS中也存在),对于码空间,两者赞成以一百一十万为限,Unicode将码空间扩展到了一百一十万,而UCS将永远性的不使用一百一十万往后的码位。UCS和Unicode都指的是编码字符集,而不是字符集编码。
  字符集编码抉择了若何将一个字符的整数编号对应到一个二进制的整数值,有的编码方案简单的将该整数值直接作为其在计较机中的暗示而存储,例如英文字符就是这样,几乎所有的字符集编码方案中,英文字母的整数编号与其在计较机内部存储的二进制形式都一致。当初Unicode与UCS还没成家瞬息,UCS也是需要人爱,需要人疼的,没有自己的字符集编码怎么成。UCS-2与UCS-4就饰演了这样的脚色。 UCS-4与UTF-32除了名字分歧以外,思惟完全一样。而UCS-2与UTF-16在对前65536个字符的措置上也完全不异,独一的区别只在于 UCS-2 不撑持surrogate pair机制,即是说,UCS-2只能对前65536个字符编码,对厥后的字符毫无法子。
页: [1]
查看完整版本: Java认证:Java中编码以及Unicode总结(4)