a我考网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 145|回复: 0

[专业语言] Java认证之Java中编码以及Unicode总结(4)

[复制链接]
发表于 2012-8-4 12:44:44 | 显示全部楼层 |阅读模式
Java认证之Java中编码以及Unicode总结(4)
$ m9 L9 O& a. k) I1 L. @1 SCP1252
+ N* P  ?4 j2 g7 Z0 g  11005 M  @) S, c( u% S8 K
  SAP Latin-1 – ISO8859-1 – code page
  I4 b$ \, L! P- e, t  ISO-8859-2
4 _, f1 J& W2 |, Z* E) I- \  1402
/ Y8 u9 F$ A; K  SAP Latin-2 – ISO8859-29 u1 Y  h2 |3 a' M( T
  ISO-8859-5
0 H7 Z2 k* B! [9 s8 ?( N- y3 P  1500
7 N/ {7 y: z$ {: M7 X  J0 P2 k  SAP Cyrillic – ISO8859-5* a6 p' ?5 k, r( N& H
  CP1254
, h0 J+ O8 Y- J) w* D6 j  16102 k2 S$ ]; q: d6 y  @. X9 t
  SAP Turkish – ISO8859-9
2 {% H* m' x! ]6 |) c- P- z' n- Z  CP1253
- r! E7 {; S9 |, q$ j/ W, m  17001 ?- \2 M8 Y. S' X' H3 h9 H8 T
  SAP Greek – ISO8859-7 – Not a complete match" o. j; R+ r" _+ i4 G
  CP1255% a3 k! Z  {" d/ @
  1800
! u3 Y- S& e0 [7 N# R8 K. d  SAP Hebrew – ISO8859-8 – Not a complete match
" J9 z( m" g& [1 @  CP932: ^; j" \6 R2 k
  8000" {0 [* G' W( j  Y
  6
6 v5 n4 b( }4 W+ K( I$ d3 e- e. ?  SAP Shift-JIS
! F: F- p" ]# U4 R3 V4 X( h  CP950) ?2 p+ Y% W+ f! f, Q7 H
  8300
7 h6 d* u/ f4 _$ T6 a+ Y) N4 x7 K  SAP Taiwanese; O% J1 H: z7 y( e" C( g4 n1 f. Z
  CP936
+ ?3 p* Z2 e+ j; n( \% E  8400! U6 T3 v8 e8 }& J7 H6 a- P4 L
  SAP Chinese2 B1 h/ T8 ?( ^- T6 l
  CP949
  I' _# |6 [! j+ j  8500) M8 b3 G' Z6 y, p) m" }
  SAP Korean! a( p6 X5 `. u8 J
  CP874
& n# t" n+ r# t6 \! e1 ]  8600, W% T3 n* i: Q' D  E' P
  SAP Thai
. Q5 B7 N6 @8 I$ |, P. h  3、
5 \3 p8 X  W: R- G7 @  Unicode历史
0 P4 x. i8 R- R" d0 v( g5 U  1991年,Unicode联盟与ISO的工作组终于开始讨论Unicode与UCS的合并问题。最终,两者统一了抽象字符集(即任何一个在 Unicode中存在的字符,在UCS中也存在),对于码空间,两者同意以一百一十万为限,Unicode将码空间扩展到了一百一十万,而UCS将永久性的不使用一百一十万以后的码位。UCS和Unicode都指的是编码字符集,而不是字符集编码。
" `7 O4 w& K! M! G4 Y  字符集编码决定了如何将一个字符的整数编号对应到一个二进制的整数值,有的编码方案简单的将该整数值直接作为其在计算机中的表示而存储,例如英文字符就是这样,几乎所有的字符集编码方案中,英文字母的整数编号与其在计算机内部存储的二进制形式都一致。当初Unicode与UCS还没成家之时,UCS也是需要人爱,需要人疼的,没有自己的字符集编码怎么成。UCS-2与UCS-4就扮演了这样的角色。 UCS-4与UTF-32除了名字不同以外,思想完全一样。而UCS-2与UTF-16在对前65536个字符的处理上也完全相同,唯一的区别只在于 UCS-2 不支持surrogate pair机制,即是说,UCS-2只能对前65536个字符编码,对其后的字符毫无办法。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Woexam.Com ( 湘ICP备18023104号 )

GMT+8, 2024-9-27 23:54 , Processed in 0.708122 second(s), 22 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表