* ISO 8859-5 (Cyrillic) – 斯拉夫说话
& p2 A! x; P* S' f6 [/ i$ s$ o * ISO 8859-6 (Arabic) – 阿拉伯语
3 a1 Z) C* a+ o5 N5 P' h2 N * ISO 8859-7 (Greek) – 希腊语2 @" ~. D8 X. t% R
* ISO 8859-8 (Hebrew) – 希伯来语(视觉挨次)9 R9 B3 a( q" Y( p0 y' s$ j$ c+ D
* ISO 8859-8-I – 希伯来语(逻辑挨次)
7 }, M& R- s( L8 v( X * ISO 8859-9 (Latin-5 或 Turkish) – 它把Latin-1的冰岛语字母换走,插手土耳其语字母。
% C/ Z( ]6 i) D" w * ISO 8859-10 (Latin-6 或 Nordic) – 北日耳曼语支,用来庖代Latin-4。5 e2 q4 w R! A) F R! `. {( n; i/ U
* ISO 8859-11 (Thai) – 泰语,从泰国的 TIS620 尺度字集演化而来。
T/ V# H& P7 a* s" i# U * ISO 8859-13 (Latin-7 或 Baltic Rim) – 波罗的语族
6 j8 K$ V# `7 l% ]5 b * ISO 8859-14 (Latin-8 或 Celtic) – 凯尔特语族# k: l. ]0 s, j" l7 t% u) j+ H
* ISO 8859-15 (Latin-9) – 西欧说话,插手Latin-1欠缺的法语及芬兰语重
" y: V5 j0 c& {) B7 o3 v, o 4
$ A& p0 b; [/ Z/ ~5 ] 音字母,以及欧元符号。9 o1 X% N- ~! M* N, h/ k' ~
* ISO 8859-16 (Latin-10) – 东南欧说话。首要供罗马尼亚语使用,并插手欧元符号。
/ f- d! o8 K9 L6 S. a4 _ 2.4.3ISO10046(UCS)编码与Unicode' a, p( A2 \/ Z) I r# h8 z2 u
UCS :6 r9 a+ l) e6 s" X
通用字符集(Universal Character Set,UCS)是由ISO拟定的ISO 10646(或称ISO/IEC 10646)尺度所界说的字符编码体例,采用4字节编码。/ ~+ |" V+ j$ x+ Y1 O
Unicode:
& ^" ~4 R. i4 U. \4 l, h; R$ S Unicode(统一码、万国码、单一码)是一种在计较机上使用的字符编码。- V+ F }7 m! H& ]% z* ] G
8 X- ?( _4 h: y' z" i2 b( o/ Z
它是http://www.unicode.org 拟定的编码机制,要将全世界常用文字都函括进去。它为每种说话中的每个字符设定了统一而且独一的二进制编码,以知足跨说话、跨平台进行文本转换、措置的要求。1990年起头研发,1994年正式发布。跟着计较机工作能力的增强,Unicode也在面世以来的十多年迈获得普及。但自豪unicode2.0起头, Unicode采用了与ISO 10646-1不异的字库和字码,ISO也承诺ISO10646将不会给超出0×10FFFF的UCS-4编码赋值,使得两者连结一致。Unicode的编码体例与ISO 10646的通用字符集(Universal Character Set,UCS)概念相对应,今朝的用于适用的Unicode版本对应于UCS-2,使用16位的编码空间。也就是每个字符占用2个字节,根基知足各类说话的使用。现实上今朝版本的Unicode尚未填布满这16位编码,保留了大量空间作为非凡使用或未来扩展。 |