</p> UTF:0 e1 ?; I; j, T, N: B! t0 L- Z
Unicode 的实现体例分歧于编码体例。* s( e* e- r: m
一个字符的Unicode编码是确定的,可是在现实传输过程中,因为分歧系统平台的设计不必然一致,以及出于节约空间的目的,对Unicode 编码的实现体例有所分歧。Unicode的实现体例称为Unicode转换名目(Unicode Translation Format,简称为 UTF)。
' o5 Z1 h- {3 t- X+ R+ Q6 @8 t UTF-8: 8bit变长编码,对于大大都常用字符集(ASCII中0~127字符)它只使用单字节,而对其它常用字符(出格是朝鲜和汉语会意文字),它使用3字节。
4 M* S3 e$ M% {5 v9 F& U9 n: W4 W UTF-16: 16bit编码,是变长码,大致相当于20位编码,质ё仝0×0000到
7 q; @ ^$ I( Y( P# Q4 o, m 0×10FFFF之间,根基上就是Unicode编码的实现,与CPU字序有关。
% ~0 E6 N' H- a% i; p; i& \/ Y2 d UTF-32:32bit编码,定长编码对应于字符的Unicode暗示。% S2 [ K2 R# f, d$ i
Unicode big endia:% t( f) ]( b0 j" k/ o3 Z
在Windows系统中保留文本文件时凡是可以选择编码为ANSI、Unicode、Unicode big endian和UTF-8,这里的ANSI和Unicode big endia是什么编码呢?
! T3 `: d% U4 Z$ V3 R6 ?/ Y2 ^ UTF-8以字节为编码单元,没有字节序的问题。UTF-16以两个字节为编码单元,在诠释一个UTF-16文本前,首先要弄清嚣张每个编码单元的字节序。
, {2 N/ ^+ Y3 m3 N7 D Unicode规范中举荐的标识表记标帜字节挨次的体例是BOM(即Byte Order Mark)。: R& u4 H6 v- c, H. D
在UCS编码中有一个叫做”ZERO WIDTH NO-BREAK SPACE”的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该呈此刻现实传输中。UCS规范建议我们在传输字节约前,先传输字符”ZERO WIDTH NO-BREAK SPACE”。6 I+ j7 U8 l9 B! A# o8 c3 M2 c' c
如不美观领受者收到FEFF,就剖明这个字节约是Big-Endian的;如不美观收到FFFE,
( s2 W6 Y$ G v" z& I: L 52 y* r. n2 ?9 w+ Z
就剖明这个字节约是Little-Endian的。是以字符”ZERO WIDTH NO-BREAK SPACE”又被称作BOM。Windows就是使用BOM来标识表记标帜文本文件的编码体例的。
' i: O: I1 u: L, ~$ B' k2 } 2.5 codepage的编码系统
4 C( ?* H5 r$ s2 m; d7 g7 B codepage 指的是一个经由遴选的以特定挨次枚举的字符内码列表,对于早期的单字节内码的语种,codepage中的内码挨次使得系统可以按照此列表来按照键盘的输入值给出一个对应的内码。对于双字节内码,则给出的是MultiByte到Unicode的对应表,这样就可以把以Unicode形式存放的字符转化为响应的字符内码。近似unicode,只是此外一种字符编码体例,注重ASP和SAP中的codepage的区别。
/ C( r6 h, Z! h. Y; Y1 E ASP中:6 k3 s8 E; O2 P8 I4 J7 Z7 n
CodePage的浸染,是抉择页面以何种编码体例显示动态内容。当页面被处事器措置之后,页面将以CodePage设定的编码输出到客户端。当然,CodePage的参数需正确,否则,将发生错误信息“CodePage 值无效。指定的 CodePage 值无效。”(事务ID: 0204)。如不美观CodePage没有设置,则处事器使用默认的CodePage加载到你的Session琅缦沔,使用轨范代码: Response.Write(Session.CodePage)可以查看你当前使用的CodePage。
& P) C. D5 O; L- @3 s/ G4 D9 b SAP中:最经常我们使用的篡夺数据的体例就是使用GUI_UPLOAD这个FM.在这个FM中有个CODEPAGE,是用来指定代码页的。% u6 Z# t: [/ u/ I
Siebel Value2 ]% L& }7 w' p% h7 f: Y0 V
SAP Code page
( \- G5 F2 H; V7 U3 n5 @2 y0 J+ | Description |