根基概念 bit 位只能是0或者1
" d0 ?; n; C+ M byte 字节一个字节是8位,1 byte=8 bits 计较机暗示的根基单元# d$ z& Q4 w/ O! E) R# W/ @+ b
KB,MB,GB,TB,PB是以1024与byte进行换算 s# L* P. b3 a) `6 G
进制 用符号进行计数 十进制、二进制、八进制(011)、十六进制(0xFF)% ?0 j' m- _2 ?! e- L
字符文字和符号的总称2 t+ K. @/ G. J, Z6 y
1、
0 ~) U( y; q" F 0 0×00 0000,0000
/ I; r* _4 b E4 E( h% V 1 0×01 0000,0001$ S+ O( I. o' q& k
2 0×01 0000,0010
( T6 p" h1 |: O" l- d 127 0×7F 0111,1111$ r& Q7 N4 l# G2 Q
-128 0×80 1000,0000: V+ s8 o8 l% y
-2 0xFE 1111,1110
8 j7 \& E; E% y R- [9 Y, a8 `# c -1 0xFF 1111,1111
- W" s# `* S' P! Q 以补码的形式暗示的二进制编码。% |* }# u0 Q# R# x* Q m9 I* \+ l. P
-2的暗示,2=0000,0010,反码1111,1101,补码=反码+1=11111110# P6 U7 R- K) F9 q
1111,1110暗示的就是1111,1110-1=1111,1101,取反就是0000,0010也就是2,所以就是-2. O% X5 U9 H! {( _- Y( n
2、
: p" {/ u( m# z; i( B 字符集和编码2 t+ x$ g% U! j; _$ H$ s/ T9 l7 t& K j
2.1字符(Character)
, y# K5 ^: y$ b% E( V 字符(Character)是文字与符号的总称,搜罗文字、图形符号、数学符号等。
2 @- C2 m% f( S. c J" s* B e2 E 2.2字符集(Character Set)
% v" \9 L+ L+ Z9 r 一组成象字符的集结就是字符集(Character Set)。字符集经常和一种具体的说话文字对应起来,该文字中的所有字符或者大部门常用字符就组成磷泼文字的字符集,好比英文字符集。一组有配合特征的字符也可以组成字符集,好比繁体汉字字符集、日文汉字字符集。字符集的子集也是字符集。
* B. z' j( e' E 计较机要措置各类字符,就需要将字符和二进制内码对应起来,这种对应关系就是字符编码(Encoding)。拟定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。按照字符集内字符的若干好多,会确定用几个字节来编码。每种编码都限制了一个明晰的字符集结,叫做被编码过的字符集 (Coded Character Set),这是字符集的此吐矣闽寄义。凡是所说的字符集大多都是指编码字符集(Coded Character Set)。3 E( f/ w( n/ [ L; ^/ X6 }# ^2 i
1! O$ p' J [+ H- ]
2.2.1 ASCII字符集
) H p- D/ \9 F+ z8 K( P ASCII(American Standard Code for Information Interchange,美国信息交流尺度代码)是基于罗马字母表的一套电脑编码系统。由美国国家尺度局(ANSI)拟定。
D; b. }. ^ L' Z" x 7位,可以暗示2^7=128个字符。在计较机的存储单元中,一个ASCII码置魅占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。 7位编码的字符集只能撑持128个字符,为了暗示更多的欧洲常用字符对ASCII进行了扩展,ASCII扩展字符集使用8位(bits)暗示一个字符,共 256字符。
1 \! u- {: h+ O+ ?% Q& G( l; t1 P, j
3 b6 o' \3 Y ]( A0 v ASCII扩展字符集比ASCII字符集扩充出来的符号搜罗表格符号、计较符号、希腊字母和非凡的拉丁符号。 |