一、含义:
字符集:所谓字符集就是所有文字和符号的总和,这里包含各个国家的文字、标点符号、图形符号、数字等。
字符编码:是一套匹配法则,使用该法则能够使自然语言的字符的一个集合(如字母表或音节表),与其它东西的一个集合(如号码或电脉冲)进行匹配。即在符号集合与数字系统之间建立对应关系,他是信息处理的一项基本技术。通常人们用符号集合(一般情况是文字)来表达信息,而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。元件的不同状态的组合能代表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。
从它们的定义可以看出,字符集只是单纯的字符集合。
二、我们看下面的一张字符与数字对应表
代码 |
字符 |
代码 |
字符 |
代码 |
字符 |
代码 |
字符 |
0 |
|
32 |
[空格] |
64 |
@ |
96 |
` |
1 |
|
33 |
! |
65 |
A |
97 |
a |
2 |
|
34 |
" |
66 |
B |
98 |
b |
3 |
|
35 |
# |
67 |
C |
99 |
c |
4 |
|
36 |
$ |
68 |
D |
100 |
d |
5 |
|
37 |
% |
69 |
E |
101 |
e |
6 |
|
38 |
& |
70 |
F |
102 |
f |
7 |
|
39 |
' |
71 |
G |
103 |
g |
8 |
** |
40 |
( |
72 |
H |
104 |
h |
9 |
** |
41 |
) |
73 |
I |
105 |
i |
10 |
** |
42 |
* |
74 |
J |
106 |
j |
11 |
|
43 |
+ |
75 |
K |
107 |
k |
12 |
|
44 |
, |
76 |
L |
108 |
l |
13 |
** |
45 |
- |
77 |
M |
109 |
m |
14 |
|
46 |
. |
78 |
N |
110 |
n |
15 |
? |
47 |
/ |
79 |
O |
111 |
o |
16 |
? |
48 |
0 |
80 |
P |
112 |
p |
17 |
? |
49 |
1 |
81 |
Q |
113 |
q |
18 |
? |
50 |
2 |
82 |
R |
114 |
r |
19 |
|
51 |
3 |
83 |
S |
115 |
s |
20 |
|
52 |
4 |
84 |
T |
116 |
t |
21 |
|
53 |
5 |
85 |
U |
117 |
u |
22 |
? |
54 |
6 |
86 |
V |
118 |
v |
23 |
? |
55 |
7 |
87 |
W |
119 |
w |
24 |
? |
56 |
8 |
88 |
X |
120 |
x |
25 |
? |
57 |
9 |
89 |
Y |
121 |
y |
26 |
? |
58 |
: |
90 |
Z |
122 |
z |
27 |
|
59 |
; |
91 |
[ |
123 |
{ |
28 |
? |
60 |
< |
92 |
\ |
124 |
| |
29 |
? |
61 |
= |
93 |
] |
125 |
} |
30 |
- |
62 |
> |
94 |
^ |
126 |
~ |
31 |
|
63 |
? |
95 |
_ |
127 |
? |
这是一张标准ASCII字符编码表。这张表能很好的说明字符与编码的关系,编码是将字符对应到一个唯一的数字识别(即唯一的数字)。当计算机识别出此数字后便通过这张表查找对应的实际符号(文字、数字等),将查到的符号展现出来,供人们使用。
这种字符编码技术看起来非常简单,可实际中这项技术遇到了非常多的问题。关于字符集编码的发展会在<<字符集编码发展史>>这边博文中详细说明。
三、总结
字符是一个符号的集合。
编码是一种匹配规则,将字符与数字对应。我们不妨就认为成一张的表格,不过这张表格的中的数字与字符必须保证一一对应关系。