分享

汉字编码

 翠微小斋 2012-04-08

 1、区位码和国标码

 (1)国标:1981年,我国制订了“中华人们共和国国家标准信息交换汉字编码”,代号为“GB2312-80”。

 (2)区位码:按国标规定,汉字编码表有94行94列,其行号01~94称为区号,列号01~94称为位号。一个汉字所在的区号和位号简单地组合在一起就构成了这个汉字的区位码。

     GB2312-80

区位码=区号+位号(采用十进制)      符:2391

例1:汉字“啊”处于16区的01位,则其区位码为1601。

  (3)国标码:又称为“交换码”,它是在不同汉字处理系统间进行汉字交换时所使用的编码。国标码采用两个字节表示,它与区位码的关系是:

国标码高位字节=(区号)16+(20)16

国标码低位字节=(位号)16+(20)16

例2:汉字“啊”的区位码为1601,则其国标码为(3021)16

 2、汉字内码(机内码)

 (1)概念:在计算机内部表示汉字的代码。

 (2)特点:汉字内码采用两个字节,一个汉字占两个ASCII字符;汉字内码最高位为1,ASCII码最高位为0

 (3)汉字内码与区位码的关系:

汉字内码高位字节=(区号)16+(A0)16

汉字内码低位字节=(位号)16+(A0)16

 例3:汉字“啊”的区位码为1601,则其汉字内码为(B0A1)16。

 3、汉字外码(汉字输入码)

 (1)概念:是指从键盘上输入的代表汉字的编码,又称“汉字输入码”。例如区位码、拼音码、五笔字型码等。

国标码=区位码+2020H  
  (区位和位码分别由十进制转换为对应的十六进制后+2020H)  
  机内码=国标码+8080H  
      例:     “大”字的区位码为2083,     20D=14H     83D=53H     1453H+2020H=3473H  
  所以,国标码为3473H,  
  B4F3H=3473H+8080H    所以,机内码为B4F3H。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多