当前位置: 编码机 >> 编码机优势 >> 计算机基础训练营06汉字编码图文稿
欢迎大家来到计算机基础训练营,今天我们来探讨汉字的字符编码,汉字字符编码要比西文字符编码复杂的多。汉字字符编码涉及到国标码、区位码、外码、内码和地址码。
国标码和区位码
汉字不同于西文字符,汉字的信息量很大,约有9万多汉字,而且汉字形象化且直观达意,其字形数据量远大于西文字符,汉字的这些特点决定了汉字编码和西文字符编码的不同。汉字编码涉及到下面两个问题:
汉字使用几个字节进行编码?
输入汉字时,如何进行编码映射?
我国在年发布了国家汉字编码标准GB-80,全称为《信息交换用汉字编码字符集-基本集》,简称GB码或国标码。
GB-80规定每个汉字字符使用2个字节进行编码,每个字节的最高位为0,表示方式为4位16进制数。例如:汉字“火”的国标码为3B70H,汉字“保”的国标码为H。
GB并没有把所有的汉字都容纳进来,GB编码的数量为个汉字,一级汉字(常用字)个,二级汉字(次常用汉字)个,还编码了个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。
订阅解锁TA的全部专属内容