数据是计算机读取指令、执行指令的基础。计算机内的数据均为二进制,二进制数据的存储方式有物理原件简单、电路设计容易等特点。后来,为了方便存储非数值型数据,人们发明了编码,有ASCII、GBK、Unicode等,其中GBK是Windows的默认编码,Unicode是Linux的默认编码。
深入理解计算机原理从了解数据开始,有关的数据单位及其换算如下:
位:bit(比特)——计算机存储设备的最小单位,一位比特代表着该存储空间为一个0或者一个1。
字节:Byte(拜特)——计算机处理数据的基本单位,1Byte=8bit,即8个二进制位为1个字节。一个ASCII码占一个字节,一个汉字占2个字节,一个英文占1个字节,一个整数占1个字节,一个实数占2个字节。
字:word——计算机一次存取、处理、传输的数据长度,由一个或者多个字节组成,表示一条指令或者一条数据。
字长:一个字中包含的二进制数的位数,常见的说法有8位机、16位机、32位机和64位机。字长越长,代表计算机一次可以读取的指令或者数据越多,则运行速度越快。
编码:以字节为单位,为计算机内的存储单元进行编号,编号与特定存储内容对应。