数字系统与信息表示#

从古至今,人类始终被“数”(number)包围,计数系统为文明发展提供了重要支撑。任意进制的 n 位非负整数可表示为:

p=i=0n1aiti

其中,ai 为系数,t 为进制基数(位权的底数)。例如十进制数 457 可表示为 4×102+5×101+7×100

信息论创始人香农指出:通信的最基本消息单元是二值符号。现代计算机基于二进制数字系统,信息的最小度量单位是 比特(bit),以 01 表示两种状态。任何复杂信息均可通过编码规则转换为 01 构成的二进制数据,并完整保留信息含义。

计算机以 字节(byte)为基本单位存储和处理各类信息,是存储、传输、计算的核心计量单位。

备注

一个字节可以存储 8 位(bit)二进制数,即:

1byte=8bit

数值、字符、模拟信号均可转换为二进制形式。

数值信息编码#

整数包含正数和负数,而二进制仅由 01 构成,因此约定字节最高位为符号位(0 表示正,1 表示负)。实数在计算机中通常以浮点数形式表示。

字符信息编码#

字符(包括汉字、英文等自然语言字符及控制字符)通过 统一码(Unicode)进行编码,建立字符与数字的一一映射关系。例如汉字 "权" 的Unicode编码为十进制数 26435(最终需转换为二进制形式存储)。

模拟信号编码#

在计算机中,将模拟信号(声音、图形、视频等,也被称为 连续信号)转换为二进制数的过程称为数字化处理。

采样

将连续的模拟信号(如声音、图像)转换为离散符号序列的过程。

具体操作是在固定时间间隔内,截取模拟信号的振幅值,并以定长二进制数表示该值。截取得到的振幅值即为采样值。

量化

将采样得到的连续振幅值近似为最接近的整数值的过程。

声音经采样和量化后输出数字序列;图像则根据像素点采样精度,可输出二值图(单比特/像素)、灰度图(单字节/像素)或彩色图(三字节/像素,分别表示红、绿、蓝通道)。

指令#

指示

为使设备或系统正常运行,需要提供的明确操作说明。

由于字符、数值、模拟信号均可转换为二进制形式,操作“指示”同样可转换为二进制数字,这种转换后的指示即为计算机可识别的“指令”。

小结#

可点击视频 如何数字化信息 深入了解相关原理。