数字系统与信息表示#
从古至今,人类始终被“数”(number)包围,计数系统为文明发展提供了重要支撑。任意进制的
其中,
信息论创始人香农指出:通信的最基本消息单元是二值符号。现代计算机基于二进制数字系统,信息的最小度量单位是 比特(bit),以 0
或 1
表示两种状态。任何复杂信息均可通过编码规则转换为 0
和 1
构成的二进制数据,并完整保留信息含义。
计算机以 字节(byte)为基本单位存储和处理各类信息,是存储、传输、计算的核心计量单位。
备注
一个字节可以存储 8 位(bit)二进制数,即:
数值、字符、模拟信号均可转换为二进制形式。
数值信息编码#
整数包含正数和负数,而二进制仅由 0
和 1
构成,因此约定字节最高位为符号位(0
表示正,1
表示负)。实数在计算机中通常以浮点数形式表示。
字符信息编码#
字符(包括汉字、英文等自然语言字符及控制字符)通过 统一码(Unicode)进行编码,建立字符与数字的一一映射关系。例如汉字 "权" 的Unicode编码为十进制数 26435
(最终需转换为二进制形式存储)。
模拟信号编码#
在计算机中,将模拟信号(声音、图形、视频等,也被称为 连续信号)转换为二进制数的过程称为数字化处理。
- 采样
将连续的模拟信号(如声音、图像)转换为离散符号序列的过程。
具体操作是在固定时间间隔内,截取模拟信号的振幅值,并以定长二进制数表示该值。截取得到的振幅值即为采样值。
- 量化
将采样得到的连续振幅值近似为最接近的整数值的过程。
声音经采样和量化后输出数字序列;图像则根据像素点采样精度,可输出二值图(单比特/像素)、灰度图(单字节/像素)或彩色图(三字节/像素,分别表示红、绿、蓝通道)。
指令#
- 指示
为使设备或系统正常运行,需要提供的明确操作说明。
由于字符、数值、模拟信号均可转换为二进制形式,操作“指示”同样可转换为二进制数字,这种转换后的指示即为计算机可识别的“指令”。
小结#
可点击视频 如何数字化信息 深入了解相关原理。