量化简介

量化简介#

模型量化是指将深度学习模型中的浮点参数和算子转换为定点表示,如 FLOAT32 转换为 INT8 等。量化能够降低内存占用,实现模型压缩和推理加速,但会造成一定程度的精度损失。

量化计算原理#

以线性非对称量化为例,浮点数量化为有符号定点数的计算原理如下: