项目简介
教程
量化
生态系统
参考文献
其他
API
GitHub
量化支持
量化菜谱
量化张量
快速上手
基础
Pytorch 数值套件教程
学习
概述
迁移学习
计算机视觉分类
量化计算机视觉分类
自定义
测试
TVM
高级教程
自定义量化
通用量化模型
QAT
特定于 cifar10 的量化(待更)
QAT(resnet18)
测试 QAT
回收站
论文
A Survey of Quantization Methods for Efficient Neural Network Inference
量化 API
runner
runner.Timer
runner.Accumulator
runner.Animator
runner.show_images
xinet
xinet.ModuleTool
xinet.CV
xinet.Fx
xinet.try_all_gpus
xinet.try_gpu
NN 模块
mobile_net.MobileNetV2
辅助工具
helper.accuracy
helper.evaluate
helper.load_model
helper.print_size_of_model
helper.AverageMeter
工具
tools.train_model
Edit this page
快速上手
#
基础
映射函数
量化参数
校准
仿射和对称量化方案
逐张量和逐通道量化方案
后端引擎
QConfig
在 PyTorch 中
Post-Training Dynamic/Weight-only Quantization
Post-Training Static Quantization (PTQ)
Quantization-aware Training (QAT)
敏感性分析
对您工作流程的建议
Pytorch 数值套件教程
数值套件之静态量化
1. 比较浮点模型和量化模型的权重
2. 比较浮点和量化模型在相应的位置
3. 使用相同的输入数据,将量化模型中的模块与等效的浮点模块进行比较
Numeric Suite 之动态量化
设置
1. Compare the weights of float and quantized models
2. Compare float point and quantized models at corresponding locations
3. Compare a module in a quantized model with its float point equivalent, with the same input data
结论
上一页
量化张量
下一页
基础