操练场# 教程(chaos) TVM 基础 TVM 准备 安装运行环境 便捷安装 关于 tvm_book 库 安装的 FAQs 自动调优 查看模型 其他 TVM 入门 Relay 神经网络推理 获得预训练模型 数据预处理示例 编译预训练模型 推理 保存已编译的库 张量程序抽象 TensorIR 变换 构建与运行 TE (Tensor Expression) 实现矩阵乘法 用 TE 实现原始程序 端到端模型执行 准备数据集 端到端模型整合 使用 TVMScript 实现算子 & MLP 模型 3. 注册 pytorch 算子并使用 注册 pytorch 算子 混合使用算子 将参数绑定到 IRModule 与机器学习框架的整合 通过 Builder 构造 IRModule 从张量表达式构造 TensorIR 张量表达式 张量形状符号 不定形状的张量算子 测试一致性 矩阵运算 矩阵转置 逐位相加 广播加法 矩阵乘法 张量形状 重构形状 切片 条件表达式 填充运算 简单示例 通用 2D 填充 张量内积 矩阵乘法分块 三维张量内积 四维张量内积 2D 卷积 使用 TOPI 构建卷积 量化(chaos) 分析 TVM 自动量化结果 部分量化 TVM 自动量化过程剖析 PyTorch 模型翻译为 relay 模型 resnet18 算子融合 注解 resnet18 模型 测试自动量化 乘法算子的右操作数不是常量 跳过卷积 stop_quantize batch_flatten batch_matmul calibration_dataset fake-quantization-to-integer canonicalizations Relay 手册 快速了解 Relay Relay 变量 局部变量 Relay 函数 Relay 模块 GraphExecutorCodegen TVM Graph JSON 简介 解读 GraphExecutorCodegen 以双头网络作为引子 解读 CreateGraphCodegenMod 源码 代码生成器 GraphExecutorCodegen 回到双头网络的例子中 回调 Relay 全局变量 Relay 常量 Relay 元组 Relay 条件表达 Relay let 绑定 合并复合 Relay 算子 TVM Relay 构建模块 tvm.relay.create_executor 注解区域 菱形区域 区域合并 合并编译器区域 菱形计算图 if-else 测试 合并计算图示例 注解目标设备 注解 DNNL 注解多后端设备 read & write tuple composite_function double_target different_target multiple_runs ends_with_tuple 注解目标-其他 VTA 教程(chaos) VTA 配置 VTA 多环境管理 VTA 指令集 VTA 运行时数组 VTA save/store 输出命令 VTA padded load VTA GEMM VTA ALU RELU on ALU shift and scale on ALU VTA 算子 通用矩阵乘法(VTA) VTA topi.dense VTA topi.conv2d VTA conv2d_transpose VTA group-conv2d 自定义 VTA Graph Pack VTA 模型样例 VTA Graph Pack VTA 模型的算子融合 VTA resnet18 Relax 手册 nn.module MLP Relax 模型 翻译 Relay 程序为 Relax 数据集 ImageNet 接口 ImageNet 标签信息 ImageNet 图像信息 测试 ImageNet 分类精度 专题(chaos) 数值表示 十进制定点和浮点运算 定点数 如何在应用中保持有效位不变? 规范化输出 定点数表示法 定点数实例 浮点数表示法 实用接口 Numpy 实用接口 np.partition 分区函数 对抗攻击 对抗性示例生成 输入 受到攻击的模型 FGSM 攻击 测试函数 运行攻击 结果 论文 论文综述集 图像去噪综述 深度学习在图像去噪中的应用综述 引言 图像去噪深度学习方法的基本框架 图像去噪的机器学习方法 图像去噪中的深度学习技术 加性白噪声图像去噪 讨论 降噪简介 基于滤波器的方法 基于模型的方法 基于学习的方法 其他论文 目标设备 OneDNN 测试 测试 FoldScaleAxis 简单的前向折叠 双路径前向折叠 前向折叠失败 前向折叠 ReLU 失败 前向折叠 Let 失败 前向折叠负缩放的测试用例 前向折叠 dense 的测试用例 简单的后向折叠 双路径后向折叠 简单后向常量折叠 简单后向双消费者 双路径后向折叠失败 后向折叠 ReLU 失败 后向折叠负缩放的测试用例 后向折叠 dense 的测试用例 前向折叠 conv3d 的测试用例 后向折叠 conv3d 的测试用例 后向折叠 bias_add 的测试用例 mobilenetv3 bn+dense+dn 融合 mobilenetv3 测试 YOLO 系列 目标检测输出层 构建 PyTorch 人脸检测模型 导出 ONNX 模型 前端导入 三种版本的 DFL 注册算子 vta_special.yolo_dfl YOLO 输出 Setup 1. Predict 2. Val 3. Train 4. Export 5. Python Usage 6. Tasks 1. Detection 2. Segmentation 3. Classification 4. Pose 4. Oriented Bounding Boxes (OBB) Appendix