TVM 入门# TVM 环境配置 Vulkan 支持 TVM 官方教程 TVM 样例 构造或导入模型 执行优化转换 构建和通用部署 IRModule 创建 IRModule 从现有前端模型导入 使用 Relax NN 模块编写 通过 TVMScript 创建 IRModule的属性 IRModule 上的变换 通用部署IRModule 在 CPU 上部署 在 GPU 上部署 在其他后端上部署 TensorIR TensorIR 构建 使用 TVMScript 构建 TensorIR 标准格式 使用语法糖的简洁写法 与 Python 变量交互 具有动态形状的 TensorIR 函数 使用张量表达式创建TensorIR 创建静态形状函数 创建动态形状函数 元张量函数变换 初始化调度 循环平铺(Tiling) 利用局部性 重写约简 跟踪转换 Relax 端到端模型优化样例 准备阶段 整体流程概述 将模型转换为 IRModule IRModule 优化 构建和部署 自定义优化 可组合IRModule优化 准备 Relax 模块 库调度 调度过程之后 自动调优 DLight 规则 部署优化后的模型 总结 优化大语言模型 构建模型架构 将模型导出为 Relax IRModule 定义优化管道 准备模型权重 部署编译后的模型 标记化 创建KVCache 嵌入 Prefill 解码 交叉编译与RPC 在设备上构建 TVM 运行时 在设备上设置 RPC 服务器 在本地机器上声明和交叉编译内核 通过 RPC 远程运行CPU内核 通过 RPC 远程运行 OpenCL 内核 小结