VTA 教程# 这个页面包含关于 VTA 和如何使用 TVM/Relay 目标到 VTA 的教程。 VTA 入门 加载 VTA 参数 FPGA 编程 准备数据 计算声明 Input 占位符 Copy Buffers ALU 加法 Casting 结果 调度计算 默认调度 Buffer 作用域 DMA 传输 ALU 运算 TVM 计算 保存 Module 载入 Module 运行函数 验证 Correctness 获取 ALU 数据搬运情况 简单的矩阵乘法 RPC 设置 计算声明 数据布局 矩阵乘法 Casting 结果 调度计算 默认调度 Buffer 作用域 DMA 传输 张量化 TVM 计算 运行函数 验证正确性 编译深度学习模型 在 VTA 上从 MxNet 部署预训练的视觉模型 安装依赖 定义 platform 获取远程执行 构建 graph executor 推理 进行图像分类推理 执行推理并收集执行统计信息 在 VTA 上部署预训练的 Darknet 视觉检测模型 安装依赖 定义平台和模型目标 获取执行远程 构建推理 graph executor 执行图像检测推理 优化 Tensor 算子 分块矩阵乘法 RPC 设置 声明计算 调度计算 分块计算 lowering 复制到 DMA 传输 Lowering 计算到 VTA Compute Intrinsics TVM 计算和验证 小结 2D 卷积优化 RPC 设置 声明计算 调度计算 分块计算 重排轴 虚拟线程 Lowering Copies 到 DMA Transfers Lowering 计算到 VTA 计算 Intrinsics TVM 计算和验证 自动调优 自动调优 VTA 上的 ALU fused op 编译网络 设置调优选项 在 VTA 上调优卷积神经网络 安装依赖 编译神经网络 启动 RPC Tracker 注册设备到 RPC Tracker 设置调优选项 开始调优 样例输出