PyTorch 教程#
- PyTorch 基础
- TorchScript
torch.compile()
torchvision
变换- 模型检查的特征提取
- 使用 NumPy 和 SciPy 创建扩展
- 无参数示例
- 参数化示例
- 临时教程
- 量化
torch.fx
- 中间表示
- A guide on good usage of
non_blocking
andpin_memory()
in PyTorch - Background
- A PyTorch perspective
non_blocking=True
- Synergies
- Other copy directions (GPU -> CPU, CPU -> MPS)
- Practical recommendations
- Additional considerations
- Conclusion
- Additional resources
- 模型剪枝
- 参数化教程
- 使用 FX 构建简单的 CPU 性能分析器
- 在pytorch中通道最后的内存格式
- Forward-mode 自动微分
- (beta) Building a Convolution/Batch Norm fuser in FX
- A guide on good usage of
- ONNX 接口
- Detectron2
- TorchMetrics
- DDP
- ExecuTorch
- ExecuTorch 简介
- ExecuTorch 概念
- 提前编译
- ATen
- ATen 方言
- ATen 模式
- Autograd 安全的 ATen 方言
- 后端
- 后端方言
- 后端注册表
- 后端特定算子
- Buck2
- CMake
- 代码生成
- 核心 ATen 方言
- 核心 ATen 算子 / 规范 ATen 算子集
- 核心 ATen 分解表
- 自定义算子
- DataLoader
- 委托
- DSP
- dtype
- 动态量化
- 动态形状
- Eager 模式
- Edge 方言
- 边缘算子
- ExecuTorch
- ExecuTorch 方法
- ExecuTorch 程序
- executor_runner
- EXIR
- ExportedProgram
- flatbuffer
- Framework tax
- Functional ATen operators
- Graph
- Graph mode
- 高阶算子
- Hybrid Quantization
- Intermediate Representation (IR)
- Kernel
- Kernel registry / Operator registry
- Lowering
- Memory planning
- Node
- Operator
- Operator fusion
- Out variant
- PAL
- 部分内核
- 分区器
- 便携式模式(精简模式)
- 便携式内核
- 程序
- 程序源代码
- PTQ(Post Training Quantization)
- QAT(Quantization Aware Training)
- 量化
- 运行时
- SDK(Software Development Kit)
- 选择性构建
- 静态量化
- XNNPACK
- ExecuTorch 工作原理
- ExecuTorch 技术架构
- 配置 ExecuTorch
- PyTorch 原生架构优化:
torchao
- 混沌
- Autograd 机制
- 自动微分
- PyTorch Benchmark
- Extending PyTorch
- 其他临时区
- PyTorch 参数管理
- 性能评估
- Pytorch 梯度归零