torchvision 变换# torchvision.transforms.v2 检测、分割、视频 什么是 TVTensors? 需要传递什么作为输入? 变换和数据集的兼容性 使用内置数据集 使用您的自定义数据集 变换技巧 性能考虑 变换类、函数和内核 Torchscript 支持 变换示例说明 几何变换 填充 调整大小 CenterCrop FiveCrop 随机透视变换 随机旋转 随机仿射 弹性变换 随机裁剪 随机调整大小裁剪 光度变换 Grayscale(灰度) ColorJitter 高斯模糊 随机反转颜色 随机海报化 随机曝光 随机调整锐度 随机自动对比度 随机均衡化 JPEG 增强变换 自动增强 RandAugment TrivialAugmentWide AugMix 随机应用变换 随机水平翻转 随机垂直翻转 随机应用 变换 v2:端到端的目标检测/分割示例 数据集准备 变换 数据加载和训练循环 训练参考 如何使用 CutMix 和 MixUp 预处理流程 MixUp和CutMix的应用场景 在DataLoader之后使用MixUp和CutMix 作为集合函数的一部分 非标准输入格式 如何定制 v2 转换器 只需创建 torch.nn.Module 并重写 forward 方法 支持任意输入结构 TVTensors 常见问题解答 TVTensors 是什么? 使用 TVTensor 做什么? 如何构建 TVTensor? 使用构造函数 有一个 TVTensor,但现在得到了 Tensor。怎么办! 但我想要 TVTensor! 为什么会发生这种情况? 例外情况 如何定制 TVTensor 类 参数转发和确保你的内核的未来兼容性 光流:使用 RAFT 模型预测运动 使用 Torchvision 读取视频 使用 RAFT 估计光流 可视化预测的流动 额外奖励:创建预测流量的 GIF 将掩码重新用于边界框 掩码 将掩码转换为边界框 将分割数据集转换为检测数据集 Torchscript 支持 视频 API 介绍:构建新的视频对象并检查其属性 构建示例 read_video 函数 3. 构建示例随机采样数据集(可应用于 kinetics400 的训练数据集) 数据可视化 可视化工具 可视化图像网格 可视化边界框 可视化分割掩码 语义分割模型 实例分割模型 可视化关键点 绘制带可见性的关键点