训练# 损失函数 L1 损失 MSE 损失 交叉熵损失 分类交叉熵损失 AppendLoss 简单测试 测试多主干 测试附加参数 optimizer 测试优化器错误 SGD MomentumSGD Adam 测试优化器 测试 SGD 优化器 SetupTrainer 测试简单模型 测试状态 数值训练器 测试主干网络 测试数值一致性 加载导出的参数 测试设置错误 使用 Relax 训练 API 训练模型 准备工作 模型定义 方法一:使用训练器 API 训练器结构 训练流程 为什么需要区分 Trainer 和 SetupTrainer? 方法二:使用底层训练 API 损失函数 梯度计算过程 优化器 训练流程