结构化数据# 对结构化数据进行分类 数据集 导入 TensorFlow 和其他库 使用 Pandas 创建一个 dataframe 创建目标变量 将 dataframe 拆分为训练、验证和测试集 用 tf.data 创建输入流水线 理解输入流水线 演示几种特征列 数值列 分桶列 分类列 嵌入列 经过哈希处理的特征列 组合的特征列 选择要使用的列 建立一个新的特征层 创建,编译和训练模型 后续步骤 不平衡数据的分类 设置 数据处理与浏览 下载 Kaggle Credit Card Fraud 数据集 检查类标签的不平衡 清理、拆分和归一化数据 查看数据分布 定义模型和指标 了解有用的指标 基线模型 构建模型 可选:设置正确的初始偏差。 为初始权重设置检查点 确认偏差修正有帮助 训练模型 查看训练历史记录 评估指标 绘制 ROC 绘制 AUPRC 类权重 计算类权重 使用类权重训练模型 查看训练历史记录 评估指标 绘制 ROC 绘制 AUPRC 过采样 对占少数的类进行过采样 使用 NumPy 使用 tf.data 在过采样数据上进行训练 查看训练历史记录 重新训练 重新查看训练历史记录 评估指标 绘制 ROC 绘制 AUPRC 使用本教程解决您的问题 使用 Keras 预处理层对结构化数据进行分类 PetFinder.my mini 数据集 导入TensorFlow和其他库 加载数据集并将其读入 pandas DataFrame 创建目标变量 将 DataFrame 拆分为训练集、验证集和测试集 使用 tf.data 创建输入流水线 应用 Keras 预处理层 数值列 分类列 预处理所选特征以训练模型 创建、编译并训练模型 执行推断 后续步骤 时间序列预测 安装 天气数据集 检查和清理 风速 特征工程 风 时间 拆分数据 归一化数据 数据窗口化 1. 索引和偏移量 2. 拆分 3. 绘图 4. 创建 tf.data.Dataset 单步模型 基线 线性模型 密集 多步密集 卷积神经网络 循环神经网络 性能 多输出模型 基线 密集 RNN 高级:残差连接 性能 多步模型 基线 单次模型 线性 密集 CNN RNN 高级:自回归模型 RNN 性能 后续步骤