加载和预处理数据# 加载 CSV 数据 安装 内存数据 基本预处理 混合数据类型 使用 tf.data 有关内存数据 从单个文件 缓存 多个文件 可选:打包字段 低级函数 tf.io.decode_csv tf.data.experimental.CsvDataset 多个文件 性能 加载和预处理图像 配置 检索图片 使用 Keras 效用函数加载数据 创建数据集 呈现数据 标准化数据 配置数据集以提高性能 训练模型 使用 tf.data 进行更精细的控制 训练的基本方法 呈现数据 继续训练模型 使用 TensorFlow Datasets 后续步骤 使用 tf.data 加载 NumPy 数据 安装 从 .npz 文件中加载 使用 tf.data.Dataset 加载 NumPy 数组 使用该数据集 打乱和批次化数据集 建立和训练模型 加载 pandas DataFrame 使用 pandas 读取数据 创建并训练模型 使用 Model.fit 使用 tf.data DataFrame 作为字典 接受字典的 Keras 1. 模型-子类样式 2. Keras 函数式样式 完整样本 构建预处理头文件 二元输入 数值输入 分类特征 组装预处理头文件 创建和训练模型 加载文本 示例 1:预测 Stack Overflow 问题的标签 下载并探索数据集 加载数据集 准备用于训练的数据集 配置数据集以提高性能 训练模型。 导出模型 在新数据上运行推断 例 2:预测《伊利亚特》翻译的作者 下载并探索数据集 加载数据集 准备用于训练的数据集 将数据集拆分为训练集和测试集 训练模型 导出模型 在新数据上运行推断 使用 TensorFlow Datasets (TFDS) 下载更多数据集 准备用于训练的数据集 创建、配置和训练模型 导出模型 结论 TFRecord 和 tf.Example 设置 tf.train.Example tf.Example 的数据类型 创建 tf.Example 消息 TFRecords 格式详细信息 使用 tf.data 的 TFRecord 文件 写入 TFRecord 文件 读取 TFRecord 文件 Python 中的 TFRecord 文件 写入 TFRecord 文件 读取 TFRecord 文件 演练:读取和写入图像数据 提取图像 写入 TFRecord 文件 读取 TFRecord 文件 Unicode 字符串 简介 tf.string 数据类型 表示 Unicode 在不同表示之间进行转换 批次维度 Unicode 运算 字符长度 字符子字符串 拆分 Unicode 字符串 字符的字节偏移量 Unicode 字符体系 示例:简单分词 加载视频数据 安装 下载 UCF101 数据集的子集 从每个视频文件创建帧 呈现视频数据 配置数据集以提高性能 后续步骤