数据增强之 Cutout

数据增强之 Cutout#

备注

[DeVries and Taylor, 2017] 是由 Devansh Arpit、 Stanisław Jastrzębski、Nicolas Ballas、David Krueger、Emmanuel Bengio 和 Yoshua Bengio 于 2017 年发布的一篇研究论文。

这篇论文介绍了一种正则化技术，用于解决卷积神经网络（CNNs）中的过拟合问题。当 CNN 基于有限的数据集进行训练时，就容易出现过拟合的问题，导致网络仅仅是记忆了训练数据，而未能适应新的数据点。

这种正则化技术名为“Cutout”，它涉及到在训练期间随机选择输入图像的正方形区域，将其所有像素设置为零。这个过程在不同的训练示例中随机进行，有助于防止网络过度依赖于特定的特征或输入数据的部分。

该论文提供了实验结果，表明 Cutout 改进了 CNN 在多个图像分类数据集上的表现，包括 CIFAR-10、CIFAR-100 和 SVHN。Cutout 被证明可以显著减少过拟合，并提高 CNN 的泛化性能。作者还将 Cutout 与其他正则化技术（如 dropout）进行了比较，并表明 Cutout 在泛化性能方面优于它们。

总的来说，“使用 Cutout 改进卷积神经网络的正则化”提供了一种有力的正则化技术，可以帮助改善 CNN 的泛化性能。这种方法易于实现并可以轻松集成到现有的 CNN 架构中，因此是处理深度学习应用中的过拟合问题的一种有用技术。

Cutout 技术在很多方面都是可扩展的，因为它的思想是基于一个通用的原则。例如，类似于 Cutout 的技术，如 MixUp，DropBlock 和 DropPath，都是以类似的想法出现的，即在训练期间随机删除或修改输入。这些变体进一步拓展了 Cutout 的应用领域和功效，使其成为更加灵活和适用于更多深度学习应用的技术。

Cutout 使用固定大小的正方形区域，采用全 0 填充，而且允许正方形区域在图片外（由于这点，Cutout 非正方形区域都在边界处）。

正方形区域的边长固定；
正方形区域使用同一种像素值填充；
正方形随机出现在图片中，超出边界的部分被截断。

小技巧

正方形边长的设定，是否会覆盖图像主要信息；在尺度不一的实际业务场景中可能影响其效果，比如目标检测中将目标全部覆盖了。
使用 Cutout 前，先进行归一化，以降低像素填充的影响。