即插即用 | RandomMix 集百家之长实现超越Mixup的数据增强方法！ - 极术社区

数据增强是一种非常实用的技术，可以用来提高神经网络的泛化能力，防止过拟合。最近，混合样本数据增强受到了很多关注并取得了巨大的成功。为了提高混合样本数据增强的性能，最近的一系列工作致力于获取和分析图像的显著区域，并使用显著区域来指导图像混合。然而，获取图像的显著信息需要大量额外的计算。
与通过显著性分析提高性能不同，提出的方法RandomMix主要增加混合样本的多样性，以增强神经网络的泛化能力和性能。而且，RandomMix可以提高模型的鲁棒性，不需要太多额外的计算，很容易插入到训练管道中。最后在CIFAR-10/100、Tiny-ImageNet、ImageNet和Google Speech Commands上进行实验数据集表明RandomMix的性能优于其他最先进的混合样本数据增强方法。

1简介

深度神经网络成功的重要原因之一是它具有海量的可学习参数。但是，可以从Vapnik-Chervonenkis(VC)理论推断，当训练数据有限或不足时，更多可学习的参数更容易过拟合训练数据。此外，模型对训练数据分布之外的数据的泛化能力极其有限。为了提高神经网络的泛化能力，防止过拟合，数据增强是一种非常实用的技术。

最近，一系列混合样本数据增强方法被提出并广泛应用于深度神经网络的训练。与传统的数据增强只考虑同一类样本的邻近性不同，混合样本数据增强考虑了不同类样本之间的邻近关系。

Mixup 是混合样本数据增强的开创性工作，它使用线性插值来混合训练样本。CutMix通过将一张图像的patch粘贴到另一张图像上而不是插值来使混合样本多样化。为了提高混合样本数据增强的性能，一些最新的作品如SaliencyMix、Puzzle Mix和Co-Mixup都专注于图像显著性分析。然而，获取图像的显著信息需要大量的额外计算。

与通过显著性分析提高性能的方法不同，本文的方法考虑通过增加混合样本的多样性来提高神经网络的性能。在前人工作的基础上提出了RandomMix，它使混合样本更加多样化，具有更好的性能。此外，RandomMix使模型更加稳健和方便使用。

作者评估了提出的方法在CIFAR-10/100、Tiny-ImageNet、ImageNet和Google Speech Commands数据集上的性能。实验表明，RandomMix比其他最先进的混合样本数据增强方法具有更好的性能。除了泛化性能实验外，鲁棒性实验表明，在训练期间使用RandomMix可以同时提高模型对对抗性噪声、自然噪声和样本遮挡的稳健性。