跳转至

【数据增强】#

1.有监督的#

1.1 单样本的数据增强
单样本的数据增强主要是围绕一个样本图片,进行的”几何变换“、”颜色变换“等

  • 几何变换类: 旋转、翻转、剪裁、变形、缩放
  • 颜色变换类: 噪声、模糊、颜色变换、填充

实用tool https://github.com/aleju/imgaug

1.2 多样本数据增强
利用多个样本产生出新的样本
- SMOTE,人工合成新样本,解决类不平衡问题。映射到特征空间,在小样本的k近邻中构造新的样本点
- SamplePairing:主要用在医学图像上,从训练集中随机抽取两张图片,经过基础数据增强后将像素平均合并成一个新的样本。标签记为原样本标签中的一种。
- mixup: 使用线性插值,对于随机选取的两个数据,new = wXi + (1-w)Xj

2.无监督的#

2.1 学习数据的分布,随机生成新图片
- GAN

2.2 通过模型学习适合当前任务的数据增强方法
- AutoAugment
google 提出的自动选择最优数据增强方案的研究。其基本思路是:使用增强学习从数据本身寻找最佳的图像变换策略。具体来说就是用基础数据增强策略的组合。
- RandAugment: AutoAugment的进化版

参考#

https://www.zhihu.com/question/319291048