【数据增强】#

1.有监督的#

1.1 单样本的数据增强
单样本的数据增强主要是围绕一个样本图片，进行的”几何变换“、”颜色变换“等

几何变换类：旋转、翻转、剪裁、变形、缩放
颜色变换类：噪声、模糊、颜色变换、填充

实用tool https://github.com/aleju/imgaug

1.2 多样本数据增强
利用多个样本产生出新的样本
- SMOTE，人工合成新样本，解决类不平衡问题。映射到特征空间，在小样本的k近邻中构造新的样本点
- SamplePairing：主要用在医学图像上，从训练集中随机抽取两张图片，经过基础数据增强后将像素平均合并成一个新的样本。标签记为原样本标签中的一种。
- mixup: 使用线性插值，对于随机选取的两个数据，new = wXi + (1-w)Xj

2.无监督的#

2.1 学习数据的分布，随机生成新图片
- GAN

2.2 通过模型学习适合当前任务的数据增强方法
- AutoAugment
google 提出的自动选择最优数据增强方案的研究。其基本思路是:使用增强学习从数据本身寻找最佳的图像变换策略。具体来说就是用基础数据增强策略的组合。
- RandAugment: AutoAugment的进化版

参考#

https://www.zhihu.com/question/319291048