【数据增强】#
1.有监督的#
1.1 单样本的数据增强
单样本的数据增强主要是围绕一个样本图片,进行的”几何变换“、”颜色变换“等
- 几何变换类: 旋转、翻转、剪裁、变形、缩放
- 颜色变换类: 噪声、模糊、颜色变换、填充
实用tool https://github.com/aleju/imgaug
1.2 多样本数据增强
利用多个样本产生出新的样本
- SMOTE,人工合成新样本,解决类不平衡问题。映射到特征空间,在小样本的k近邻中构造新的样本点
- SamplePairing:主要用在医学图像上,从训练集中随机抽取两张图片,经过基础数据增强后将像素平均合并成一个新的样本。标签记为原样本标签中的一种。
- mixup: 使用线性插值,对于随机选取的两个数据,new = wXi + (1-w)Xj
2.无监督的#
2.1 学习数据的分布,随机生成新图片
- GAN
2.2 通过模型学习适合当前任务的数据增强方法
- AutoAugment
google 提出的自动选择最优数据增强方案的研究。其基本思路是:使用增强学习从数据本身寻找最佳的图像变换策略。具体来说就是用基础数据增强策略的组合。
- RandAugment: AutoAugment的进化版