一直在说机器学习,主要是在说怎么去学。在怎么学之前,首先需要了解下能不能学,学习的机制是什么
1.计算学习理论——是否可学习#
PAC(概率近似正确)#
https://blog.csdn.net/wangjianguobj/article/details/57413819
VC维度#
参考#
台大-机器学习基石
6.模型设计准则#
- 模型拟合
(1) 无免费午餐定理 NFL
就是任何一个算法,针对所有问题,在平均意义上效果是一样的。
=> 所以要具体问题具体分析,针对不同问题,选择适合该问题的方法
(2)奥卡姆剃刀原则
即在预测效果差不多的情况下,模型越简单余越好
误差 = bias + varaince + noise
- 过拟合
- 欠拟合
7.模型验证#
1.估计泛化误差
训练集,验证集
2.对数据的重采样
- 留出法
- k折交叉验证
- 自助法(有放回)
8.模型的评估指标#
9.实验设计#
设计实验是要要成的任务是对整个机器学习过程的优化。实验中因子的设计可能会包含很多,比如:算法的类别、算法的参数、数据集等。
当因子较多的时候,如何确定单一因子的影响就需要一些技巧
控制变量法
它暗含着一个较强的假设,就是不同因子之间相互独立,互不影响。然而这个并不总是成立的。
因子设计
他关注的是不同因子之间系统化的变化对学习效果的影响,他的一个特例就是**全因子实验**,也叫**完全交叉设计**。
在具体操作的时候,当分析的因子的离散取值较多时候,可以通过粗调+微调的方法。
在对因子进行精调时候,可以使用**响应面方法**(zzz:根据百科资料解释,就是做了一个二次函数的拟合)
正交抽样设计#
@@@补充下: