跳转至

一直在说机器学习,主要是在说怎么去学。在怎么学之前,首先需要了解下能不能学,学习的机制是什么

1.计算学习理论——是否可学习#

PAC(概率近似正确)#

https://blog.csdn.net/wangjianguobj/article/details/57413819

VC维度#

这个介绍的挺详细
http://www.flickering.cn/machine_learning/2015/04/vc%E7%BB%B4%E7%9A%84%E6%9D%A5%E9%BE%99%E5%8E%BB%E8%84%89/?from=singlemessage

参考#

台大-机器学习基石

6.模型设计准则#

  1. 模型拟合

(1) 无免费午餐定理 NFL

就是任何一个算法,针对所有问题,在平均意义上效果是一样的。

=> 所以要具体问题具体分析,针对不同问题,选择适合该问题的方法

(2)奥卡姆剃刀原则

即在预测效果差不多的情况下,模型越简单余越好

误差 = bias + varaince + noise

  • 过拟合
  • 欠拟合

7.模型验证#

1.估计泛化误差

训练集,验证集

2.对数据的重采样

  • 留出法
  • k折交叉验证
  • 自助法(有放回)

8.模型的评估指标#

9.实验设计#

设计实验是要要成的任务是对整个机器学习过程的优化。实验中因子的设计可能会包含很多,比如:算法的类别、算法的参数、数据集等。

当因子较多的时候,如何确定单一因子的影响就需要一些技巧
控制变量法

它暗含着一个较强的假设,就是不同因子之间相互独立,互不影响。然而这个并不总是成立的。

因子设计
他关注的是不同因子之间系统化的变化对学习效果的影响,他的一个特例就是**全因子实验**,也叫**完全交叉设计**。

在具体操作的时候,当分析的因子的离散取值较多时候,可以通过粗调+微调的方法。

在对因子进行精调时候,可以使用**响应面方法**(zzz:根据百科资料解释,就是做了一个二次函数的拟合)

正交抽样设计#

@@@补充下: