因果分析#

首先关于因果分析，并没有一个明确的定义。哲学中对因果关系的讨论，将其划分成了如下两类
- Type causality：关注某个原因会导致什么结果，比如吸烟是否会导致肺癌？由因推果
- Actual causality: 关注某个结果发生的具体原因是什么。比如恐龙灭亡的原因是六千万年的小行星撞地球导致的吗？由果推因

1.统计领域的因果推断#

场景: 在现实世界中我们会有大量的数据，我们希望从若干变量的一堆数据中提取出他们之间的因果关系，这时候要做的事情就是因果推断.

Pearl在《为什么》中指出因果关系之梯。
1. 关联
2. 干预
3. 反事实

统计模型只有关联层的信息，所以只能回答相关性问题，而不能回答干预问题和反事实问题。基于图的因果贝叶斯网络只有干预层的信息，所以只能回答干预和关联层的问题，而不能回答反事实问题。最后基于结构的因果模型，它的能力最接近物理模型，用函数关系表示原因和结果之间的关系，三个层级的问题都能够回答。

当下的因果建模主要有两个框架
(1) Potential Outcome Framework ——实验主义因果

设想一种与观测数据相悖的情况，比如对比用药与不用药的结果，因此也被成为experimental causality。

经常会碰到的一个辛普森悖论的问题：比如如下这么个数据

比较两种疗法对于肾结石手术的效果，无论是对于小结石病例，还是对于大结石病例。都发现A比B好(纯治愈率上)。但是整体总计下来，A却比B的效果差。
最终发现是因为这两个组的实验病例选择有问题，都不具备代表性。因为医生认为病情重的适合A，病情轻的适合B。所以会看到A中大结石病例多，B中小结石病例多。即两组中样本并没有随机分配。
换句话说，这个背后的实际情况是：
-w249
所以严格意义上的实验，应该切断病情与疗法的选择。两边病情的分布是一致的

Pearl提出的Do-calculus方法计算x对Y的影响如下:

(2) Judea Pearl 的结构因果模型(SCM)

SCM包括三个部分: 图模型、结构方程、反事实和干预逻辑。

2.casual AI#

当前有很多最优秀的科学家在朝着这个方向努力，其中三个代表性研究工作者是:

UCLA 教授 Judea Pearl
马普智能所所长 Bernhard Schölkopf，《CAUSALITY FOR MACHINE LEARNING》综述，2017
Mila 所长 Yoshua Bengio。https://yoshuabengio.org/research/

简单来说 Judea Pearl 是 Causal AI 的奠基人，Bernhard Schölkopf 等人推进了 Causality for Machine Learning，Yoshua Bengio 最近提出了 System 2 deep learning 作为 Causal AI 的一个范式。