因果挖掘：大模型时代还需要因果挖掘么？从入门到放弃

type

status

date

slug

summary

我的学习历程：

我的学习始于关键术语： - 因果关系vs相关性 - 因果发现方法 - 推断框架 - DoWhy等工具

我发现了Judea Pearl的《为什么之书》- 这是因果推理的罗塞塔石碑。这部杰作解释了： - 因果阶梯（观察vs行动vs想象） - 反事实思维 - 贝叶斯网络在因果分析中的作用

这本书帮助我理解： 1. do-演算基础 2. 结构因果模型 3. 中介vs混杂 4. Pearl的”因果革命”框架

这些实践者给了我重要的现实检验： - Matheus Facure（构建了Python因果推断生态系统） - Aleksander Molak（因果AI架构的先驱） - 郭（数据专家） - 李博士（上海因果AI小组负责人）

我关注的重要研究者： - 微软的因果前沿团队： - Chang Zhang（企业因果应用） - Greg Lewis（计量经济学因果模型） - Amit Sharma（推荐系统因果关系）

企业投资： - 微软的端到端因果堆栈 - 华为的年度PCIC挑战（太平洋因果推断会议）

初创创新者： 1. CausalLens（英国）- 企业决策引擎 2. ExplainData（德国）- 自动化因果报告 3. Geminus（美国）- 物理信息数字孪生

在调查了人和公司之后，我开始研究这些方法/框架/工具。

关键算法： - PC（基于约束的发现） - GES（基于分数的结构学习） - LiNGAM（非高斯定向） - Notears（令人难忘的名字，被作者放弃） - GOLEM（以准确性为重点的优化） - DECI（神经因果发现）

实用框架： - DoWhy（Python因果图分析） - EconML（微软的异质性效应）

总的来说，我感受到了工具的巨大多样性以及人们使用它们的不同方式（不像现在每个人都使用pytorch）。有些人甚至告诉我他们从不使用这些框架，而是自己编写所有方法。

同时，我在寻找使用这些工具的正确方法时感到沮丧。几乎所有的教程都已过时，如果出现bug，我几乎找不到任何答案。

最后，当我在一些随机数据集上运行算法时，我看到了极低的性能（对于只有几千条记录的数据，一些方法在M1 Mac上运行了几个小时）。

就像通过Kaggle掌握机器学习基础一样，当我参加华为的PCIC挑战赛时，因果发现对我来说变得清晰起来。比赛的工业制造重点与我日常工作中的挑战相匹配。

我通过以下方式攻克它： 1. 逆向工程往年获胜解决方案 2. 从头实现条件独立性测试 3. 将NOTEARS与传统PC算法进行基准测试 4. 可视化设备故障数据中的混杂路径

实践中的试错暴露了我对碰撞偏差和最优传输理论理解的不足。凌晨3点醒来查看排行榜更新成为一种仪式。当我的混合方法进入前15%时，我终于理解了因果假设如何影响现实世界模型的性能。

经过长时间的学习，我最初过高的期望使得随后阅读Judea Pearl的《为什么之书》时的失望更加深刻。虽然因果关系的基本概念仍然很出色，但缺乏完整的理论和工具/框架阻止了它变得有意义。它就像一个3岁的婴儿，没有长大。

考虑到AI研究转向LLM，它也不会成长。

对于任何理论，都需要大学-巨头-初创公司多年的工作和合作。这就像一个婴儿的成长。它需要父亲、母亲、老师等等才能成熟。

随着LLM变得越来越容易获取，“人们如何学习”将变得与人们想象的完全不同。我们的孩子还会学习编程吗？他们还会学习历史吗？当学习和参加AI能做得更好的考试时，他们会感到无意义吗？