因果分析法有哪些（关河因果中的因果分析）

在因果推断领域，几乎没有一种方法完全可靠，包括很多经典的统计学方法和科学实验方法为什么会这样？，我来为大家科普一下关于因果分析法有哪些?下面希望有你要的答案，我们一起来看看吧!

因果分析法有哪些

为什么统计学因果分析方法无法解决实际问题？

在因果推断领域，几乎没有一种方法完全可靠，包括很多经典的统计学方法和科学实验方法。为什么会这样？

因为本质上，企业经营是个社会科学问题，不是自然科学问题。自然科学领域，是有一些物理、化学、数学等基础原理支撑的，这些原理是稳定、科学、可量化的，因此可以通过数据统计科学实验，慢慢地发现背后的自然规律。社会科学问题完全不是这样！社会科学问题本身就是多因素共同影响，容易被人操控改变，感性且冲动的。因此在社会科学领域，很难直接套用自然科学的方法解决问题。

所以面对因果推断的时候，要认真区分问题场景。如果涉及：设计、生产、研发等客观性高一些的部门，可以用各种科学方法进行推断。

综上，我们可以得出结论：

1、关联关系不等于因果关系，对于因果关系的判断难度要更加复杂

2、因果分析很难有100%确定的结论，尤其是在社会问题、企业经营问题中，受到主观因素影响，不像自然科学具备稳定、可量化的原理，这种场景下的因果分析具备一定的主观性

3、传统的统计学分析方法，对于因果分析问题的探索仍存在很大的局限性。

关河因果对于“因果分析”有哪些意义？

1、以往因果分析主要存在于统计学中，分析师一般用数学方法来解决问题，对分析师的要求极高。而关河因果分析系统降低了使用门槛，让更多数据分析师可以将因果分析作为工具。2、关河因果以图数据作为发现关联关系的基础，而图数据作为最能体现数据之间的关系的一种数据形式，能够保证数据间的关联关系得到准确、广泛的挖掘。

3、人工经验虽然可以总结部分关联关系，但是依然存在局限。首先人无法穷举全部的关系，在数量上已经存在缺失；其次人只能列举关系，无法给出量化指标，那么基于人脑做出的对根因的判断就会存在误差。

关河因果中的“因果分析”

在关河因果中，因果分析主要依靠“规则发现”。在规则发现板块中，用户需要设置发现对象、发现方向、以及筛选规则的一系列参数，系统会自动从图数据中找到结构、关联性、频繁度满足设置要求的“规则”。这些规则就是系统挖掘的这份数据本身存在的关联关系，用户可以用“若……则……”形式的自然语言对规则进行解读，比如“若用户购买商品A，则用户购买商品B的可能性为XX%（置信度）”

如果用户只关注关联关系，那么到这一步，已经可以直接对规则进行应用。营销人员可以将这条规则应用于业务当中，给购买商品a的用户推荐商品b。

如果想深入探究“用户购买商品a”到底是不是“用户购买商品b”的原因，我们需要进一步判断。

我们假设刚刚那条规则的置信度为80%，提升度为1.5。这条规则的完整解读为“若用户购买商品A，则用户购买商品B的可能性为80%，且其概率是在数据中单独找到用户购买商品B事件概率的1.5倍”。

为了方便大家理解，我们将原因设为A，结果设为B。对应这条规则，A=用户购买商品a，Y=用户购买商品b。

不难发现，提升度的存在可以辅助验证A是否为B的原因。虽然A发生时，B很可能发生，但即使A不发生，B是不是也会发生？A对B的出现到底有没有影响，是正向影响还是负向影响？如果A对B有正向影响，但还有其他事件对B的正向影响更大，那么其他事件是否更有可能是B的原因？

通过以上问题，我们可以进一步想到：单条规则本身体现的主要是关联关系，想要得到因果关系的结论，需要将多条规则进行横向对比。

接下来我们来探究，如何在关河因果系统中，进行“归因”。

归因是以结果推原因的过程。在关河因果的“规则发现中”，“发现对象”配置的就是X，“发现方向”中配置的就是Y。

我们的目的是了解Y事件发生的原因是什么，需要在发现方向中配置实体点Y，在发现对象中不做配置（不对Y产生的原因做前置筛选）。运行这条任务，我们可以在发现结果中，得到一组规则。这组规则中Y是我们设置的确定事件，X是系统自动发现的与Y相关的事件。理论上来说，以提升度从高到低排序，得到的提升度最高的规则，就是从数据中客观存在的，对Y 出现的可能性正面影响最大的事件，我们初步认为它可能是Y事件发生的原因。但我们仍需考虑到，这条提升度最高的规则，可能存在以下问题：

Ⅰ具有一定的偶然性

Ⅱ违背行业的基本认知

Ⅲ X与Y只是关联关系

Ⅳ客观存在的事实

上文我们说到，事件的根因是无法下定论的，尤其是商业场景中，这个原因的判断需要客观和主观结合。客观上关河因果系统完成了挖掘关联关系的任务，作为分析师，依然需要结合自身经验或实验论证，做出符合业务需求的决策。

因果分析法有哪些（关河因果中的因果分析）

最新推荐

热门推荐