在因果推断领域,几乎没有一种方法完全可靠,包括很多经典的统计学方法和科学实验方法为什么会这样?,我来为大家科普一下关于因果分析法有哪些?下面希望有你要的答案,我们一起来看看吧!
因果分析法有哪些
为什么统计学因果分析方法无法解决实际问题?在因果推断领域,几乎没有一种方法完全可靠,包括很多经典的统计学方法和科学实验方法。为什么会这样?
因为本质上,企业经营是个社会科学问题,不是自然科学问题。自然科学领域,是有一些物理、化学、数学等基础原理支撑的,这些原理是稳定、科学、可量化的,因此可以通过数据统计 科学实验,慢慢地发现背后的自然规律。社会科学问题完全不是这样!社会科学问题本身就是多因素共同影响,容易被人操控改变,感性且冲动的。因此在社会科学领域,很难直接套用自然科学的方法解决问题。
所以面对因果推断的时候,要认真区分问题场景。如果涉及:设计、生产、研发等客观性高一些的部门,可以用各种科学方法进行推断。
综上,我们可以得出结论:
1、关联关系不等于因果关系,对于因果关系的判断难度要更加复杂
2、因果分析很难有100%确定的结论,尤其是在社会问题、企业经营问题中,受到主观因素影响,不像自然科学具备稳定、可量化的原理,这种场景下的因果分析具备一定的主观性
3、传统的统计学分析方法,对于因果分析问题的探索仍存在很大的局限性。
关河因果对于“因果分析”有哪些意义?1、以往因果分析主要存在于统计学中,分析师一般用数学方法来解决问题,对分析师的要求极高。而关河因果分析系统降低了使用门槛,让更多数据分析师可以将因果分析作为工具。2、关河因果以图数据作为发现关联关系的基础,而图数据作为最能体现数据之间的关系的一种数据形式,能够保证数据间的关联关系得到准确、广泛的挖掘。
3、人工经验虽然可以总结部分关联关系,但是依然存在局限。首先人无法穷举全部的关系,在数量上已经存在缺失;其次人只能列举关系,无法给出量化指标,那么基于人脑做出的对根因的判断就会存在误差。
关河因果中的“因果分析”在关河因果中,因果分析主要依靠“规则发现”。在规则发现板块中,用户需要设置发现对象、发现方向、以及筛选规则的一系列参数,系统会自动从图数据中找到结构、关联性、频繁度满足设置要求的“规则”。这些规则就是系统挖掘的这份数据本身存在的关联关系,用户可以用“若……则……”形式的自然语言对规则进行解读,比如“若用户购买商品A,则用户购买商品B的可能性为XX%(置信度)”
如果用户只关注关联关系,那么到这一步,已经可以直接对规则进行应用。营销人员可以将这条规则应用于业务当中,给购买商品a的用户推荐商品b。
如果想深入探究“用户购买商品a”到底是不是“用户购买商品b”的原因,我们需要进一步判断。
我们假设刚刚那条规则的置信度为80%,提升度为1.5。这条规则的完整解读为“若用户购买商品A,则用户购买商品B的可能性为80%,且其概率是在数据中单独找到用户购买商品B事件概率的1.5倍”。
为了方便大家理解,我们将原因设为A,结果设为B。对应这条规则,A=用户购买商品a,Y=用户购买商品b。
不难发现,提升度的存在可以辅助验证A是否为B的原因。虽然A发生时,B很可能发生,但即使A不发生,B是不是也会发生?A对B的出现到底有没有影响,是正向影响还是负向影响?如果A对B有正向影响,但还有其他事件对B的正向影响更大,那么其他事件是否更有可能是B的原因?
通过以上问题,我们可以进一步想到:单条规则本身体现的主要是关联关系,想要得到因果关系的结论,需要将多条规则进行横向对比。
接下来我们来探究,如何在关河因果系统中,进行“归因”。
归因是以结果推原因的过程。在关河因果的“规则发现中”,“发现对象”配置的就是X,“发现方向”中配置的就是Y。
我们的目的是了解Y事件发生的原因是什么,需要在发现方向中配置实体点Y,在发现对象中不做配置(不对Y产生的原因做前置筛选)。运行这条任务,我们可以在发现结果中,得到一组规则。这组规则中Y是我们设置的确定事件,X是系统自动发现的与Y相关的事件。理论上来说,以提升度从高到低排序,得到的提升度最高的规则,就是从数据中客观存在的,对Y 出现的可能性正面影响最大的事件,我们初步认为它可能是Y事件发生的原因。但我们仍需考虑到,这条提升度最高的规则,可能存在以下问题:
Ⅰ具有一定的偶然性
Ⅱ违背行业的基本认知
Ⅲ X与Y只是关联关系
Ⅳ客观存在的事实
上文我们说到,事件的根因是无法下定论的,尤其是商业场景中,这个原因的判断需要客观和主观结合。客观上关河因果系统完成了挖掘关联关系的任务,作为分析师,依然需要结合自身经验或实验论证,做出符合业务需求的决策。
,