如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,
欢迎移步宝藏公众号「小火龙说数据」,无广告、无软文、纯干货,更多精彩原创文章与你分享!
01 相关性分析是什么
相关性分析用于度量两个或多个变量之间的相似程度,并通过其关系探索其业务价值。这里要注意一下,相关性≠因果性,业务往往通过「相关性」探索问题,并通过「因果性」验证问题,『因果分析方法』可以戳蓝字部分。
02 相关性计算方式有哪些?相关性度量方式有很多,列出小火龙常用的两种,分别为「相关系数法」以及「信息增益/信息熵法」。具体方法及说明如下图:
其中,「连续性变量」常用pearson相关系数,「离散型变量」常用随机森林特征贡献度。
03 相关性分析实战场景业务上度量A与B的相关性,往往A是业务目标变量,而B是可能影响目标变量的因子,探索哪些因子B对目标A起到作用。听起来可能有点虚,举个例子:
业务希望提升用户留存,哪些关键事件对留存有正向影响?
这个命题,就是为了探索用户增长里提到的「Aha Moment」,挖掘哪些关键事件对留存可能有正向影响。具体分析实施步骤如下:
步骤一:收集可能对用户产生影响的关键事件。需要注意:关键事件触发量级不宜过小。
步骤二:通过相关性,度量「关键事件是否触发」与「用户留存」之间的关系,此处采用「随机森林特征贡献度方式」,如下图,探索发现「登录行为、购买行为、互动行为」贡献度较大,可能对用户留存产生影响。
步骤三:根据探索的三个方向,设计能够将用户引导至关键行为的业务改动,并通过AB实验加以验证。(因果验证)
步骤四:通过AB实验评估大盘北极星指标及期望提升指标的改进情况,如满足预期,则表示该产品改动对业务有正向影响。
以上就是一个功能相关性分析在业务中的实战应用案例。
最后,近些年,小火龙沉淀了不少数据分析方法论,现汇总为《数据分析方法论图谱》知识沉淀售卖,有需要的同学可以戳上方链接查看哦!!!
以上就是本期的内容分享
如果你也对数据分析感兴趣,那就来关注我吧,更多「原创」文章,与你分享!!
小火龙说数据
,