数据化运营09 抓住问题关键:用相关性分析拆解多个影响因素

前一讲,和你探讨了多维分析的方法,通过多维分析来寻找指标变化的原因 。当我们找到问题的原因时,自然会进一步思考一个问题:指标变化的原因这么多,决定问题的关键因素又是哪个呢?
需要专栏原数据进行实操的同学,可到“拉勾教育”公众号回复“数据化”,即可在百度云盘中获取本专栏的 21 组数据源 。
比如,我们在工作场景中时不时会经常讨论这些问题:
还有很多类似的场景不一一列举 。这些业务场景明显复杂很多,除了要能告知原因外,还需要明确出不同原因的重要性 。确实,我们知道影响活跃的因素有很多,可资源有限,不可能全面铺开逐一去解决,只能集中优势资源解决核心问题 。
那么如何从一大堆原因中找出最核心的原因呢?接下来,我将与你分享一个定量判断指标原因重要性和优先级的方法:相关性分析 。
什么是相关性分析?
相关性分析,指对两个或多个指标进行分析,评估它们两两之间联系或相互影响的程度 。相关性分析不仅可以分析出多个指标间的联系程度,还能给出联系程度紧密的量化值 。
例如,相关性分析能够分析出营销活动的投入成本和活动转化率的相关程度,不仅能够告诉我们投入成本越高,转化率越高的数据关系,还能告诉我们高到什么程度 。

数据化运营09 抓住问题关键:用相关性分析拆解多个影响因素

文章插图
相关性分析,使用“相关系数”这个指标定量给出几个指标间联系和影响的程度,通常用 p 来表示,我们用 p 值判断指标的相关性时遵循以下两个步骤 。
相关系数 p 是一个介于 -1~1 的小数 。
1.判断指标间是正相关、负相关,还是不相关
2.其次判断相关的程度
相关性分析的理论不复杂,我们看看在一些产品运营场景中是如何应用的 。
相关性应用场景有哪些?
事实上,相关性分析的应用场景非常多,基本上只要提到“它俩有什么关系?”“哪个指标的作用/贡献/价值更大?”“我们应该重点解决哪个问题?”时,都可以用相关性分析给出定量和准确的回答,非常便于产品运营找到解决问题的核心抓手 。
我将各类业务场景及其指标总结为下表,可供你需要时参考使用 。
数据化运营09 抓住问题关键:用相关性分析拆解多个影响因素

文章插图
接下来,我们通过三个案例进行“相关性分析”实战 。
产品运营场景实战案例 1.如何分析哪个客群的留存对整体留存贡献更大?
留存的运营中我们最常看的就是新客的留存和活跃客群的留存,用来评估哪个客群的留存与整体的留存联系更紧密,以便制定后续运营的策略 。
数据化运营09 抓住问题关键:用相关性分析拆解多个影响因素

文章插图
对于这样的报表,我们需要找出到底是哪个客群的留存对于整体留存的影响最大 。如果能找出来这个关系,那么后续要提升留存,就有非常清晰的方向 。
用相关性分析可以很好地回答这个问题,在 Excel 中点击“数据”选项卡,进入“数据分析”,找到“相关系数”,选择数据区域,点击确定即可,分析结果如下图所示 。
在Excel中的具体操作过程,会在本课时的最后讲解 。
数据化运营09 抓住问题关键:用相关性分析拆解多个影响因素

文章插图
上表就是相关性分析输出的相关系数表,其中显示了指标两两间的相关系数 。
可以看出,活跃访客的留存率与整体留存率的相关系数是 0.61,大于 0.5,故是强相关;而新增访客的留存率与整体留存率的相关系数只有 0.15,小于 0.5,故是弱相关 。