跳至正文

客户留存分析:LOD表达式、表计算的结合

注:本案例在《数据可视化分析(第二版):分析原理与Tableau、SQL实践》(2023.9)一书中。推荐阅读图书,了解更多内容 。

喜乐君

10.6.6 客户留存分析:LOD表达式、表计算的结合

问题6:不同客户矩阵(年季度),之后各季度的客户留存数量和比率

基于“首次订单日期”,还可以分析不同矩阵客户的多次复购情况,这里的复购通常划分为不同的时间阶段,比如每个月或者每个季度为阶段。之所以以“首次订单日期”作为客户群的分类标准,是为了确保数据样本的可比性

如图10-44所示,展示了不同季度的新客户(对应首次订单日期),在之后各个季度的留存比例。比如2018年Q4总共有100名新客户,在之后的各个季度中,客户到店越来越高,在之后第12个季度(也就是三年后),依然有40%的客户消费。横轴的INDEX()代表首次获客后的订单季度。

图10‑44 客户留存分析:使用FIXED LOD获客日期和INDEX坐标轴相对化处理[1]

这个问题需要综合使用FIXED LOD计算,INDEX和TOTAL表计算等多个函数,是考验问题理解和数据分析的绝佳案例。这个案例具有极大的扩展性,仅以笔者接触的项目为例:

如果把“客户”更改为“员工”,那么就会变成“不同时间段入职员工的业绩开单分析”;

如果改为“产品”,那么就会变成“不同上市时间产品的动销分析”;

如果改为医药销售的“医药终端”,那么就是“不同时间段开发终端的覆盖比率分析”。

理解了这个可视化分析,甚至有助于理解消费金融中不同账龄的“提前结清比率”(EPO%)等分析,因此笔者接下来重点介绍这个分析过程。以助于读者领会后触类旁通。

  1. 不同矩阵日期的客户之后的复购客户数

由于表计算是建立在视图聚合结果基础上的,数据分析初期,可以忽略所有表计算要素,比如合计、排序、同比等,而集中精力完成表计算所需要的聚合。

对于复购分析而言,主视图中包含的字段有:客户矩阵日期(年季度)、订单日期(年季度,以及客户数量。 把它们拖曳到视图中,先构建如图10-45的交叉表视图。这里的关键是,两个时间要保持尺度完全相同,笔者采用“年季度”为分类标准;同时强制改为离散显示。

图10‑45  不同年季度的新客户,在之后不同订单季度的复购客户数量

以2018年四季度为例,该季度总共100个新客户,第二个季度只有14个人复购,不过后续逐步提高,第4个季度时33人复购。

不过,由于不同时间的新客户对应的复购日期是错位的,上述交叉表就难以衡量对比。为此,能否以“获客季度”为基准,将后续第1、第2、第3……个季度的订单日期“对齐”呢?

本质上,这相当于把横轴的订单日期绝对坐标系,转化为相对坐标轴系。在第9章表计算9.4小节的“公共基准案例”中,就使用INDEX函数实现了这个过程,这里也是同理。

  • 增加表计算,绝对日期转相对日期,并计算获客总人数

在图10-45的基础上,在字段列上增加INDEX()表计算函数,并右键改为离散显示,“计算依据”改为“订单日期”;同时,把“订单日期”字段拖入标记中的“详细信息”——虽然它不直接显示在视图中,但却是表计算字段的计算依据,不可或缺。

同时,为了计算不同获客日期的总客户数,还需要增加更高聚合度级别的聚合,这里可以使用LOD表达式,也可以使用TOTAL合计函数,相比之后,表计算更简单。结果如图10-46所示。

图10‑46  不同年季度的新客户,在之后相对日期季度的复购客户数量

特别注意的是,虽然字段有连续和离散之分,视图中却是可以随时切换的,这里的合计客户数量TOTAL(COUNTD([客户名称]))就转化为离散,从而以交叉表的方式出现。

在这个基础上,近一步调整标记的可视化样式,就会构成开篇的实例图。

  • 时间趋势的优化调整

交叉表的优势是突出数据值,突出少数点;如果想要突出趋势的变化,折线图当然是最好的方法。在10-46视图的要素基础上,通过调整字段的位置,无需增加任何额外字段,就能转化为土10-47的多重折线图。

图10‑47  不同年季度的新客户,在之后相对日期季度的复购率变化

可见,留存率分析不仅在业务分析上非常典型,而且在计算逻辑上也异常缜密,是锻炼业务思维和技能水平不可多得的业务场景。也是本书中笔者最为喜欢的案例之一。


[1] 关于这个案例的详细讲解,参考“喜乐君博客”之《【时序+表计算】高级案例:顾客复购率矩阵分析》文章。

《客户留存分析:LOD表达式、表计算的结合》有1个想法

  1. Pingback: 【时序+表计算】高级案例:顾客复购率矩阵分析-喜乐君-敏捷BI布道师

评论已关闭。

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading