跳至正文

业务01:金融业务中的Tableau分析框架

在服务客户过程中,我特别喜欢零售和金融的场景。零售是自己早期的业务,当年还没有成熟的框架思维,也没有Tableau加持,所以走了不少弯路。如今,我把自己当作小学生,做金融的大海中一边遨游,一边思考,希望积累一些通用的、普适性知识,提供给后来的分析师借鉴使用。

近期思考有两个成果,其一是「业务-数据-分析」的三层结构,其二是建立在这个三层结构和第三字段分类基础上的数据准备浅见。这里借助于金融场景简要介绍,只有续篇会选择最难的“风控分析”场景逐次展开。

一、金融中的「业务-数据-分析」结构

任何数据表都是对业务的记录和反映,更高级的说,数据是业务的抽象表达。而分析则是希望借助规范化的数据发现规律、找到改进方向、指导决策,可以认为是进一步知识总结、提炼的过程。

1

如图所示,从时间和对象的角度看,常见的金融业务可以理解为“贷前——贷中——贷后”的三个环节,分别对应意向客户、客户账户和异常账户三个差异化对象。如果进一步从业务流程看,则可以选择几个标志性里程碑,细分为“申请——签约放款——贷后管理——资产处理”等环节;它们对应不同的工作内容,同时也具有明显的前后衔接关系。

金融企业的“业务-数据-分析”三层结构

在企业中,部门设置通常按照业务流程设置,他们分别对应流程中的不同工作,因此也就对应不同的考核指标。考核分析指标虽然来自于业务,但是无法直接从业务中得来,就像我们不能去零售门店问一个店长“你本月门店的收益率和货物周转率是多少”。

为了完成分析,我们需要首先把每笔业务抽象为标准化的数据,然后再从标准化、规范化的数据中建立业务关联、寻找洞察。这就是我建立“业务-数据-分析”的初衷,这个逻辑表达了分析背后的数据来源。

2

为什么说“数据是业务的抽象?”它不仅仅是记录和反映吗?把客户购买的每一笔商品记录在册,把客户的名字记录下来,诸如此类,何来抽象?

这就要了解数据表和字段。

其一,不是每一笔业务交易,都可以在一个表中记录完成。

因此业务到数据表的记录,涉及到进一步的数据表拆分、业务数据映射、准确记录等过程,这期间需要一些逻辑上、抽象化的数据表和字段,比如建立“订单号”来记录客户单次购买,这样,数据库工程师就可以轻松把订单信息(抬头)和交易信息(物料)分别存放在两个地方,并以“订单号”建立关联,既能单独使用,又能合为一体。

“订单号”字段虽小,它包含了很多的分析知识。它是对业务场景的抽象,是真实世界中并没有、根据需要无中生有的数据典型。

其二、即使是真实的业务数据,也需要抽象化处理。

我们每个人都有看似唯一的名字,有很多不变的属性特征(比如性别、籍贯),也有很多随着时间变化的属性特征(比如年龄、购买次数和周期等)。会员记录虽然有记录我们的名字、性别、学历,但是这些都需要进一步抽象化处理,比如为了保持会员信息的一致性,使用id代码来记录,而非中文名称,甚至用设备唯一编码追踪用户手机记录;比如为学历设置数字编码便于维护和保存;比如设置一个本身并不存在的“客户生命周期”,反映客户的特征。

这些抽象化处理,旨在保持业务数据的准确性、一致性,是未来分析的基础。

建立在这些基础上,业务流程可以拆分到很多细颗粒度的数据表中,又可以随时整合,它们是数据准备的基础;数据可以应对业务的复杂变化,从而建立面向分析的稳定桥梁。

3

从数据层到分析层,是业务分析的关键,也是建立在“虚实结合”的数据表之上的二次抽象,是分析的灵魂,是通往决策的道路。

在《数据可视化分析》和《业务可视化分析》两本书中,我在努力总结这个环节的分析知识,目前包含了几个关键:

  • 问题分析的结构:问题范围、问题描述和问题答案
  • 问题分析的过程:分析即聚合,聚合即分析
  • 大数据分析是多维度、结构化的分析,要借助于聚合的二次聚合和预先聚合技术

在这里,本文的重点将是三层结构和数据准备,因此分析过程不再展开。

二、数据准备与分析

起初,我是对数据准备敬而远之的,后来通过Tableau的join、union、blend慢慢理解了数据准备的道路,最终大成于“第三字段分类”的总结。

第三字段分类,《业务可视化分析》版本

第三字段分类的关键是理解「业务字段」和「分析字段」的双层结构,前者是行级别的、物理层的,后者是包含聚合的、逻辑层的。

如果把这个知识放到上面的“业务-数据-分析”三层结构中,那么可以把数据准备分为两个环节:

  • 从各种数据表子集到描述业务的数据层:每个数据子集的关系通常都是一对一,通过join连接,把不同数据表整合为一个“宽表”的物理合并过程。
  • 从每个业务场景的数据层到更大场景的分析层:保持每个数据表的独立性,建立彼此之间的匹配关系,比如销售数据与KPI等。

基于此,我通常把数据准备分为两种基本的类型:

  • 数据合并:数据并集union和数据连接join,特殊情形下,也包含基于聚合的join,对应prep/desktop中的fixed LOD表达式,它在本质上是一种聚合的自我合并
  • 数据匹配:数据混合blend和数据关系relationship,虽然它们可以完成一对一匹配,但通常都是一对多甚至是多对多的场景。这种用法为不同的业务场景建立了分析的桥梁。

建立在上述知识基础上,我基本了然了2022年新书《业务可视化分析案例集》和2023年新书《数据准备与数据模型》的底层逻辑,基于此结合案例为大家讲解更多分析案例和可能性。

接下来的续篇,我计划从金融分析中最难的“风控分析”开始这个主题,这个主题完成,其他主题都可以顺流而下,水到渠成。

喜乐君 @yupengwu
Aug 20, 2021 凌晨


了解 喜乐君 的更多信息

订阅后即可通过电子邮件收到最新文章。

《业务01:金融业务中的Tableau分析框架》有0个想法

  1. Pingback: 业务02:金融行业中的贷后管理 – 喜乐君

  2. Pingback: 业务4:医药行业的药品覆盖分析(上) – 喜乐君