跳至正文

Tableau关系模型案例:图书销售和多维度模型

XILEJUN
喜乐君 Tableau Visionary ✦ 5
📊 业务数据分析「专家」· 敏捷 BI 布道师
📚 《数据可视化分析》《业务可视化分析》多本书作者
🎓 中国地质大学(武汉)经管学院 MBA 校外导师
🤝 以 Tableau 会友,致力于构建业务分析通识框架

📚 本文配套课程 · 数据可视化分析系列

🎬 B 站课程:数据可视化分析:Tableau/SQL 原理与实践  —  https://www.bilibili.com/cheese/play/ss8093


本文摘自《数据可视化分析(第 2 版):分析原理与 Tableau、SQL 实践》第四章,如下内容将在第三次印刷(202407)中被删除,从而留出足够的内容介绍新版本功能“Shared Dimensions”共享维度。

4.4.8  案例:图书及销售的数据关系模型

在实践过程中深化对技术的理解,并将业务与技术高度结合起来,几乎是熟练驾驭这一部分的唯一方法。Tableau官方提供了一个书店的数据模型示例,它由13个数据表构成,包括图书信息、作者信息、版本信息、销售、出版社、获奖信息、图书评价等。

对于业务用户而言,看得见的是数据表标题和明细,看不见的是数据表背后对应的业务场景及其关系逻辑,后者是数据合并的关键。要点如下。

  • 图书信息包括图书基本信息(图书、作者)和图书延伸信息,每本书只对应一位作者(Author),部分图书包含系列(Series)信息。
  • 每本图书可以有多个版本(Edition),不同版本可以对应不同出版社(Publisher)。
  • 版本对应标准书号ISBN,是图书的唯一标识;同一本图书的多个版本对应不同书号。
  • 书的ISBN号是销售的基本单位。
  • 一本书可以获得多个奖项(Award),而和版本无关。
  • 多本书可以构成一个系列(Series),比如,喜乐君的3本书是一个分析系列。

理解了上述的业务逻辑,就理解了数据表之间的关系。在开始构建数据模型之前,建议先用绘图工具或者手绘勾勒数据表之间的匹配关系,特别是一对多、一对一、多对多的匹配类型。如图4-57所示,笔者习惯用矩形代表一个数据表,用带有两侧标记的线条代表匹配类型,再把匹配字段标记在线条上。在这个过程中,找到适合作为关系模型中心的数据表。

图4-57  使用矩形和线条描述数据表之间的业务关系

随着数据表的增加,数据关系就有了优化的空间,比如,是否把多个数据表在行级别合并为一个,哪些数据表适合行级别的并集或连接?笔者在实践过程中总结了几个基本原则,可以作为数据模型优化的依据考虑。

  • 完全相同的业务场景,完全相同的数据表,使用并集预先合并(比如,不同季度的“销售明细表”,它们仅仅是时间范围的差异,业务场景完全相同,因此字段也完全相同)。
  • 同属于一个业务场景,并且数据表是一对一匹配的,使用行级别连接预先合并(比如,图书基本信息和图书延伸信息,虽然数据表字段不同,但都是“图书信息”业务,而且基于关联字段一对一匹配)。
  • 属于不同的业务场景,数据表是一对一匹配的,可以在行级别连接合并,也可以使用关系匹配。
  • 如果两个数据表需要紧密合并,从而与其他多个数据表建立关联,那么推荐行级别连接合并(比如,“销售明细表”和“退货明细表”是一对一的,使用连接和数据源筛选预先获得“排除退货的正常交易”,而后与销售目标、区域等多个数据表建立关联)。
  • 两个数据表虽然是一对一的,但是仅仅在部分分析中才用到两个数据表的合并(并非紧密的合并关系),可以通过关系匹配,同时指定基数类型为一对一,提高查询性能。
  • 属于不同的业务场景,数据表是多对一或者多对多的匹配,默认使用数据关系。

基于这样的方法,不同季度的销售额使用并集合并,两个图书信息表使用行级别连接合并,考虑到作者信息和图书紧密相关,而且可能会完成“不同作者的图书销售量”“不同作者的获奖次数”等分析,可以把作者信息表和图书信息表合并在一起。

另外,进一步优化数据模型时,可以标记数据表的关键字段,并特别标记数据表详细级别,它们是数据匹配的依据。同时,还可以使用UML方法同时标记基数(匹配类型)和引用完整性(范围匹配),如图4-58所示。

图4-58  书店数据从概念模型到业务结构

当然,数据模型并非有唯一解,如果作者信息并非分析的关键要素,仅在少数问题中出现,那么也不妨把它和获奖信息等并列。不管是Tableau,还是其他BI工具,都可以基于这样的业务逻辑和数据表关系,来进行分析。

如图4-59所示,是Tableau使用书店信息构建的数据关系模型。

图4-59  书店信息的数据关系模型

基于这样的数据关系模型,分析师就可以重复使用,进行众多的问题分析了。

《Tableau关系模型案例:图书销售和多维度模型》有1个想法

  1. Pingback: 《数据可视化分析》(第2版)勘误表-Tableau喜乐君-敏捷BI布道师

评论已关闭。