跳至正文

《数据可视化分析》第二版·自序与目录

喜乐君新书《数据可视化分析》第二版终于上市了,在这里,了解这本书。多年总结的知识,你值得拥有!
数据资料下载页面:《数据可视化分析》第二版配套数据一览

喜乐君

《数据可视化分析》第2版

从2020年8月《数据可视化分析》出版以来,整整三年时间过去了,感谢读者厚爱,本书前后加印8次,多次入围「京东大数据榜单」三甲;期间我有幸成为了全球Tableau Visionary,更有幸认识了很多的Tableau客户,并在躬身实践的基础上积累了宝贵的分析经验。

图书从原来的400多页变成了全彩500多页,几乎重写了全书90%以上的内容和插图——毫无疑问,新老读者都可以把它视为一本全新的书精度,必将获得意料不到的知识收获。

图书购买链接:

京东渠道:数据可视化分析(第2版):分析原理和Tableau、SQL实践(全彩)
目前半价优惠,94.5元

本书目前已经通过终审,正在申请CIP书号、印刷前确认,未来两三周时间将开印上市,届时本公众号会第一时间通知。

该书全面重写,与第一版内容截然不同。了解第一版更多内容: 

第二版·喜乐君自序

感谢Tableau和读者的支持,你们给了笔者继续前进的动力。

2020年年初,疫情三个月期间,我把学习Tableau的多年所思、所想毫无保留地写作下来,配以精致的图片出版发行。《数据可视化分析:Tableau原理与实践》收到了众多读者的一致好评,累计印刷8次,发行逾万册,多次入围“京东大数据推荐榜单”前三名,在读者群中认识了很多Tableau粉丝、企业用户以及可视化爱好者。

过去两年多时间,Tableau产品持续更新迭代,笔者也进一步补充了SQL、数据库、数据仓库等基础知识,并对比学习了PowerBI、帆软、观远等国内外多家优秀BI产品的应用。“实践是最好的老师”,笔者在分析项目咨询、Tableau企业培训、可视化开发项目的锻炼中,日渐意识到第一版书中的诸多不足甚至错误,并放弃了小修小补的计划,誓以重写此书作为近两年学习的总结。

于是,2022年4月开始,笔者开始完全重写本书的内容,重新绘制、调整了大部分插图。历经疫情的波折,多次延迟,终于姗姗来迟,与读者见面。

这里,笔者总结第二版相对于首次版本的内容改进。

1. 第二版的内容改进,总结如下几点:

  • 数字化转型的实践思考

结合多年的切身项目实践,书中总结了数据的应用及其阶段,数字化转型的多种路径和循序渐进的组织方案(第1章)。

  • 业务分析方法和体系更加成熟。

业务是分析的“土壤”。在项目咨询过程中,笔者提出了“业务—数据—分析”的框架体系,可以与企业业务流程相结合绘制数字化地图(第2章)。同时,努力超越工具之上,围绕问题结构、聚合、聚合度和详细级别,构建了一个普适性的业务分析方法,适用于各种分析和BI工具,甚至可以作为衡量分析工具的一种尺度(第3章)。

  • 在数据合并、数据筛选、计算三大主题,对比介绍了Excel、Tableau和SQL的应用场景,书中总结了“数据合并的分类矩阵”“两类筛选位置”“计算的分类”等实用方法,帮助没有相关技术背景的人更快实现超越,也有助于SQL出身的“技术派”更好地理解敏捷BI的精髓。高阶的BI工具绝非拖拉曳那般简单,在技术平民化的背后,是更巧妙的“业务灵魂”。
  • 将“数据筛选和交互”独立为第6章,进一步强化筛选在业务分析中的重要性。筛选的类型多样、优先级复杂,应该尽可能避免滥用SUM+IF类型的条件聚合,将筛选视为分析的独立环节,是优化分析性能的关键方式。
  • 强化“详细级别”的概念(替代之前的“层次”概念),在数据表详细级别(Table LOD)、视图详细级别(Viz LOD)之外,使用“引用详细级别”(Reference LOD)代表视图之外预先指定的详细级别;于此,笔者把数据关系、筛选和计算三大关键融为一体,这将是本书最重要的知识资产,是超越Tableau理解不同工具背后的分析共性的关键。
  • 调整了第3篇计算的知识框架,没有计算,就没有无尽的业务分析,这也是本书最重要的内容之一。
  • 第8章强化了计算的两大分类:行级别计算完成数据准备、聚合计算完成业务分析。在分类介绍常见函数后,借助于逻辑计算介绍了两类计算的区别和联系。
  • 第9章使用了新的框架介绍Tableau表计算和SQL窗口函数,表计算代表的“抽象的二次抽象”,是迈向高级分析的台阶;
  • 第10章则结合“SQL聚合子查询”深入讲解LOD原理,结合产品购物篮、客户RFM等经典案例,把高级分析中“预先聚合”的理念,推广到更普遍的业务分析之中。
  • 增加了“从数据管理到数据仓库”的新章节(第11章),相关内容是从可视化分析走向专业的数据建模、数据方法的关键。“视Tableau Server为DW/BI平台”,给了更多企业全新选择。
  • 受限篇幅,移除了之前Prep Builder数据处理、Tableau Server相关的大部分内容。

2. 致谢 

每次写作完成,我总是迫不及待地分享。如同《数据可视化分析:Tableau原理与实践》《业务可视化分析:从问题到图形的Tableau方法》,本书付梓之前,笔者在上海组织了“喜乐君精品课”线下活动,详尽介绍了本书的核心内容,教学相长,在分享过程中进一步发现了知识体系的盲点。

感谢来自天合光能、汉德车桥、上海电气、海南航空、上汽集团、英飞凌等企业的热心读者。感谢继续支持和信任我的企业客户,我就用专业和热爱回报大家。

感谢Tableau,你给了我穿过迷雾的勇气,我也将无期限地支持你,对得起“Tableau传道士”的称号,对得起Tableau Zen Master/Visionary的全球荣誉。

感谢我的父母,我的家人,“大爱无言”,我当用余生以行动回报。

喜乐君
2023年1月20日


彩色插图欣赏(部分)

从喜乐君精心绘制的彩色插页中,你就能感受到这本书的质量,以及用心程度。

篇章目录

第1篇 企业数字化转型与业务分析方法

本篇脱离Tableau,帮助读者宏观理解数据的体系(技术的金字塔视角、业务的“地图视角”),并理解企业数字化转型的不同路径、数据应用的不同场景。最重要的,脱离一切工具,介绍分析的核心概念和方法论。

第1章 数字化转型:21世纪的机遇与挑战
理解数据的层次、数据应用的阶段,以及企业数字化转型。
第2章 业务视角的分析体系与企业分析地图
从业务视角构建“业务-数据-分析”层次框架,并企业级数据地图;可视化是企业数据分析的重要表现形式;Tableau则是卓越的企业分析工具和平台。
第3章 业务可视化分析:关键概念与方法论
本书的核心原理皆在此章。问题的结构分析、聚合是分析本质,基于聚合构建多个问题的衡量尺度(聚合度),从而通往高级问题分析。指标是聚合度量的业务形态。
数据表是分析的起点和终点,可视化则是聚合表的另一种表现形式。

第2篇 数据建模、可视化与交互

本篇介绍业务分析的三个板块:数据准备、可视化图形、仪表板展现。数据准备的关键是逻辑模型,可视化的关键是字段类型与问题类型,仪表板展现关键是交互。

第4章 数据合并与关系模型(Tableau/SQL)
数据合并分类矩阵包含行级别的合并、聚合表的匹配,行级别的合并分为并集Union和连接Join两种类型;聚合表的匹配分为灵活的混合Blend和稳定的关系Relationship。
理解数据模型的关键是理解物理层合并与逻辑层匹配的差异。
第5章 可视化分析与探索
从问题分类到可视化图形样式,结合标记、坐标轴、参考线等完成增强分析的多种方法,其中,参考线是高级计算的“模型化”,是可视化与表计算的桥梁。
第6章 Tableau/SQL筛选与集交互
筛选类型多样、体系复杂。对比SQL的筛选语法,重新构建了Tableau筛选的分类体系,在包含多个筛选时,相同类型取交集、不同类型看优先级。集是高级的筛选工具,它的本质是分类判断。参数用于控制筛选、集的范围,是最常见的变量。
第7章 仪表板设计、进阶与高级交互
仪表板是最重要的表达方式,交互是仪表板展现的灵活,基本交互包括快速筛选、高亮、跳转等,高级交互则以参数、集(通常变量)为基础,多要结合计算方可完成。本章同时介绍了指标Metric、初始模版、性能优化等内容。

第3篇 以有限字段做无尽分析:Tableau、SQL函数与计算体系

本篇的关键是计算,基于详细级别构建了由浅入深的层次体系,是读者理解Tableau,理解通用分析的关键。

第8章 计算的底层框架:行级别计、聚合计算及其函数
行级别计算完成数据准备、聚合计算完成业务分析,二者构成了计算的基础。本章结合Excel、SQL和Tableau讲解,并介绍了Tableau的对应函数。字符串函数、日期函数是行级别的,而算术计算、逻辑函数是通用的。
第9章 高级分析函数:Tableau表计算/SQL窗口函数
分析即抽象,抽象聚合,“聚合的二次聚合或行间计算”是高级抽象的典型,典型案例是合计百分比、同环比差异。本章介绍排序、移动平均、窗口合计等典型计算场景和函数,并介绍了表计算嵌套应用,以及“合计利润率”、标杆分析、帕累托等案例。
第10章 结构化问题分析:LOD表达式(SQL聚合子查询)及案例
LOD表计算用于在视图中引用预先聚合值,这和SQL聚合子查询异曲同工。本章介绍了它的原理、类型与函数,并深入介绍了会员RFM、商品购物篮分析等典型案例。
第11章 从数据管理到数据仓库:视Tableau为DW/BI平台
Tableau不仅仅是可视化分析工具,更是企业级的大数据分析平台,本章介绍Tableau Server的数据管理相关功能,并介绍说明ETL流程。建议企业把Tableau视为DW/BI平台,构建敏捷的分析体系。

章节目录

第1篇 奠基:数字化转型与业务分析原理

第1章数字化转型:21世纪的机遇与挑战

1.1  理解数据的层次及分析的价值

1.2  数据应用的3个阶段

1.2.1  初级·报表展现:信息的整理与固定展现

1.2.2  中级·业务分析:分析辅助决策,决策创造价值

1.2.3  终极·“智能商业”:大数据重塑商业模式

1.3  “数字化转型”到底“转”什么

1.3.1  塑造实事求是的数据文化:“一切用数据说话”

1.3.2  数字化转型源自各个业务场景的数字化和持续进化

1.3.3  业务和技术兼备的卓越中心和分析型人才

1.3.4  统一并持续优化分析方法论,提高分析效率和准确性

参考文献

第2章“业务-数据-分析”分析体系与企业数据地图

2.1  “业务-数据-分析”体系:BDA分析框架

2.1.1  分析层:指标体系建设和分析仪表板

2.1.2  数据层:数据管理与数据仓库

2.1.3  业务层:业务流程与“业务在线化”

2.2  建立全局视角:企业数据地图(data map)

2.3  两种企业级分析推进路径:“自上而下”与“自下而上”

2.3.1  自下而上:从数据出发的分析之路

2.3.2  自上而下:从问题和指标出发的分析之路

2.4  可视化是大数据分析的桥梁和媒介

2.4.1  数字、文字的可视化及可视化要素

2.4.2  从可视化到抽象分析:走向仪表板和高级分析

2.5  Tableau:大数据敏捷业务分析的“代表作”

参考文献

第3章业务可视化分析:关键概念与方法论

3.1  解析问题结构、理解聚合过程和指标

3.1.1  问题的结构及其相互关系

3.1.2  聚合是问题分析的本质过程

3.1.3  基于聚合的字段分类:维度描述问题,度量回答答案

3.1.4  指标是聚合度量的业务形态

3.2  明细表与聚合表:聚合的逻辑过程

3.2.1  业务明细表和问题聚合表:聚合的起点和终点

3.2.2  物理表与逻辑表:数据表的抽象类型

3.2.3  字段的数据类型:数据表字段的抽象类型

3.3  可视化图表:聚合交叉表的“另一面”

3.3.1  问题类型与可视化增强分析

3.3.2  可视化背后的数据类型:连续和离散

3.3.3  Tableau中的字段属性及其作用

3.4  简单问题的“三步走”方法和Tableau示例

3.5  聚合度和详细级别:构建复杂问题层次理论

3.5.1  数据明细表和聚合度:多个问题的公共基准和衡量尺度

3.5.2  详细级别:不同“聚合度”问题对应的抽象依据

3.5.3  结构化分析两个应用方向

3.5.4  关键概念汇总:聚合、聚合度、详细级别、颗粒度

参考文献

练习题目

第2篇数据准备、可视化、交互设计

第4章数据表合并与关系模型(Tableau/SQL)

4.1  概论:数据合并与连接数据源

4.1.1  理解数据合并、数据模型的重要性

4.1.2  数据合并和数据模型的相关概念

4.2  数据合并的分类矩阵与数据模型案例

4.2.1  “所见即所得”的行级别数据合并:Union和Join

4.2.2  Excel的局限:基于数据透视表的数据合并

4.2.3  Tableau数据混合初探,在聚合后完成JOIN连接

4.2.4  数据合并“分类矩阵”:两种合并方式、两个合并位置

4.3  行级别并集、连接与Tableau/SQL方法

4.3.1  数据并集(Data Union)

4.3.2  数据连接(Data Join):连接条件与连接方式

4.3.3  高级连接的形式:仅左侧连接、交叉连接与“自连接”

4.3.3  明细表并集(Union)与连接(Join)的异同点与局限性

4.4  从数据关系匹配到关系模型

4.4.1  “临时”数据关系:基于问题层次创建数据关系匹配

4.4.2  数据模型:在最为详细且有业务意义的级别预先构建数据关系

4.4.3  【关键】层次分析方法:从数据合并到数据关系模型

4.4.4  【难点】关系模型优化(上):匹配类型(基数)

4.4.5  【难点】关系模型优化(下):匹配范围(引用完整性)

4.4.6  共享维度表:从雪花模型到网状模型

4.4.7  通往最佳实践:业务关系模型的可视化表达

4.4.8  案例:图书及销售的数据关系模型

4.5  重说数据混合:编辑匹配关系和匹配详细级别

4.5.1  数据混合设置:自定义混合条件和自定义匹配字段

4.5.2  高级数据混合:数据匹配的详细级别不同于主视图

4.6  不同数据合并类型的相互影响

4.7  Tableau与SQL/Python的结合

4.7.1  Tableau和SQL的结合

4.7.2  SQL的JOIN连接

4.7.3  Tableau Table Extensions:给数据源插上“算法之翼”(2022.3+)

参考文献

练习题目

第5章可视化分析与探索

5.1  数据准备:理解业务过程与整理数据字段

5.1.1  数据表:理解业务过程及“数据表详细级别”

5.1.2  字段:理解业务过程的对象并做分组分类

5.2  从问题到可视化图形:如何确定主视图框架

5.2.1  从问题类型到主要的可视化图形

5.2.2  初级可视化:“三图一表”

5.2.3  中级可视化:分布分析、相关性分析

5.2.4  地理空间可视化

5.2.5  数据图像角色(Image Role)可视化(2022.4+)

5.3  可视化绘制方法与可视化增强

5.3.1  像油画一样做可视化:可视化三步骤和标记的使用

5.3.2  度量双轴及其综合处理

5.3.3  多个坐标轴的“公共基准”:度量值

5.4  高级分析入门:参考线与参考区间

5.4.1  参考线的创建及其组合

5.4.2  甘特图和标靶图:条形图与参考线的两种结合方式

5.4.3  参考区间、盒须图、标准差分布

5.4.4  置信区间模型

5.4.5  趋势线与预测线

5.4.6  集群

5.5  格式设置:必要调整,但不要过度

5.5.1  常见的设置格式工具栏

5.5.2  设置“标签”格式,自定义文本表

5.5.3  工具提示的格式设置、交互和“画中画”

5.5.4  其他常用小技巧

参考文献

练习题目

第6章 Tableau/SQL筛选与集操作

6.1  理解不同工具背后的筛选方法与共同点

6.1.1  筛选的两类位置:独立筛选和“条件计算”

6.1.2  使用不同工具完成“独立筛选”

6.2  筛选的分类方法:基于详细级别的视角

6.2.1  【入门】数据表行级别的筛选:维度筛选器

6.2.2  【进阶】指定详细级别的聚合筛选:简单条件和顶部筛选

6.2.3  【难点】指定详细级别聚合的筛选:建立在自定义计算之上

6.3  筛选范围的交互方法:快速筛选和参数控制

6.3.1  快速筛选器(Quick Filter)及其基本配置

6.3.2  特殊的日期筛选器:默认筛选到最新日期

6.3.3  参数控制:完全独立和依赖引用

6.4  多个筛选的处理:交集计算和优先级

6.4.1  多个筛选的基础知识:数据集及运算

6.4.2  多个筛选的计算原则(上):相同类型取交集(intersection)

6.4.3  多个筛选的计算原则(下):不同类型按优先级(Priority)计算交集

6.4.4  调整筛选器优先级(上):上下文筛选器和表计算筛选器

6.4.5  调整筛选器优先级(下):数据源筛选器和数据提取筛选器

6.4.6  筛选与计算的优先级

6.5  集(Set):把筛选保留下来的“神奇容器”

6.5.1  创建自定义集及集的本质

6.5.2  自定义集内成员:“集控制”(2020.2+)

6.5.3  创建动态条件集

6.5.4  集动作:以视图交互方式更新集成员

6.6  集的运算、优先级和应用

6.6.1  多个集的合并与“合并集”运算

6.6.2  集和筛选的关系及优先级

6.6.3  集的高级应用:控制用户权限的“用户筛选器”

6.7  中级交互:仪表板中的快速筛选、集交互

6.7.1  交互设计的基本分类

6.7.2  “以图筛图”:仪表板中的多表快速关联筛选

6.7.3  共用筛选器、集和参数:典型的仪表板交互

6.7.4  工具提示“画中画”:最简单的多表关联

6.8  更多实用工具:分组、数据桶、分层结构、排序

6.8.1  作为数据准备的“组”(Group)

6.8.2  分层结构钻取分析与仅显示相关值

6.8.3  排序:对离散字段的数据值排序

参考文献

练习题目

第7章仪表板设计、进阶与高级交互

7.1  仪表板Dashboard:最重要的主题展现形式

7.1.1  仪表板设计基本过程和常见功能

7.1.2  仪表板大小、布局和对象

7.1.3  常用的交互对象:隐藏按钮、导航按钮

7.1.4  仪表板布局中的分层结构

7.1.4  跨设备类型的仪表板适配

7.2  故事Story:以数据故事叙事、探索

7.2.1  故事及其基本设置

7.2.2  故事的阐述方式

7.3  仪表板进阶:“指标”、初始模板、性能优化与“数据指南”

7.3.1  “指标”Metrics:聚焦仪表板关键度量

7.3.2  “初始模板”(Accelerators):专家分析模板加速分析

7.3.3  发布工作簿和“工作簿优化器”(Optimizer)

7.3.4  数据指南(Data Guide)(2022.3+版本)

7.4  三种基本交互类型:高亮、筛选和页面

7.4.1  突出显示(Highlight):以聚焦实现间接筛选

7.4.2  页面轮播(Page):快速筛选的连续叠加

7.5  两类高级交互工具:参数、集交互

7.5.1  关键原理:参数、集的共同点和差异

7.5.2  参数与逻辑判断结合:切换视图度量

7.5.3  动态参数:动态更新范围和初始值

7.5.4  集控制:以控件方式手动更新集成员

7.6  参数动作:参数、计算和交互(2019.2+版本)

7.6.1  参数动作:使用动作更新度量值

7.6.2  动态筛选:参数动作和计算实现差异化筛选

7.6.3  动态基准分析:使用参数动作控制参考线和计算基准

7.6.4  自定义分层结构:使用参数展开指定的类别

7.7  高级交互:指定区域对象的动态可见性(2022.3+)

7.8  高级互动的巅峰:集动作和集控制

7.8.1  经典集动作:交互更新自定义集(2018.3+版本)

7.8.2  集的控制与更新:赋予集以强大的灵魂

7.8.3  使用集完成对比分析和标杆分析

7.8.4  高级互动的使用建议

练习题目

第3篇以有限字段做无尽分析:Tableau、SQL函数和计算体系

第8章计算的底层框架:行级别计算与聚合计算

8.1  计算的演进及分类:从Excel、SQL到Tableau

8.1.1  计算的本质及其与业务过程的关系

8.1.2  以Excel理解详细级别与计算的两大分类

8.1.3  从Excel“存取一体”到“数据库-SQL”的存取分离

8.1.4  集大成者Tableau:将查询、计算和展现融为一体

8.2  计算的两大分类:分析是聚合的抽象过程

8.2.1  行级别计算、聚合计算的差异和关系

8.2.2  从业务角度理解计算的结果:业务字段VS分析字段

8.3  数据准备类函数(上):字符串函数、日期函数

8.3.1  字符串函数:截取、查找替换等清理函数

8.3.2  日期函数:日期独特性与转化、计算

8.3.3  数据类型转换函数

8.4  数据准备类函数(下):“正则表达式”

8.5  分析函数:从明细到问题的“直接聚合”

8.5.1  描述规模:总和、计数、平均值

8.5.2  描述数据的波动程度:方差和标准差

8.5.3  关注个体、走向分布:百分位函数及最大值、最小值、中位数

8.5.4  ATTR属性——针对维度字段的聚合判断

8.6  通用型计算:算术函数和逻辑函数

8.6.1  算术运算、精度控制函数

8.6.2  逻辑表达式和逻辑判断符

8.7  行级别计算与聚合计算的区别与结合

8.7.1  实例:各子类别的利润与盈利结构分析

8.7.2  复习:行级别计算和聚合计算的差异

8.7.3  SUMIF条件聚合:将行级别筛选和聚合分析合二为一

8.8  专题:地理空间分析之“空间函数”

参考文献

练习题目

第9章高级分析函数:Tableau表计算/SQL窗口函数

9.1  合计的两个方法及“广义LOD表达式”

9.1.1  入门:从Excel理解“合计百分比”计算的层次关系

9.1.2  高级分析的层次框架:数据表详细级别和“聚合度”

9.1.3  进阶:“合计百分比”的两种SQL方法

9.1.4  Tableau敏捷BI,让业务用户轻松驾驭二次聚合分析

9.1.5  “广义LOD表达式”与计算的分类

9.2  “环比/同比”偏移计算及表计算设置方法

9.2.1  维度作为偏移计算依据:单一维度的同比差异

9.2.2  包含多个维度的同比(上):区别范围和依据

9.2.3  包含多个维度的同比(下):设置多个依据

9.2.4  SQL窗口函数:偏移类窗口函数案例介绍

9.3  小结:表计算的独特性及两种设置方法

9.3.1  从差异计算的两种方法理解窗口计算的独特性

9.3.2  Tableau设置范围的两种方法:相对/绝对方法与适用场景

9.4  高级分析函数之排序计算:INDEX与RANK

9.4.1  Tableau/SQL排序与百分位排序

9.4.2  公共基准对比:不同时间的电影票房对比(TC2)

9.4.3  凹凸图:随日期变化的RANK函数(TC4)

9.5  最重要的二次聚合函数:WINDOW窗口函数

9.5.1  合计:最简单、常用的WINDOW窗口函数

9.5.2  累计聚合:RUNNING_SUM函数——累计汽车销量

9.5.3  移动聚合:MOVING AVG移动窗口计算函数

9.5.4  “大一统”:千变万化的WINDOW窗口函数

9.6  最常用的表计算:快速表计算及其附加计算

9.6.1  快速表计算:预置的常见表计算应用

9.6.2  快速表计算的嵌套:表计算的组合(TC3)

9.7  表计算应用(1):自定义参考线、“合计利润率”

9.7.1  聚合值参考线——表计算的“可视化形式”

9.7.2  “合计利润率”:理解参考线对应的表计算

9.7.3  【难点】理解TOTAL合计与WINDOW_SUM汇总的差异

9.7.4  自定义参考线及其计算:盒须图松散化与散点图颜色矩阵

9.8  表计算应用(2):标杆分析——多种类型的计算组合

9.9  表计算应用(3):帕累托分布——累计、合计及嵌套

9.10  表计算应用(4):金融ANR计算——表计算高级嵌套

9.10  表计算筛选器:优先级最低的筛选类型

9.10.1  使用RANK聚合判断完成筛选

9.10.2  使用LOOKUP偏移函数完成年度同比和筛选

9.11  表计算延伸应用:预测建模函数

9.11.1  MODEL_QUANTILE预测模型

9.11.2  MODEL_PERCENTILE预测模型

练习题目

第10章结构化问题分析:LOD表达式与SQL聚合子查询

10.1  业务解析:理解LOD表达式的逻辑和本质

10.1.1  简单详细级别:“不同购买频次的客户数量”

10.1.2  多维详细级别:“各年度、不同矩阵年度的销售额贡献”

10.2  LOD表达式的“详细级别”及其与视图关系

10.2.1  从问题详细级别出发,理解高级问题的构成

10.2.2  主视图引用“更高聚合度”的详细级别聚合:占比分析

10.2.3  主视图引用“更低聚合度”的详细级别之聚合:购买力分析

10.2.4  主视图引用独立详细级别的聚合:客户矩阵分析

10.3  相对指定的LOD表达式及运算优先级

10.3.1  绝对指定和相对指定的LOD表达式

10.3.2  INCLUDE LOD引用更低聚合级别的聚合及优先级

10.3.3  EXCLUDE LOD引用更高聚合级别的聚合,及优先级对比

10.4  超越LOD:计算的详细级别体系及其优先级

10.4.1  不同计算类型的应用场景与作用

10.4.2  层次分析法:理解计算的运算逻辑及其组合形式

10.4.3  Tableau计算、筛选、数据关系的优先级

10.5  走向实践:多遍聚合问题与结构化分析方法

10.5.1  方法论:高级问题分析的4个步骤

10.5.2  LOD多遍聚合:客户购买力分析的嵌套LOD计算

10.5.3  嵌套LOD的语法和SQL表示

10.6  会员分析专题:会员RFM相关案例分析

10.6.1  会员分析概论与常见指标体系

10.6.2  使用Tableau完成 RFM主题分析指标

10.6.3  单维度的分布案例:会员频次分布和生命周期分布

10.6.4  多维度的结构分析:与“客户获客时间”相关的分析案例

10.6.5  复购间隔:行级别计算和LOD计算的结合

10.6.6  客户留存分析:LOD表达式、表计算的结合

10.6.7  客户矩阵分析:客户价值分类(matrix)

10.7  产品分析高级专题:购物篮分析的多个角度

10.7.1  购物篮比率:任意子类别相对于所有订单的比率

10.7.2  支持度、置信度和提升度分析:类别之间的关联推荐

10.7.3  指定类别的关联比率:筛选中包含“引用详细级别”

10.8  总结:高级计算的最佳实践

10.8.1  问题的3大构成与计算的4种类型

10.8.2  如何选择计算类型

练习题目

第11章从数据管理到数据仓库:敏捷分析的基石

11.1  Data Management数据管理功能:以数据为中心

11.1.1  Tableau Catalog数据资产和世系管理

11.1.2  Tableau Prep Conductor数据ETL流程管理

11.1.3  Virtual Connections虚拟连接:数据库和分析之间的桥梁

11.1.4  Data Policy数据策略:为数据访问增加行级别权限

11.2  从数据管理DM,到数据仓库DW

11.2.1  数据仓库是数据分析发展到一定阶段的产物

11.2.2  数据仓库的逻辑分层

11.3  ETL:数据仓库中的数据处理

11.3.1  敏捷ETL工具Prep Builder简介

11.3.2  敏捷ETL工具对数据分析的影响

11.4  建议:视Tableau为DW/BI系统

参考文献

@喜乐君 |上海唯知唯识科技有限公司

Tableau Visionary 2021~2024

《数据可视化分析:Tableau原理与实践》2020
《业务可视化分析:从问题到图形的Tableau方法》2021
《数据可视化分析:分析原理与Tableau、SQL实践》2023

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading