跳至正文

喜乐君2021《业务可视化分析:从问题到图形的Tableau方法》

标签:

敬告读者3:

应广大读者要求,本书于2023年12月做了部分调整,并第三次加印。本次加印调整了部分错别字,部分内容做了较多调整,特别是第三章。

喜乐君 Jan, 2024

敬告读者2:

《业务可视化分析:从问题到图形的Tableau方法》在2021年8月出版以来,收到了很多热心读者的积极反馈,在2022年1月份加印时,调整了第二章的部分内容和第三章的总体结构,使内容更具有体系感。特别是字段分类做了调整。

本书暂无电子版,预计未来一段时间可能也不会出版。准备加印修订至少三次到四次后考虑出版电子版。

喜乐君May 8, 2022


敬告读者1:

总结2020年的收获,近期正在写一本新书,名称确定为《业务可视化分析:从问题到图形的Tableau方法》。目前已经完成核心章节,预计一月底前完成所有内容初稿。之后二月份全书校订,修改部分章节,补充素材。预计三分月开始在几个客户的培训课程上会完整尝试一下新的逻辑,根据反馈再做最后的调整校对。

本书的核心内容是从问题出发的分析方法,以及如何循序渐进的完成业务中的结构性分析。可以视为姊妹篇《数据可视化分析:Tableau原理与实践》第二章和第五章的扩充版本。本书不针对Tableau讲解特定的操作,更多的强调图形的思考过程和完善思路,希望能帮助可视化分析用户,而非限定Tableau用户。

本书完成之后,将集中深入到客户中完成几个深入项目,之后内容通过博客更新。

——Jan 26, 2021 喜乐君

预期进度:2021年2月完成手稿|2021年4月完成排版|2021年5月预售|8月上市

本书将作为《数据可视化分析:Tableau原理与实践》的姊妹篇,重点介绍业务思考的方法与图形逻辑。

本书定位业务分析师用户。


自序:赋予可视化灵魂:基于业务分析的新思考

与笔者的上一本书《数据可视化分析:Tableau原理与实践》(以下简称《数据可视化分析》)的出版相隔整一年,我们又见面了。感谢每位读者的热心支持,笔者也将付出真诚与所有。这本书不仅仅是过去一年的新知识点,更包括了笔者在数据分析领域挣扎多年后对思考体系的重新梳理和突破。作为《数据可视化分析》的姊妹篇,本书在某些体系上更加基础、完整,在一些知识上又更加深入和进阶。

在这里,笔者简单介绍一下本书的缘起、阐述方法、知识结构等内容。

1.缘起

在《数据可视化分析》一书中,笔者总结多年学习、培训和实施服务的经验,介绍了Tableau的完整知识体系,以及基于Tableau知识框架的问题分析方法、数据准备的多层模型,特别是基于“层次”(LOD)的计算体系。该书上市后,多谢各位读者的口口相传,在Tableau的小圈子里流传尚好,而笔者也借加印穿插补充了一些知识要点,并勘误校订。不过,该书的可视化阐述过于简单,这与笔者的艺术感欠缺、知识积累不够有直接关系。

综观各种可视化图形,不管是Tableau Public上的,还是借助Python可视化库实现的,在笔者看来,绚烂的形式背后大多远离了数据的土壤——业务环境。可视化的目的是业务与决策,应以业务为背景、从问题出发、以可视化方法辅助决策(见本书第2章)。

同时,作为Tableau重要的代理商和服务提供商之一,笔者在过去一年中有幸认识了很多客户,笔者惊奇地发现,原来大公司面临的困境和中小公司其实并无二致,甚至“组织惯性”更大、更难以改变。借助于自己多年前的业务背景,笔者极力向客户推广可视化表象之上的业务探索与结构化分析。在客户服务过程中,寥寥几个“结构化分析”案例总能打动业务人员的心——他们都曾有类似的想法,但是受限于工具,从来没有实现过。

在2020年下半年给红塔集团、平安普惠等客户提供培训和咨询服务时,笔者就开始酝酿本书的框架。笔者有几个非常明确的期望,希望借助本书实现:

(1)专注业务分析方法,阐述更加完整的逻辑体系,特别是基于“第一字段分类”的问题分析方法、基于层次的结构化分析方法(见第3章)。

(2)基于“第二字段分类”的可视化逻辑,“可视化是由点线面构成的图形”,但更重要的是图形类型及其对应的业务意义;业务分析是自问题到图形的过程,而非自数据到图形的过程(见第4章)。

(3)从业务场景出发,分门别类介绍问题的类型与图形逻辑,同时引导更多的业务用户从“三图一表”的基本图形,借分布分析和相关性分析的特位分析走向“结构化分析”。结构化分析是本书最重要的归宿,是笔者热切希望每一位读者、用户都能深入理解的内容,借助相关的简单案例,在你的用户中获得“哇喔”的惊喜。

2021年上半年,在为长隆集团提供咨询服务的过程中,笔者在分享“数据准备与性能优化”时,获得了“第三字段分类”的关键灵感。本书付梓前夕,笔者特意突出了这个内容(见3.4节),虽然内容简单,但这将是之后新书的主题“数据准备与分析模型”的逻辑起点。

为此,本书尽可能站在业务用户的角度,延续“原理性思考”的底色,阐述如何从问题出发,从业务经验出发,沿着特定的逻辑,掌握业务分析的完整体系和方法。每个人都能经过刻意练习掌握这些方法,之后再与本行业的业务经验结合,成为高级业务分析师。

2.本书的阐述方法

本书的精彩,首先来自体系框架和阐述方式;其次才是工具带来的想象力。

大学毕业及之后多年,笔者跟随王思悦教授学习“发明创造与创新思维”差不多十年了。课程中有一个让笔者铭记一生的例子:带橡皮的铅笔与羊角锤。王教授精彩地阐述了如何通过“同中之异”“异中之同”的角度创造性地总结多个事物背后的特征,从而让笔者迈向创新之路。带橡皮的铅笔一端能写、一端能擦,羊角锤一端能敲、一端可拔,功能相克,这是二者的“异中之同”。而二者又有显著的差异,前者是“材料上的互克”,后者却是“结构上的互克”,此为“同中之异”。这个例子笔者反复听了很多年,每次都有新的收获,如今终于可以换一种方式表达出来。

在本书中,笔者将用上述思考方法,总结多年业务分析和客户服务经验中的“同中之异”和“异中之同”,构建整本书的逻辑体系,比如:

  • Excel透视图、SQL聚合查询、Tableau拖曳分析之间的相同点是什么(问题的结构和聚合过程是相同的,见第2章)?不同点又是什么(展现方式不同,即可视化基础,见第3章)?
  • 条形图、折线图、饼图作为简单图形背后的相同点是什么(结果分析为主)?分布分析和相关性分析的相同点又是什么(特征分析为主)?从结果分析、特征分析再往前,就是二者结合的结构化分析。
  • 简单问题和复杂问题因何不同,又因何关联在一起?如何用逻辑方法构建复杂问题和高级问题的结构?层次是问题分析的关键,多个层次的相关性就是结构化分析的关键。

以上是本书暗含的脉络。经由“同中之异”“异中之同”的普适性原理与方法,帮助所有人快速进入可视化业务分析的广阔天地,再根据问题的不同类型,阐述不同分支的前进之路。

这种构建方法的好处是能在案例之后直抵原理,帮助读者举一反三、触类旁通,从而成为高级的业务分析师;而其缺点就是需要一定的理解能力,毕竟这也是笔者十年之功,历经多个行业的点滴总结。

当然,在看似复杂的体系背后,笔者并没有重新创造什么知识,无非是采纳百家之长,然后组合创新的结果(就像克里斯坦森所言)。五音可以谱曲,五色创造绚烂,哪怕只有五种图形,借助于原理性的理解和业务的表述方法,也可以深刻地展示数据背后的业务规律。

“图片最伟大的价值在于它迫使我们注意到从未预见到的事物。”

——《探索性数据分析》,1998

在这个过程中,业务问题是指引,是方向,是北斗星。有一个“因指见月”的典故,教导我们不能执着于名相(“手指”)而忘记了修行的觉悟(“月亮”),就像匆忙得只记得赚钱而忘记了生活。业务分析何尝不是如此?

3.本书的知识结构

本书从业务出发,从问题出发,穿插必要的分析知识和图形概念,最后以高级分析结尾。其中重点解释业务分析方法、可视化构建方法、主要的问题类型与扩展逻辑、业务中的结构化分析方法等,具体如下。

第1篇,介绍业务分析的重要性,以及问题分析的方法与可视化分析基础。

第1章,通过一个小故事,介绍传统企业普遍面临的困境。

第 2 章,介绍数据分析如何成为连接数据资产到价值决策的桥梁。这个桥梁中有两个关键词:问题和图形。问题决定图形的类型与意义,图形是问题的载体。基本可视化、交互探索可视化和结构化分析层层递进,越来越靠近业务的本质。

第3章,介绍问题分析的方法。介绍适用于所有行业、普遍场景的结构化问题思考方法、过程思考方法,并努力将一些技术领域的专业词汇变成普及型的业务知识。

第4章,介绍可视化分析的构建逻辑与通用方法。脱离具体的图形,介绍可视化的构成、字段属性、图形的逻辑意义,以及适用于每种图形的可视化绘制路径和方向。

第2篇,介绍可视化分析的常见图形及其业务延伸形式。

第5章,介绍本书“从问题到图形的方法”的思考来源,以及主流的几种可视化选择路径。

第6章~第12章,分别介绍排序与对比、时间序列、占比、文本表、分布分析、相关性分析、地理空间可视化共7个主要的问题类型,以及每一类问题对应的基本图形、复杂图形和高级图形样式。

第3篇,介绍从单一可视化分析走向高级分析的交互与结构化分析。

第13章,介绍“样本范围”相关的控制要素,并重点介绍在“样本范围”中引用另一个层次的问题分析。以购物篮关联分析为例,对比了筛选、集和计算3种实现方法。

第14章,本书最重要的升华,介绍了“结构化分析”的业务背景、问题类型、典型案例,以及与之相反的可视化方向。

第15章,分享了如何成为一名优秀的业务分析师(商业分析师)的个人经验和建议。

在各个章节中,穿插了业务分析的案例和思考方法,限于篇幅,不能完整介绍每一步的细节,需要读者在“技艺”方面多加练习和探索。

卓越的思考一定是超越工具的,但最好的思考只有在最佳的工具中才能尽情绽放。本书配图主要基于Tableau Desktop完成,部分环节辅以Excel与SQL作为对比理解。

4.本书的长远希望

“业务分析师”或“商业分析师”作为一个全新的职业,在互联网、电商等行业中越来越重要;而每一个传统行业,都值得用类似的思维重建对数据的理解和数据分析框架——正如很多人所说,“数字化时代,所有的行业都值得重做一遍”,不管是卖菜、水电公共事业,还是制造汽车、火箭,这是我们这一代人的幸运和机会。很多传统公司在犹豫是否购买哪怕一套Tableau时,它已经为此付费了(只是换一种方式,比如重复劳动、沉没成本等)。

在这个快速变化的时代,很多人被守旧的思维和工具所困,所以“忙而无功”;很多IT部门陷入“终日碌碌”,而业务部门依然觉得他们“无所作为”的困境——不是每个人不努力,只是他们在做不擅长的事情。笔者希望为乐意改变的个人和单位提供一条看得见的转型之路。基于可视化分析的业务分析,是适用于任何企业的“数字化转型”的窗口。

数据是资产,已经是无可置疑的了,因为数据被称为“21世纪的石油”。

如果有人希望从IT人员转型为业务分析师(商业分析师),如果有人希望从业务人员成长为更优秀的业务经理(跨界的业务经理),那么笔者希望这本书能提供给他们一些捷径,并减少笔者所经历的苦痛和纠结。业务分析首先应该关注思维方法,其次才是工具实现。

不管你是否在用Tableau,本书都将提供超越软件本身的灵感。借此,希望读者能找到适合自己的成长之路。

毕竟,作为新时代的从业者,我们不仅仅是公司中的一员、家庭中的一员,更重要的是“自己的CEO”,正如德鲁克所言:

“知识工作者必须成为自己的首席执行官……不仅要清楚自己的优点和缺点,也知道自己是怎样学习新知识和与别人共事的,并且还明白自己的价值观是什么、自己又能在哪些方面做出最大贡献。因为只有当所有的工作都从自己的长处着眼时,你才能真正做到卓尔不群。”

5.鸣谢

本书的构想最早源自红塔集团玉溪卷烟厂高宇雷先生的提议,他建议笔者多分享一些“可视化的制作方法”;之后在给平安普惠的多次培训中,本书脉络逐步完善,并在2021年春节期间集中完成。

2021年4月,为了验证本书的逻辑框架,笔者又在上海组织了6天的课程,完整、深入地分享了本书的细节,并获得了一些宝贵的改进线索。感谢参与的每一位朋友,以及来自上海杉达学院(提供了活动场地)、上海交通大学、华东师范大学、上海对外经贸大学等多位老师和学生的聆听。

感谢多年来每一位客户的支持和理解,作为一名“创业型知识分子”,客户给了笔者最大的理解和支持,这是笔者成长的土壤,也是这本书创作的动力。特别感谢百胜中国唐小强先生为本书做出的贡献,他是完整阅读本书的首位读者。

感谢Tableau,它让笔者感受到了“文思泉涌”的激情和热爱。2021年有幸成为全球Tableau Zen Master的一员,让笔者倍感荣幸。这本书也是笔者对这项荣誉的最好回馈。虽然本书在努力脱离工具阐述分析方法,但在Tableau面前,笔者永远要保持谦逊——笔者只是一具传递知识的“皮囊”,而Tableau才是激活笔者力量、赋予笔者能量的宝剑。

感谢多位Tableau大师,特别是Ken Flerlage、Andy Kriebel、Alexander Mou 、Jeffrey Shaffer等多位Tableau Zen Master,读者可以在Tableau Public上领略他们的绝佳作品,本书多有引用。

感谢与笔者同时入围Tableau Zen Master,同时还是中国首位Tableau Ambassador的Wendy(汪士佳)女士;笔者诚邀Wendy为本书设计封面,她的回馈远超笔者的预期。不管是笔者所代表的理性之路,还是Wendy所代表的艺术家之路,Tableau都会是你最好的伙伴。

感谢电子工业出版社的石倩编辑,因缘际会合作至今,她是两本书背后的默默功臣;每次图书加印,她都耐心地让笔者的书更加完美——不管是修改错别字、升级插图,还是协助笔者重写某些章节。本书的未来也是如此,每一次加印,都是一次或大或小的升级,这也是我们对待知识的态度。

感谢家人,在笔者匆匆忙忙的人生路上,他们理解了笔者的一切。

感谢喜乐的人生;人生美好。

喜乐君
2021年6月1日



目录

第1篇  从业务和问题出发的可视化体系

第1章  我的故事:业务分析需要可视化

1.1  生活/工作面前,我们都一样.. 2

1.2  带着问题启程.. 6

第2章  奠基:业务可视化分析的价值.. 7

2.1  古往今来,分析的终极目的是辅助决策.. 7

2.2  决策:获得信息、做出判断.. 10

2.3  简单可视化:帮助领导更快地获得信息.. 11

2.4  交互可视化:可视化是假设验证的工具.. 15

2.5  高级可视化:分布、相关性分析与结构化分析.. 17

2.6  Tableau:敏捷BI助力决策分析.. 19

第3章  地平线:问题分析的方法与数据基础

3.1  起点:问题的结构分析和业务分析框架.. 22

3.2  从数据到问题分析:多种工具实现与聚合过程.. 24

3.2.1  Excel数据透视表:拖曳即聚合.. 24

3.2.2  SQL的聚合查询:窗口式、代码化聚合查询.. 25

3.2.3  Tableau VizQL可视化:聚合、可视化、分析三合一.. 26

3.2.4  分析的过程是聚合… 26

3.3  数据表明细是聚合的起点,是业务的映射.. 27

3.3.1  理解字段反映的业务对象及其分类方式.. 28

3.3.2  理解数据表反映的的业务过程及数据表记录的唯一性.. 36

3.3.3  理解数据表的“行级别层次”及其相互关系,是数据合并/匹配的基础.. 37

3.4  问题分析是聚合的终点:“第三字段分类”与计算.. 38

3.4.1  理解问题中包含的计算及其分类:第三字段分类.. 38

3.4.2  第三字段分类的价值与多视角理解.. 41

3.4.3  分析字段的的典型代表:“聚合的比值” 42

3.5  直接聚合:基于行级别的直接聚合类型.. 44

3.5.1  描述规模:总和、平均值、计数.. 44

3.5.2  描述数据的波动程度:方差和标准差.. 45

3.5.3  关注个体、走向分布:百分位函数及最大值、最小值、中位数.. 48

3.6  间接聚合:基于视图聚合的二次聚合.. 51

3.6.1  “复杂问题”的两个方向特征.. 51

3.6.2  基于直接聚合的二次聚合:大数据的OLAP分析.. 51

3.7  从问题分析视角看数据分析的发展阶段.. 57

3.7.1  小数据时代的多角度明细展示.. 58

3.7.2  数据统计时代的聚合汇总.. 58

3.7.3  大数据时代的结构化分析.. 59

第4章  启程:可视化构建方法与扩展路径

4.1  从聚合到图形:字段的持续性与图形构成要素.. 61

4.1.1  可视化坐标空间:坐标系与坐标轴.. 63

4.1.2  “第二字段分类”与坐标轴.. 64

4.1.3  可视化视觉模式与图形类型.. 72

4.1.4  可视化的意义描述:不忘初心;牢记业务… 75

4.2  7种主要的问题类型及其主要图形.. 76

4.2.1  传统三大图及其局限性.. 77

4.2.2  文本表:侧重度量指标的高密度展现.. 79

4.2.3  分布分析的三大典型图形.. 79

4.2.4  相关性:散点图与双轴折线图.. 83

4.2.5  地理位置可视化.. 85

4.3  从基本问题类型到复杂图形的延伸方法综述.. 86

4.3.1  从问题分析到图形增强分析的完整路径.. 86

4.3.2  基于行列的空间扩展:分区与矩阵.. 87

4.3.3  基于标记的增强分析:分层绘制方法.. 90

4.3.4  基于坐标轴的扩展:双轴、同步与多轴的合并处理.. 97

4.3.5  基于参考线的扩展:增加视图聚合的二次聚合.. 98

第2篇  问题的7种基本类型与可视化方法

第5章  从问题到图形的可视化逻辑.. 102

5.1  从问题到图形的启蒙与进化.. 102

5.1.1  《用图表说话》中的三步走方法.. 102

5.1.2  “问题的字段解析方法”与基本问题类型.. 103

5.2  可视化图形分类方法与可视化过程.. 105

5.2.1  FT可视化词典.. 105

5.2.2  Data Points中的数据可视化过程.. 107

5.2.3  Abela的“图形推荐”逻辑.. 108

5.2.4  面向IT的Echarts分类与Tableau 109

第6章  排序与对比(部分与部分).. 111

6.1  基本条形图与多个离散维度条形图.. 111

6.1.1  并排条形图(side-by-side bar):离散字段并排构成分区.. 112

6.1.2  条形图矩阵:离散字段交叉构成矩阵.. 113

6.1.3  矩阵实例:日历矩阵条形图.. 114

6.1.4  堆叠条形图:你喜欢喝什么咖啡.. 116

6.1.5  比例条形图:把堆叠条形图转化为占比分析.. 118

6.2  包含多个度量坐标轴的条形图.. 118

6.2.1  字段重要性递减的多种布局方式.. 119

6.2.2  考虑字段关系的双轴布局方式.. 120

6.2.3  并排条形图:多个绝对值度量字段的对比.. 122

6.2.4  重叠条形图:多个绝对值度量字段的包含关系.. 123

6.3  字段类型和属性对可视化的影响.. 124

6.3.1  字段类型和属性对颜色的影响.. 124

6.3.2  “绝对值”与比值:字段属性对标记选择的影响.. 126

6.4  坐标轴的调整与组合.. 127

6.4.1  默认零点:除非必要,谨慎更改.. 128

6.4.2  坐标轴“倒序”:有些数据越大越差.. 128

6.4.3  绝对值刻度与百分位刻度.. 129

6.4.4  从“等距坐标轴”到“不等距坐标轴”.. 130

6.4.5  棒棒糖图:虚拟双轴.. 131

6.5  以条形图为底色的进阶与高级图形.. 132

6.5.1  靶心图:在排序基础上增加对比关系.. 132

6.5.2  “进度条”:展示单一对比关系的条形图变种.. 134

6.5.3  结构化分析实例:条形图的“高级化”.. 137

第7章  时间序列与序列相关性.. 139

7.1  时间序列的构成.. 139

7.2  折线图的多种延伸形式.. 140

7.2.1  时间的层次与连续/离散属性.. 140

7.2.2  并排折线图和矩阵折线图.. 142

7.2.4  多维度折线图、堆叠面积图、百分比堆叠面积图.. 143

7.2.3  包含时序的柱状图与结构化分析.. 146

7.3  包含多个度量的时间序列.. 148

7.3.1  时间序列中的双轴与柱状图.. 148

7.3.2  双轴的改变:柱状图与折线图的结合.. 149

7.3.3  基于公共基准的多轴合并.. 150

7.4  时间序列与条形图的结合:甘特图及其变种.. 151

7.4.1  标准甘特图:沿着连续日期延伸.. 151

7.4.2  股票蜡烛图:两个甘特图的重叠.. 152

7.4.3  跨度图:“伪装的甘特图样式”.. 154

7.4.4  阶梯图:以阶梯方式表达“跨度”.. 156

7.5  日期的高级转化:绝对日期与相对日期.. 158

7.5.1  原理:何为绝对和相对日期轴.. 158

7.5.2  “公共基准”案例:产品在不同时间段的业绩对比.. 159

7.5.3  “公共基准”案例:客户复购分析.. 162

7.6  时序分析中度量的处理与高级图形.. 165

7.6.1  聚合度量的累计汇总处理.. 165

7.6.2  绝对值与同比双轴图:同比或环比的比率.. 166

7.6.3  排序图:绝对值转化为相对排序.. 167

7.6.4  高级案例:地平线图——借助高级计算处理度量.. 169

7.7  坡面图:次序字段的前后变化.. 173

7.8  在趋势中增加对比关系:双折线增加阴影区.. 174

第8章  占比(部分与总体占比).. 178

8.1  占比问题类型与饼图.. 178

8.2  树状图:占比与层次关系.. 180

8.3  初级:饼图作为辅助图形查看结构.. 183

8.4  中级:结合计算自定义分组及其占比.. 185

8.4.1  行级别分组:使用组和行级别计算自定义分组.. 185

8.4.2  特定层次的分组:使用集和高级计算动态分组.. 186

8.5  中级:使用多种方法展示类别的占比.. 188

8.5.1  方法一:使用“隐藏”功能分析单一类别占比.. 188

8.5.2  方法二:使用“行级别计算”分析单一类别占比.. 189

8.5.3  方法三:使用“筛选和高级计算”分析单一类别占比.. 190

8.6  高级图形:环形图、旭日图、南丁格尔玫瑰图.. 191

8.6.1  环形图:最简单的双层次结构.. 191

8.6.2  旭日图:双层占比.. 192

8.6.3  南丁格尔玫瑰图及个人建议.. 193

第9章  文本表及其延伸形式.. 195

9.1  文本表的关键场景:最高聚合与“总分结构”.. 195

9.2  交叉表的优势与推荐场景.. 197

9.3  让交叉表更实用:增加可视化修饰的方法.. 199

9.3.1  典型交叉表的样式与说明.. 199

9.3.2  简易法:基于度量名称的颜色修饰.. 200

9.3.3  简易法:基于单一度量的突出显示表.. 202

9.3.4  高级法:基于坐标轴和标记的“文本自定义”.. 203

9.3.5  高级法:使用自定义字段逻辑控制形状或其他.. 207

9.4  让简单丰富起来:善用工具提示与仪表板互动.. 208

9.5  文字云与气泡图:不常使用和不推荐的图形.. 210

9.6  总结:用好“三图一表”,揭开业务面纱.. 211

第10章  大数据的关键:超越个体、走向分布.. 213

10.1  从个体分析到分布分析.. 213

10.2  直方图:分布分析第一图.. 214

10.2.1  简单直方图:使用数据桶(bin)在数据表行级别创建直方图.. 215

10.2.2  高级直方图:使用高级聚合计算和数据桶生成直方图区间.. 216

10.2.3  基于RFM模型的客户分布分析.. 218

10.3  箱线图:离散分布与异常发现.. 220

10.4  帕累托图:特殊的头部集中分布.. 222

10.4.1  横轴百分位处理:将离散维度序列转化为连续百分位坐标轴.. 223

10.4.2  纵轴累计百分比处理:连续度量的百分位转化.. 223

10.4.3  空间分类处理:帕累托图的颜色分类和互动筛选.. 224

10.5  自定义分布分析:参考线与参考分布模型.. 226

10.5.1  使用多条“百分比”参考线构建区间.. 227

10.5.2  自定义百分位分布区间.. 228

10.5.3  分位数分布区间.. 229

10.5.4  标准差分布与“质量控制图”和“六西格玛区间”.. 229

第11章  超越经验,走向探索:广义相关性分析.. 233

相关性(correlation)是描述多个变量(variables)之间关系的指标。狭义的相关性指特定分类下一个度量与另一个度量的相关程度,比如温度与冰激凌销售量的相关性、城市人口与房价涨跌的相关性等;广义的相关性还包括多个分类字段或者分类字段与度量字段的相关性,比如层次关系(比如父母与子女)、流向关系(比如央行发行货币数量到各个渠道的流向)等。其中,前者是重点。
最常见的描述相关性的图形是散点图,这也是业务分析师必须熟练掌握的“相关性”图形。

11.1  散点图与参考分区:波士顿矩阵.. 233

11.2  中级:散点图矩阵和“散点图松散化”.. 236

11.3  高级:用皮尔逊系数生成相关值矩阵.. 240

11.4  层次关系:多个维度字段之间的结构关系.. 243

11.5  次序字段的流向分析:漏斗图和桑基图.. 246

11.5.1  漏斗图(上):基于次序字段的变化.. 246

11.5.2  漏斗图(下):基于度量值的变化.. 249

11.5.3  桑基图:多阶段的流向变化(简要).. 251

11.6  瀑布图:多个数值的依赖关系.. 252

11.7  雷达图:多角度的综合关系.. 255

11.8  相关性或因果关系:基于空间的流行病学案例.. 258

第12章  特殊的分布:地理空间分析.. 262

地理分析可以视为分布分析的特殊形式——以经纬度为空间的数据点分布及其关系。本章沿用此前的分层绘制方法,介绍地理空间分析的常见形式,主要如下。
- 地理空间与地理图层。
- 点图和热力图。
- 符号地图和背景地图。
- “化学元素周期表”与自定义地理空间。
- 路径地图和流向地图。
- 自定义空间坐标和组合图形。

12.1  地理空间和地理图层.. 263

12.2  点图与热力图:地理空间分布.. 264

12.3  符号地图与填充地图.. 266

12.4  自定义地理空间与空间矩阵.. 269

12.4.1  为数据点增加缓冲区.. 269

12.4.2  自定义地理空间:“化学元素周期表”.. 270

12.4.3  高级案例:使用表计算自定义空间矩阵.. 271

12.5  路径地图:两种数据结构,两种绘制方式.. 273

12.6  地理空间图形的说明.. 274

第3篇  超越:从可视化分析走向结构化洞察

  • 按照问题解析方法(样本范围、问题描述和问题答案),本书还没有介绍“样本控制”,而这是可视化模型化和决策假设验证的关键构成。没有它,可视化会像躺在墙上的油画,再好看也不及花园里飞舞的蝴蝶。借助筛选与交互,敏捷BI在深刻的基础上增加了生动,进一步提高了探索分析的效率。
  • 问题分析与7种基本图形样式及其延伸形式都熟练之后,接下来的路在哪里?无限美好在业务,业务的关键是假设验证和探索分析,前者依赖交互,后者依赖结构化分析。这是本书最终的落脚点。
  • 结构化分析,就是“多面向、多角度”分析问题。通过在当前问题中引用其他层次的聚合,实现了两个层次的结构化洞察。结构化分析的简单形式是相互独立的交互,高级形式是多合一的高级计算。
  • 最终,笔者冒昧地为读者提供一下自己的学习经验与建议,希望更多的业务分析师借助敏捷BI工具在职业之路上更上一层楼。

第13章  样本控制与假设验证:交互.. 279

13.1  在Excel、SQL、Tableau中构建分析样本.. 279

13.1.1  Excel与SQL中的静态筛选.. 279

13.1.2  在Tableau中创建筛选的基本方法.. 281

13.2  样本控制的形式与归类.. 282

13.2.1  快速筛选器的常见形式与优先级.. 282

13.2.2  关联筛选器和共用筛选器.. 285

13.3  基于中间变量的高级样本控制.. 286

13.4  样本控制的高级形式:指定层次的条件筛选.. 289

13.4.1  指定层次条件筛选的3种方式.. 289

13.4.2  购物篮关联分析的样本解读——量化筛选条件.. 290

13.5  性能:逻辑计算位置对筛选的影响.. 293

13.5.1  筛选的本质与筛选的标准位置.. 293

13.5.2  在聚合过程中间接筛选的“非标准操作”及其代价.. 295

13.5.3  不同筛选方法的高级分类与适用场景.. 296

第14章  从表象到本质:结构化分析是业务可视化分析的灵魂.. 299

14.1  结构化分析是通往业务探索的必由之路.. 299

14.1.1  结构化分析是业务复杂性的要求.. 300

14.1.2  结构化分析的基本形式.. 301

14.2  可视化分析中常见的层次及其组合关系.. 303

14.2.1  行级别层次、问题层次及聚合度、颗粒度.. 303

14.2.2  结构化分析的基本类型.. 306

14.3  结构化分析的几种典型场景和案例.. 306

14.3.1  交易的利润结构分析:主视图引入行级别层次的聚合.. 306

14.3.2  订单的利润结构分析:主视图引入独立层次的聚合.. 308

14.3.3  客户矩阵分析:当前视图层次引入独立层次的聚合.. 310

14.3.4  环形图:当前视图层次引入更高聚合度层次的聚合.. 311

14.4  结构化分析的高级形式:嵌套LOD的多遍聚合.. 314

14.4.1  客户购买力:使用嵌套LOD完成多遍聚合.. 314

14.5  通用的层次分析方法.. 317

14.5.1  结构化分析与“问题结构” 317

14.5.2  层次分析的4个步骤.. 318

14.6  和结构化分析相反的“努力”方法.. 319

14.6.1  “形式大于内容”的图形.. 319

14.6.2  缺乏代表性和意义的指标.. 322

14.6.3  缺乏互动性的图表.. 322

14.6.4  不符合直觉的设计.. 323

第15章  归来:成为优秀的业务分析师的个人建议.. 324

——点击可以访问电子原文

15.1  好奇、探索和持续学习的欲望,是前进的源泉.. 324

15.2  学习理解原理,方能举一反三、事半功倍.. 325

15.3  深入理解业务,方能立于不败之地.. 326

15.4  分析要从明细开始,过度整理会远离真相.. 327

15.6  循序渐进,不要好高骛远.. 329

后记&参考资料.. 331

《喜乐君2021《业务可视化分析:从问题到图形的Tableau方法》》有3个想法

  1. Pingback: 喜乐君-图书介绍 – 喜乐君

  2. Pingback: 喜乐君-图书介绍-喜乐君-敏捷BI布道师

  3. Pingback: 喜乐君-图书介绍与分享计划-喜乐君-敏捷BI布道师

评论已关闭。

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading