本周的工作已经基本结束,考虑到公司在数据整理和数据治理上的阶段性问题,提供Tableau与sap结合的最佳实践指南。
数据分析可以分 数据连接和整理、 业务问题可视化、 分享和决策 三个阶段。
一、数据整理的基本原则
1、理解业务和数据结构是最为关键的前提和条件
- 清晰的知道业务的基本逻辑(长期的积累,暂时不是障碍)
- 清晰的了解业务逻辑所对应的多个数据库表和字段(这是衔接的关键,也是薄弱点)
- 业务的最终旅程,会体现在多个层次的数据表中。
比如VBAK代表订单凭证,而VBAP代表物料交付明细,前者的层次高于后者。
使用冰山的模型思考每个数据表对应的主要结构:
- 最高的聚合,是什么?通常是CEO和总监关心的内容;
- 最高聚合往下钻取一层、两层,是什么?通常是总监和部门领导关系的内容;
- 最低的颗粒度字段是什么?IT关心的,也是分析师分析聚合的来源。
2、问题是分析的开始,而非数据
每一个问题,一定对应最有的数据模型结构;
多个具有层次关系的问题,可以使用一个数据模型结构;
前后两个阶段的问题,往往需要数据连接,最容易出现数据匹配错误。
从问题开始数据的整理,而不能指望建立一个“神奇表”,其中囊括多个分析主题分析所需要的所有数据。——连接的方式取决于分析的目的和角度。
3、凡事要追求简单,但是不要过于简单
简单的SQL能让我们的逻辑更加简化,
Desktop的连接可视化,能帮助我们的思路更加清晰。
最佳的匹配是:使用SQL筛选数据,然后使用tableau做业务连接,并能灵活调整。
SQL简单的背后,是难以验证真伪,暗藏陷阱。
4、为了共享
- 通过desktop可以把整理好的数据单独发布到服务器,供其他人或者业务使用
- 可以单独使用prep和SQL整理 负责需求,Prep的优势是便于验证。
- Prep Builder可以共享片段,相当于可以反复使用几个流程,从而不断提高分析效率。
(附图:选择部分流程,可以另存为文件,或发布到服务器;另一个文件可以插入)
结论:
- 什么时候用SQL?
- 会用SQL
- 起点,简化查询过程;
- 个性化需求,无需移植;
- 什么时候用Prep? 任意一种场景
- 不熟悉SQL,
- 业务流程比较复杂,需要反复的验证
- 后期频繁修改流程
- 一个SQL片段,要用在多个场合。
二、可视化分析的实践
……后续更新
Jan 10, 2020 某SAP客户之后