跳至正文

Tableau基础·如何合并你的数据?理解与逻辑(上)

《Tableau基础·如何合并你的数据?理解与逻辑(上)》有19个想法

  1. Pingback: 【平民数据科学家】从头开始用Tableau – 喜乐君

  2. Pingback: 「Tableau」用通配符,跨工作表建立数据源 – 喜乐君

  3. Pingback: Tableau基础·「如何合并你的数据」之Prep方法篇 – 喜乐君

  4. Pingback: Tableau基础入门之基础概念 – 喜乐君

  5. 文中并集部分,要并集的数据是怎么添加上的?我刚解除,想把每天数据都合并,但是就在添加的时候就没添加上

    1. 并集有手动并集和自动通配符两种方式,推荐使用通配符。 右键连接的下拉菜单又一个 创建并集

  6. Pingback: Tableau 如何合并数据· 终极指南 – 喜乐君

  7. Pingback: 【数据整理】一份思维导图,学完Tableau Prep – 喜乐君

  8. 打扰您了问个小白问题。关于数据混合,好奇者视图和前面的举例区别在哪里呢?如何看出该视图为更低级别的详细表达,我没找到两者的差异在哪里。

    1. 详细级别的高低,在于问题的维度字段。比如“各地区的销售额”,层次高于“各地区、各省份的销售额”,因为前者是由后者聚合而成的。 数据混合的两个数据源,通常数据层次不同,比如一个是 每天的交易明细,另一个却是每个月的销售计划,或者一个是人员薪资明细表,另一个是各部门各月的薪酬计划。

  9. 原来我找了半天,实在是不敢相信Tableau这样还算有名的程序会用join之类如此让人鄙视的数据连接方式而不是天经地义的数据库关系表。(我第一次看到数据库关系表是二十多年前的FoxPro。)
    直到2020.2里面终于加入了表关系,我才确信之前是真的没有。

    1. 你说的对,之前却是一直没有,我不是IT出身,之前都还不知道还有这种方式。对于IT习以为常的技术,Tableau才有 😄 它毕竟之前是从可视化起家的,一路小跑才补上一些高级分析的技术。whatever 现在有了 😄

      1. 我也不是搞IT的,所以我觉得数据库关系图是常识。
        这两个月才开始研究tableau,发现它的数据处理,尤其是建模方面实在缺少很多基础的功能。一开始我以为是自己了解不够,后来越来越确定tableau本来就是没有。

        1. 我这两年一直在用Power BI(也就是自学到勉强会用的水平),所以下意识把Power BI是视为规范的处理方式。我已经在尽量地避免这种先入为主的思维方式,尽量去理解Tableau的思路,但是发现很困难。
          最重要的缺失就是数据关系了吧,Tableau官方发布了一个COVID-19的数据源,主要数据是JHU在GitHub上公布的。JHU的几个csv加起来不过10MB左右,Tableau不顾几十倍的冗余,用prep把它合成一个150MB的csv,这大概就是因为Tableau之前实际上无法处理表关系。另外,这个大表结构混乱不堪,字段命名极端随意,怎么看都是一个新手两分钟的作品,我实在是不愿相信这是一个专业公司对待如此重要的公开数据的方式。

          另外就是LOD和TC。这两种计算都是后加进来的,我理解为是为了弥补规范建模功能上的缺失。怎么说呢,我始终不认为LOD和TC是正确的数据模型的处理方式。
          LOD大部分情况下是汇总后的再汇总(先汇总到人,再对人平均或计数等等)。Power BI的处理方式就是先汇总成一张表,然后再对这张表进行汇总。按LOD的思路,可能会觉得这有点复杂,但是思路非常清晰明确,不管谁都能看懂,而跟外行讲LOD还是挺困难的。
          TC在我看来更是不堪,因为它形式上有一些外挂参数(方向、维度、级别),内涵上甚至没有确定的意义。同样是LOOKUP(*,-1),可能是同比,可能是环比,可能什么都是不是,如果你修改了上下文,经常还会出错。
          我猜测TC的思路,就像Tableau最拿手的图形一样,是可视化的。这对某些简单的情况可能还比较直观,但是无法复用,每次要思考上下文重新设置,如果遇到麻烦点情况,问题就会变得无比复杂。
          Power BI的处理方式是每个计算字段有确定的意义。环比就是环比,要同比就再写一个。好处是不管在什么情况下,这个字段都是这个意思,拿来就用,不需要考虑,也不会出错。
          两相比较,Power BI采取的是一种规范的、结构化的处理思路,而Tableau更随机应变,有时就会显得有点散漫。
          如果整个项目是几个人合作完成的,Power BI可以一个人ETL,一个人处理关系,一个人设计度量,一个人呈现分析。而Tableau则几乎不可能,别人无法预见上下文,也就无法为你的分析准备好度量,你只能一边分析一边自己写度量。
          Tableau这种散漫的性格也影响了它的用户群。我看了很多官网上的案例,几乎都是每画一个图就设计一套度量甚至维度,结果度量列表混乱不堪,我甚至不相信作者本人一段时间后还能看懂。
          上述观点也得到了部分Tableau员工的基本承认,并说近年来也在转型。

          有人说,Power BI是报表工具,Tableau是探索工具,我不认为这是个成功的借口。我看到的客户案例主要也就是仪表板嘛,不就是呈现嘛。探索是个可遇而不可求的事情,而且总得把基本的事情先搞定。
          综上我认为,Tableau从设计之初就没有考虑处理复杂数据集的情况,实际上也难以处理复杂问题。

          1. 观点很好,每个产品的成长基因不同,所擅长的场景也不同。Tableau是数据可视化工具,它擅长单一层次的展现,更像是偏科生。而power 是建立在excel之上的报表工具,它的过度更广泛,对分析师要求也更好。
            如同池塘分上下多层,不同的鱼儿游戏其间。不同的工具确实也 各有所长

          2. 另外我还发现,网络上对Tableau的中文讨论比较少,也没找到靠谱的社群。原来自学Power BI的时候,有什么问题网上都能搜到,Tableau就比较困难。这种情况一直持续到发现你的网站。文章写得太好了,加油!
            方便交换联系方式吗?Baiyssy@Gmail.com 有些问题想请教。谢谢!

        评论已关闭。

        了解 喜乐君 的更多信息

        立即订阅以继续阅读并访问完整档案。

        Continue reading