跳至正文

【產品對比】非對稱之戰:Tableau VS.帆软FINE BI

Apr, 2023

作為成立二十年的老牌BI公司,目前唯一能和Tableau產品“比肩而立”的,唯有微軟Power BI(2015年整合成立);但二者又並非“你死我活”的同質化競爭,而是各有側重,在各自的方向上做到了最優(可以參考 Tableau VS. Power BI系列文章,參考1)。迄今為止,沒有任何一家國產BI的綜合功能能和上述二者比肩,甚至難言“望其項背”;當然,市面上也有競爭者急切地趕超、努力“登堂入室”。

喜樂君寫下這篇對比文章,一方面是借此幫助理解不斷階段、不同架構的工具之間的差異,另一方面是幫更多人避免市面上某些市場化言論的誤導。“桃李不言、下自成蹊”,好產品不需要言過其實的推薦,大肆宣揚的背後則往往暗藏玄機。

2019年,喜樂君曾寫過兩篇Tableau對比帆軟的文章(Tableau 2019 VS FineBI5.0),時隔三年,FINE BI6.0姍姍來遲,Tableau全球易幟Salesforce,中國區域取消直營、銷售則易手Software One和阿裏(參考2)。在這個時間點,基於過去多年專案實踐、數據諮詢的經驗,喜樂君想更加深入地對比二者的差異,幫助更多企業做出明智的、符合當前階段的選擇。

⚠️“帆軟”是一個企業名稱,其中包含Fine Report,Fine BI、簡道雲、九數雲等多個數據類產品(參考3),本文選擇比較對象為“Fine BI”(包含數據準備、可視化、儀表板等功能,包含伺服器端),重點與Tableau Desktop(及Server伺服器,參考4)對比。部分內容會涉及到Power BI產品。

⚠️本文未經Tableau帆軟,或其他利益相關者審定;未經允許,不得用於商業目的,不得拷貝至內部平台。

一、以終為始:企業到底需要怎樣的分析平臺?

產品對比的主要目的,是輔助企業或個人用戶做出適合自己的工具選擇。產品只有差異化特色,既無好壞,更無絕對的第一和第二;但每個企業和個人卻又自己的成長階段,有自己的需求和使命。因此,識別自己的需求,明確企業所處的數位化(數位化)階段,有助於做出明智的選擇。

從企業數據化階段來看,企業存在如下的幾個階段,不同階段,企業需要的數據化工具不同。

  • “傳統企業”:“傳統”一詞和行業無關,指業務不線上、數據難以被完整、準確、及時記錄的“落後狀態”。數據Data依然存在,只是以紙質、零星軟體平臺的方式存在,無法被直接使用。
  • “企業資訊化“:Information資訊是DATA有效整合的形態,這個階段企業的典型特徵是軟體平臺眾多,最典型的是ERP、MES、CRM等圍繞生產、客戶的數據採集系統,它們與業務流程直接相關,是數據的收集者和整理者;分析側重於Report、PPT而非可視化Dashboard,更鮮少探索性問題分析。
  • “敏捷BI”階段:企業不在滿足於Report、PPT,而側重於從數據中探索業務問題,這個階段的典型特徵是數據倉庫(Data Warehouse)出現,業務系統與分析系統二者分離,同時,業務用戶日漸成為分析主力。
  • “數位化企業”:數據成為企業決策的關鍵環節,從上而下,數據驅動的企業文化日漸形成,並推動構建以數據為中心的業務模式,比如從傳統的產品銷售到訂閱。

從上述的階段分析來看,不同的企業階段,對應不同的工具需求,對應不同的員工能力。敏捷BI是business intelligence,而非僅僅是business information,基於這樣的認知,BI輔助決策需要包含如下的功能部分:

  • “數據倉庫”:外部數據倉庫,或者BI平臺自建的Data Warehouse,正如Kimball 和Ross兩位大師在Building the Data Warehouse一書中所宣導,DW/BI Platform才能把數據和分析的價值發揮到最優。
  • 從“數據”到“數據服務”:雖然有了DW,但是數據資料並非就必然是數據服務,企業級的BI平臺,不僅要支持單表的分析,還要支持主題的分析,此時數據模型、指標定義就成為關鍵,缺乏這個邏輯層,就難以實現數據準備和業務分析的分離,會制約長期的分析效率。在這個環節,工具的性能是常見的瓶頸。
  • 敏捷分析:面向業務用戶、人人可用的分析工具,是數據資產轉化為價值決策的關鍵;分析工具應該支持多種可視化樣式、便捷的儀錶板製作、綜合的交互功能、多種函數特別是高級分析函數,分析結果支持訂閱、通知、下載等多種服務方式。在這個環節,圖形設計方式和計算是常見的瓶頸。
  • 敏捷ETL:對於數據品質較好,或者IT部門支持充分的企業而言,面向業務的敏捷ETL是錦上添花;但是對於對於數據品質欠佳的企業而言,敏捷ETL更像是及時雨,它有助於彌補數據品質的不足。

基於上述的功能板塊,企業首先要實現建立數據採集、數據分析相互獨立的分析框架,參考如下的架構所示,有助於理解“大數據可視化分析平臺”在企業數據架構中的總體位置。

基於這樣的架構,再把DW/BI平臺進一步展開為更多的邏輯層次,其中的關鍵是數據服務(數據資料和通用計算)、可視化分析內容、分析服務。每個部分都可以進一步展開更多的內容,上下貫通、左右相連,共同組成大數據分析平臺。如下所示。

對於不同階段的企業而言,這個架構的作用會有所不同,傳統企業會認為過於“前沿”,它們的首要目標是數據採集,為了滿足一定的分析功能,它們會選擇“填報類型工具”做補充,並且強調Excel等工具在數據治理中的關鍵作用。而以IT為主導的資訊化建設之下,IT會選擇簡單可視化工具作為補充,特別是部署簡單、方便開發、性能穩定、便於嵌入的產品,像Smart BI。

而對於數據品質較好的企業,才會對獨立的BI分析工具有所需求,並且期望分析從IT團隊轉向業務部門——這是business information和business intelligence 的重大區別。同時,這就要求BI工具足夠便捷,學習成本過高則業務用戶難以普及(比如Power BI),同時功能要足夠強大,解決紛繁複雜、靈活多變的探索性問題需求。

當然,高階段總是可以向下相容的,但脫離企業階段的工具往往難以發揮最大的價值,而且對用戶提出了過高的要求。這也是選擇工具時不可不慎的地方。明智的企業應該選擇略高於當前階段的工具,而且借助於優秀的軟體工具、卓越的諮詢顧問實現跨越,而非飛躍。

二、非對稱之戰:Tableau和FineBI

雖然Tableau在被Salesforce收購後,發展態勢有所減緩,但目前還沒有工具能撼動它在業務用戶中形成的“敏捷自助分析”的行業地位。因此,Tableau和Fine BI的比較,註定是一場不對稱的較量,在一開始勝負既分;不過,接下來的比較,依然有助於用戶瞭解BI的能力組合,從而評估自己的所處階段,和所需的工具。

1、數據接入和數據建模

數據連接是分析的起點,看似簡單,實則關聯著整個分析世界。它的左側是數據準備(輸出高標準的數據表),右側是數據模型(提供跨單表的主題分析);同一個計算在兩側也會展現為不同的樣式,這既是ETL和可視化的分界線,也是Power BI中“計算列”和“度量值”的分界線。

這裏先僅僅說右側的部分,按照複雜程度,至少包含單表連接、多表合併、多表匹配、數據模型四個環節。其中前面兩個是所有工具的通用基礎,後者兩個是工具之間的差異化所在。

從功能的位置和設置來看,Fine Bi6.0更像Power Pivot,它們都把行級別的數據合併(並集/上下合併,連接/左右合併)單獨處理,而把多表關係置於分析之中,而不像Tableau可以在在一個介面中以邏輯層、物理層整合在一起。

功能/工具TableauPower BIFINE BI6.0備註
1、單表連接/自定義SQL☑️☑️☑️入門必備
2、多表合併(Union/JOIN)☑️☑️ Pivot☑️自助數據 
3、多表關係(relate)✅✅
可多事實表
✅✅✅Pivot
多事實表
共用維度表
✅ 關聯視圖 
4、包含合併和關係的Model✅✅不是所有的關係
默認是數據模型

1)基本功能對比

Fine BI 6.0的“關聯視圖”提供了上述多表關係的設置選項,不過官方說明該功能主要用於“許可權控制”(也許是我理解了這個文檔,參考2),這句話誤解了“關係/關聯”在數據分析中的重要性。當然,這也許意味著,它可能不能很好地支持多個事實表;同時,如果你要構建一個包含“行級別合併、多表關聯”的數據模型,可能也很難達到你的預期。(當然,我會等待帆軟的官方說明)

上述圖片來自帆軟網站

真正的數據模型,不僅僅是支持多事實表的多種合併、關聯方式,而且要考慮業務需求,在最為詳細級別的級別、在業務上有意義的級別建立關係,而且可以是多事實表的關聯關係。所以,數據關係(帆軟稱之為關聯)只是“數據模型”的前提,但並非等價。

在Tableau中,數據關係向下相容行級別的數據合併,二者構成了“物理層-邏輯層”的層次關係;這個過程可以在Desktop的數據源階段完成,不像Power BI一樣需要跳轉到Power Pivot中單獨完成(這裏先不說Pivot使用了單獨的M語言)。

當然,數據合併並非僅僅上面提到的幾種,其實數據合併是一個龐大的功能組合。喜樂君在《數據可視化分析2.0》一書中總結了“數據合併分類矩陣”的方式,如下所示。在這裏,明細表級別的合併是入門功能,為所有工具普遍支持(包括excel);問題或者說聚合級別的匹配,以及數據模型的支持度則是BI工具差異化所在。其中難點在於關係的支持度和向下相容程度。

2)Fine BI中缺失的關係場景

隨著關係的類型越來越細化,工具之間的差異就會暴露無疑。包括數據源的類型、連接的方式(即時/提取),又都會對數據關係的設置構成明顯的影響。Fine BI甚至對與Excel合併的即時資料庫有一定要求(參考3)。

  • 按照位置區分,關係又可以分為數據源階段的穩定關係(relationship)和問題階段的臨時關係兩種情景。
  • 按照數據表特徵區分,關係又可以分為事實表+維度表的簡單關係,和多事實表的高級關係。

在部分業務問題中,我們甚至會遇到臨時性的關係,比如銷售過程轉化分析中完成“不同年月的轉化率”,此時需要從兩個表中獲得不同日期對應的的不同聚合。這種既臨時性,又聚合後關聯的匹配,就對產品提出了更高的要求。在Tableau中,可以使用混合(blend),而在power BI,則有“非活動關係”可供借鑒。

喜樂君圖書附圖:臨時混合關係實例——兩個事實表完成KPI達成分析

網路圖片:采悟(認識Power BI中的非活動關係和USERELATIONSHIP函數)

從上面的介紹可以看出,目前Tableau在數據關係模型最為友好,臨時關係也用混合的方式變得異常友好,當然也存在無法使用共用維度等問題(已經列在開發計畫);Power BI的關係模型則最為專業,甚至支持環形關係,適合構建宏大的主題分析,當然這也意味著幾乎只有IT專業用戶才能完全駕馭。

相比之下,Fine BI6.0只是解決了之前沒有的“關係匹配”問題,但在多事實表關係、從關係到模型、臨時關係、數據支持度等多個方面,都還存在改進的空間。這也意味著,它目前很難被用於構建宏大的“數據主題模型”,這就限制了從數據到數據服務(data service)的支持度。一個完整的數據模型,既要高屋建瓴地支持指定詳細級別的預先匹配,又要向下相容行級別的數據合併,還要考慮一些“模型”之外的臨時性關係。如下所示,喜樂君繪製了一個通用的關係模型,包含了數據合併、數據模型的常見概念。

當然,Tableau在數據模型方面也有不足,比如不支持“網狀結構”,暫不支持“共用維度”(shared dimension),也不像DAX那麼“高級”(可以在代碼中任意引用)。不過,面向業務用戶,它已經做到了最佳的平衡,高於、但又沒有高於太多業務用戶的理解能力和業務場景。

2、數據可視化和儀錶板分析

在數據接入或構建必要的模型之後,就進入了可視化分析的範圍。可視化繪製的易用性(50%)、交互和儀錶板探索(35%)、高級圖示的支持度(15%)就成為主要的考量因素。

首先,我想強調的是,業務分析中可視化圖形不是“因人而異”的主觀設計,也不是追求“形式主義”的設計美學,而是追求以最佳的可視化樣式幫助業務領導獲得資訊、做出判斷。這個過程的背後是心理學、決策體系,是有原理可循的科學。所以,基本上可以認為,可視化圖表的最佳樣式、框架基本是客觀的、預設的;分析師只能在這個框架基礎上做補充、完善。

舉個簡單的例子,要分析“產品的銷售額”,基於單一的銷售額字段,首先要考慮的就是條形圖,如果產品非常多就要考慮分佈,這可以視為是確定性的思考範式;如果貿然用餅圖、氣泡圖等,都會讓展現走向“形式”,而非業務分析。

其次,業務可視化有兩個重點:從問題到最佳可視化圖形、多個可視化圖形的交互設計。

只有最佳的可視化圖形,才能順應觀眾視覺上的“潛意識屬性“;避免像3D、陰影、複雜動畫等不合理形式帶來的干擾。而在紛繁複雜的業務探索分析面前,交互賦予可視化儀錶板以靈魂,最常見的交互是篩選、高亮,輔助性的有跳轉、導航、下載等,高級形態則是借助變數(參數,或集合,或數組,或參數表)而來的高級交互,代表性的有Tableau中的參數動作(parameter action)、集動作(set action)和動態對象可見性(dynamic zone visibility)。

基於這樣的考慮,我們來看一下“可視化領域的梵高”——Tableau,和國產BI的代表產品——Fine BI的對比。

1)可視化的設計架構(Tableau VS. Others BI)

Tableau最以為傲的可視化架構,來自於斯坦福大學幾十年前的Polaris專案,其核心內容曾發表在communications of the acm等多篇專業期刊中。二十多年的中國,還鮮有BI產品能用類似的科學理論去支撐自己的產品設計,更多的是“拿來主義”的開源組件,和錦上添花的“自研演算法”。在可視化BI領域,由於Tableau如此卓越、超前的設計理念,很多人甚至說,世界上只有兩種BI:Tableau BI 和 others BI。瞭解背後的原理,你會知道此言雖然“過譽之嫌”,但也印證了Tableau可視化的卓越能力。

在這篇論文中,作者介紹了Tableau原型的數學基礎,並根據字段的維度/度量、離散/連續/次序特徵解釋了“通用可視化框架”的可能性框架,並用拖拽的可視化介面實現了用戶的“所見即所得”。Tableau20年後的今天,這個介面只有必要的調整,確無本質的變化;它的持久生命力,就在於Tableau對字段的特徵分類上,特別是連續/離散的分類。

相比之下,不管是Fine BI,還是Power BI,甚至於觀遠、Qlik,都沒有像Tableau一樣對字段設置默認的連續、離散屬性,這就意味著,字段的顯示樣式難以被“預設”。可視化的基礎上笛卡爾空間,笛卡爾空間依賴於坐標軸,坐標軸基於連續性的字段才有意義。

基於這樣的字段屬性,不管是拖拽Tableau中的字段,還是雙擊、多選,Tableau都會根據字段特徵推薦可用圖形和最佳圖形,背後是“問題——字段屬性——推薦可視化”的技術邏輯。在“智能推薦”(show me)中,只有聊聊十幾種圖形,既是對業務應用的抽象概括,也是Tableau自動推薦圖形專利的絕佳應用。

如下所示,Fine BI6.0和很多BI工具一樣,列舉了很多種圖示類型,包括常見的條形圖、餅圖、折線圖,也包括一些業務中使用較少的雷達圖、桑基圖、漏斗圖。從可視化的繪製來看,Fine BI既借鑒了Tableau最為經典的多層“標記”設計理念(為每個度量軸對應一個“標記”),又使用了類似於Power BI的初始範本路線,因此不同的圖形會看到不同的設置選擇題。同時,還強化了帆軟最為擅長的“報表類圖表”,可以是說融合了多個產品的特色。

基於上述的對比會發現,對於不對字段做連續、離散分類的BI工具而言,“構建可視化”之前就需要增加人工的選擇環節,變成了“問題及其字段——人工選擇合適的圖形——在可視化框架中填入字段”。為了提高這個“人工選擇”的效率,各類工具就開始內置多種圖形模版,這在方便業務用戶的同時,也讓工具失去了通用性和靈活性——無法完成超過預設模版的其他圖示。為了彌補這個不足,像Power BI就會開發擴展,並運行用戶上傳圖表模版。

可見,基於字段特徵的智能推薦,和基於預設模版的選擇設置,代表了兩條可視化邏輯、兩類BI工具範式,各有利弊、各有千秋。對於業務用戶而言,Tableau的方式智能化程度高、靈活易用、可視化圖表沒有“上限”,但對字段理解要求高、容易讓新用戶無所適從、高級圖表難以實現;Fine BI和Power BI的方式更“傻瓜式”、對高級圖表支持性好,但也缺乏靈活性、學習成本高。

過去多年的業務實踐讓我越來越感覺到,敏捷業務分析需要的是在易用性和專業性之間保持平衡的優秀工具,固定的可視化圖表適合於解釋性分析,而基於字段特徵、可視化框架的方式適合於探索性分析——這正是敏捷業務分析的精髓。這也是為什麼,Tableau的易用性“一直被模仿,卻從未被超越”,雖然它入門容易,精深很難,但基於嚴謹科學的經典架構,有助於培養通識性的分析方法。而基於“可視化範本”的BI工具,看似選擇多樣,但“多樣”的背後阻礙了通用分析方法的形成,“更多選擇”也讓很多人走向炫酷表達,偏離了業務分析的初心。

在可視化圖形上,Tableau的思路與麥肯錫“用圖表說話”的邏輯類似,都是“從問題類型走向可視化圖形類型”,依據就在問題的關鍵字和字段特徵之中。這也是Tableau只推薦少量關鍵可視化圖表的原因;當然,考慮到Tableau原理性的可視化框架,它的可視化樣式“沒有上限”,高級分析師幾乎可以設計任何想要的可視化樣式(不管是帕累托、桑基圖、多層環形圖還是“南丁格爾玫瑰圖”,都可以在Tableau Public中找到對應)。因此,可以把Tableau的可視化理念總結為如下幾點:

  • 從問題到圖形的Tableau方法:“三圖一表”的簡單圖表,分佈、相關性的中級圖表,借助計算而來的高級圖示
  • 借助於標記、坐標軸、參考線、交互、計算等,從基本可視化到中高級可視化
  • 借助於多種交互功能,以儀錶板、故事的方式展現業務主題

2)儀錶板交互設計

Tableau中“工作表/圖表——儀錶板——故事”的三層敘述方式由來已久,算是業內較為通用的框架,不過BI領域普遍使用的是“工作表/圖表——儀錶板”的雙層框架,不管是帆軟、觀遠,還是Power BI。隨著Fine BI6.0對產品結構做出了兩大調整(數據源-內容,工作表-儀錶板),它和Tableau在儀錶板組合方面的差距在縮小,但在交互方面較少有“幾座山”的遙遠距離。

我們先來看一下Fine BI6.0中自帶的“圖表實用場景”儀錶板,如下所示。下圖左側顯示了儀錶板中可用的組件類型(圖表、過濾組件、其他),右側每個圖表旁邊則有常見的設置選項。拖入的組件默認“拼接”,具有自動磁吸功能,也可以改為“懸浮”。

工作表的關鍵是如何選擇可視化圖形類型,儀錶板的關鍵則是圖表、組件的佈局和交互。

Fine BI的組件相對簡單,默認分為三類:可視化圖表組件、過濾組件、其他(tab組件、圖片、URL頁面)。Fine BI的儀錶板类似Power BI的頁面,它們都沒有“容器類型”的組件(像Tableau的水平、垂直),設計師難以預設佈局,拖拽組合的體驗很難說優秀;相比Power BI,Fine BI的磁貼提示也不夠明顯,很容易讓新用戶“抓狂”。

相比之下,Tableau既顯著地強調了“平鋪”和“浮動”兩類佈局方式——平鋪始終占滿整個畫布,哪怕只有一個工作表;浮動則完全自定義,適合於草稿設計;又區分了“容器對象”和“內容對象”——內容對象和篩選對象可以非常方便地置於容器之中,這種“容器-對象”的雙層佈局在複雜頁面中非常實用。

當然,Fine BI和Tableau在儀錶板方面,最大的差距在“交互”。

在上面的實例儀錶板中,我們發現Fine BI只有過濾、聯動、導出Excel、跳轉等極其有限的交互功能,再把參數也視為儀錶板交互功能之一(雖然我找了半天也沒發現如何直接把參數添加到儀錶板),我們發現依然是極其單薄的。

在儀錶板交互中,最基本的交互是篩選(針對的是字段),其次是導航、跳轉、下載(通常針對的是儀錶板或單個工作表),不同BI工具在後者上的表現能力大同小異,能力差異體現在篩選上。如同小學計算可以直接口算、大學計算需要借用變數甚至方程求解一樣,交互也可以按照是否依賴於“變數”(variables)分為基本交互和高級交互兩大類。如下所示:

在Tableau中,用戶可以極其方便地創建篩選、設置篩選,並通過“操作”自定義篩選的起點、終點、篩選字段及交互方式,同樣的深度自定義卻沒有出現在Fine BI產品中。更遠的距離還在於,分析師能否在儀錶板中方便的引用單值參數(parameter)和多值參數(集set),並做深度的自定義,這在標杆分析、基準對比等案例中非常重要。類似的案例,我任意就可以講解十個之多,借助於敏捷的交互能力,探索性分析才會成為現實。

當然,基於變數的交互要想變成實現,必須依賴於計算的支持。Fine BI在交互上的孱弱,與產品的函數能力弱有直接的關係,特別是窗口函數和組合函數等包含聚合的高級函數。

3、計算體系和分析深度

說到計算,BI領域的兩大高峰是主打易用、通用路線的Tableau計算,和以專業、高深見長的Dax語言(Power BI)。Fine BI的計算,目前還卡在基本計算和高級計算之間,並未找到適合自己道路的計算體系。

工具的計算能力基本可以通過內置函數(built-in functions)體現,函數是最優演算法、最優路徑的程式固化,實現了產品經理和軟體工程師對分析的理解。在DAX中,我們可以看到精湛的表模型和表計算;在Tableau 表計算和LOD計算中,可以看到聚合的二次計算邏輯——這些都是分析計算的精華。

在Fine BI中,我們可以看到如下眾多的函數,但在最重要的高級計算函數上,只有寥寥幾個窗口函數,和6.0版本新發佈的DEF函數。

聚合是分析的本質(喜樂君),直接聚合函數是所有BI工具的標配,但聚合的二次計算則並非被每家BI所支持,就像窗口函數並非適用於所有的資料庫管理軟體一樣(Mysql直到8.0才支持)。

1)表計算(窗口計算/快速計算)對比

聚合的二次計算,代表是合計和排序,SQL可以使用SUM(SUM([measure])) 實現,並用over (partition by A order by B)來精准控制。類似的操作,就是BI工具走向高級的必經之路。

Tableau的表計算(table calculation)脫胎於SQL的窗口函數(window calculation),但又有明顯的改造和升級。它以其易用的配置,眾多的函數,幫助SQL向業務用戶普及了“聚合的二次分析”這一高級場景,幫助業務用戶快速實現同環比、排序、移動平均等以往難以實現的題目。它的改進主要體現在兩個方面:

  • 為窗口函數增加了可視化的操作——通過選擇“計算依據”,直接生成over後的partition by和order by
  • 通過參考線、分佈分析、趨勢線等模型化工具,簡化了表計算的自定義難度

反觀Fine BI,它的“快速計算函數”幾乎走向了SQL和業務用戶的反面,提高、而非簡化了二次分析的難度。這裏以ACC_SUM為例,它的官方說明如下:

ACC_SUM(x_agg(array),range):根據橫縱軸或行列維度添加的字段對指標進行跨行累計的計算。

• 參數說明 第一個參數為用戶計算的指標,該指標必須為聚合函數或聚合指標。 第二個參數range為用戶設置計算的範圍,0為對所有行進行累計,1為對組內所有行進行累計。

• 示例 acc_sum(sum_agg(array),0)用戶橫軸軸拖拽銷售日期(年分組),則該指標計算結果為,根據銷售日期(年)對銷量進行分組匯總,然後根據對所有行從上到下進行累加,獲得每年的累計銷量。

帆軟BI幫助

你會發現,Fine BI借鑒了Power BI的程式化設置方式,而非分Tableau的可視化設置方式,採用0和1控制範圍(partition by),這個邏輯完全阻礙了業務用戶的理解和便捷使用。如下所示,當在橫軸、縱軸中分別有分類字段時,對聚合值的排序就極其容易走向歧途,歸根結底,Fine BI既沒有像Power BI一樣能實現精細化的代碼控制,也沒有像Tableau一樣實現相對/絕對隨意切換的依據調整。這就讓高級的分析函數失去了它應有的靈活性。

如果看函數的體系,你會發現Tableau的表計算體系及其接近於SQL窗口函數,同時做了一些精細化調整,盡可能避免業務用戶的代碼操作,工具應該讓複雜的問題變簡單,這才是敏捷BI應有之義。如下,展示了排序函數的對比。

除此之外,Tableau還有WINDOW系列函數(典型如WINDOW_AVG)、偏移計算函數(LOOKUP/PREVIOUS/FIRST/LAST)、索引函數(INDEX)等多個表計算函數,可以和SQL的SUM(SUM ()) 窗口函數、LAG/LEAD/ROW_NUMBER等多個函數對應,這種繼承既降低了工具之間的轉換成本,也確保了理解上的通用性。

2)LOD運算式VS. DEF運算式

DEF運算式是Fine BI6.0新增加的高級函數(應該是取DEFINE之義),旨在實現“指定粒度的聚合”。雖然語法看似解決Tableau LOD,其實邏輯上更像DAX語言中的Calculation 和LOD函數的結合體,這種結合就有利有弊。它的運算式如下:


DEF (聚合, [維度1,維度2,…], [過濾條件1, 過濾條件2,…])

FINE BI6.0


上述的計算,對滿足過濾條件下的明細行,計算指定維度組合的聚合計算。比如DEF(sum_agg(購買數量), [產品], [是否會員 = “是” ]),可以計算會員在產品分組下的購買數量。 第二、三個參數可以缺省。

在這個DEF運算式中,你可以看到LOD和DAX CALCULATE兩類頂級運算式的影子。

  • Tableau LOD運算式:{FIXED [產品] : SUM(購買數量) }
  • DAX CALCULATE運算式: CALCULATE( SUM(購買數量) , FILTER( [是否會員] = “是” ) }

在LOD中,篩選條件需要嵌入SUM之中,或者在外部添加上下文篩選器,它用計算優先順序(Operation Orders)解決過濾過濾的問題;而在CALCULATE中,它只有聚合和條件兩個部分,維度條件可以直接放在視圖中,或者寫入FIlter之中。

從結構上,DEF定義運算式之時,同時採用了兩家頂級BI的最佳運算式的特徵,然後努力融為一體,正因為此,帆軟的市場夥伴應該會說,“DEF既比LOD……,又比DAX……”。

問題也處在這裏,1+1並不總是大於2,特別是不同質的物種拼湊出來的高概率“不倫不類”,最終失去了它最重要的特色。DEF運算式追求功能上的完整性的同時,也提高了用戶的使用難度,嚴重制約了底層的計算性能。一旦數據量篩選,或者計算邏輯略微複雜,計算性能就變成顯著的問題。

所以,在我看來,FINE BI的DEF運算式,更像是農民起義,是對一次參考、借鑒的“草創”,一次高級分析的“衝鋒”,但是限於企業整體的分析理解和水準,還需要很多次的持續努力,才能有所成就。如果要真正地實現對兩大運算式的融合,Fine BI至少要彌補如下的短板:

  • 計算的優先順序設定和調整:篩選的本質是計算,計算必有優先次序。Tableau通過功能預設、上下文篩選等方式調整次序;DAX通過計算列、度量值,以及Row Context、FIlter context、上下文轉換(context transform)實現。帆軟中沒有這樣的自定義設定,讓它在複雜問題中,要麼走向邏輯上的複雜,要麼走向性能上的孱弱。
  • 底層模型優化:DAX的Calculate中FILTER並非我們習以為常的篩選條件,它是基於條件的表模型(table model),FINE BI沒有這樣的底層模型,對不符合過濾條件的也會執行同樣的計算。
  • 計算與視圖的關係處理:計算服務於視圖聚合,計算與視圖中已有的維度、過濾條件的關係,是高級計算的難點,當然,背後的本質依然是“計算優先順序”。Tableau的處理邏輯簡單,Power BI的處理邏輯複雜,各有優劣。

4、綜合比較小結

本章從三個視角,重點比較了Fine BI和Tableau的差異,並間接提及了與業內領先、更為相似的Power BI,雖然還有更多的主題、更多的要點做詳盡對比,本文也不在展開,否則就變成了更佳複雜的“技術測評”。

在每個主題,假設以相對最優的產品為基準,我們可以粗略的估計另外兩個產品的相對得分。個人觀點,如下所示。

對比主題FINE BITableauPower BI
數據合併與模型6分
高級關係不足,
模型不足,性能弱
10分(基准)
臨時關係易用
共用維度不足
9分
抽象度高、高可定制,
理解難點高
可視化與儀錶板交互7分
基本圖形和高級圖形
靈活性差、交互功能不足
10分(基準)
通用性最好
交互功能齊全
8分
圖表模版豐富
缺乏自動推薦,
參數等高級交互難用
計算和高級分析計算6分
基本計算,高級計算弱
表計算難以控制
DEF計算體系欠佳
9分
表計算易用、LOD強大
缺乏表計算函數(轉ETL )
10分(基準)
計算功能強大、函數齊全
技術要求高、門檻高
設定“基准”的為相對最優

雖然說,沒有一個最優的產品,但是在不同的方向上,總是有相對最優可選,比如IT方向希望的高級、代碼、高度可控、確定性,比如業務方向傾向的易用、靈活、“所見即所得”。Power“向左”,Tableau“向右”,它們都在自己專注的道路上做到了相對最優。Fine BI則希望紮根傳統的Report經驗、借鑒彼此的優勢(特別是Power BI),為中國的數位化客戶提供更易用的選項,希望它在這條路上能保持自己,同時有所“差異化”。

站在業務的角度看,Tableau可以作為“DW/BI+ai”平臺使用,是企業敏捷BI、業務可視化探索的最佳選擇,Fine BI在可視化探索分析、高級計算、數據模型等方面還有欠缺,更適合於對已有數據的總結性分析,生成Report或初中級可視化,或者複雜報表、大屏。對於尚未完成“資訊化”,或者有大量管理數據需要“電子化”的企業,則適合選擇支持填報的Report工具。

三、國產BI,如何走“差異化”路線?

在從多個角度對比了Fine BI相對於Tableau(以及Power BI)的距離之後,我們可以隨之思考:處於不同發展階段的各類企業,到底需要怎樣的“BI工具”?站在“國產BI”的角度則是,在兩大BI巨頭之間,應該走怎樣的“差異化”路線,才能真正賦能數位化轉型路上的企業和個人?

首先,我嘗試從一名業務用戶、一名數據諮詢顧問的角度現身說法,聰明的業務用戶需要的是既能解決當下問題,又能引領自我能力提升的產品。過度迎合客戶而設計的產品,雖然可能是你當下的“優選”,但同時也會早早地決定個人能力的天花板。因此,優秀的敏捷BI應該既簡單易用,又有近乎無限的成長邊際,在專業性和易用性上保持平衡,才有助於幫助用戶建立在職場中的競爭力和職業壁壘。

其次,從企業的角度看,企業追求“投入產出最大化”,軟體、服務和人力都是直接的成本,企業最寶貴的是時間,“用金錢換取時間”是企業的典型策略,所以產品價格不是唯一考量要素,和成本價格足以匹配的產出價值才是關鍵。同時,企業軟體瓶蓋應該考慮相容性,未來企業的數據服務將越來越像財務共用中心,將是一類企業資產中心。

“未來已來“,只有對那些充分理解、並融入數據世界的個人和企業而來,才有可能。在數位化的世界,我們用技術和工具換取了認知和見識,提前看到了其他人看不見的世界和道路,從而實現了領先。作為類似“數據”的邏輯體,“金錢”只是認知能力的邏輯上的“變現”,對於個人、企業都適用的。

從這個角度,回到第一部分的問題:“企業到底需要怎樣的分析平臺”,每個人心中會有差異化的答案,但又具有很多的相似性。這個相似的部分,應該是通用軟體平臺要努力打造的部分;而差異化的部分,則是企業勝出的關鍵點。從企業獲取、整理和利用數據的解讀看,企業數位化需要建立在如下的能力和工具基礎上:

  • 資訊化工具:實現業務線上、管理線上、行為線上,典型如ERP、OA、日誌管理系統。
  • 數據倉庫:視“數據為資產”,需要確保妥善的保存、整理和預先處理,這就是DW/ETL工具的價值。
  • BI平臺:實現數據到決策的“最後一公里”,數據借助於分析轉化為價值決策。

從前往後,技術的複雜性、確定性的東西在減少,業務的抽象程度、主觀性的認知在增加。真正的BI平臺絕非是“填報”和“複雜中國報表”,甚至不是“大屏”——我甚至把這三個功能視為是影響數位化進程的“三大毒瘤”;真正的BI平臺應該側重數據整理、邏輯加工、知識變現,其中的關鍵是敏捷ETL、業務“指標”、可視化探索,它們才是數位化進程的“啟迪者”。

所以,從未來相當長的時間段看,數位化企業需要的是DW/BI一體的平臺,同時要求能賦能客戶的平臺。這些系統化的能力,可以被優秀的企業整合,成為超級服務。在近期的某次客戶培訓中,我就系統介紹了如下的工具能力和關鍵架構:

敏捷分析知識體系(喜樂君)

從這個角度看,我向來不支持那些主打填報、複雜中國報表和大屏的企業,雖然它們看似熱鬧非凡,但它們已經幾近未來的塵埃和過客。我對能認真鑽研業務邏輯、耐心打造精品、為客戶提供諮詢價值的企業則心懷敬畏。它們的代表可能是:

  • SAP/Salesforce:未來的SF如同昨日的SAP,將是雲世界的業務流程重塑者;
  • Excel/Tableau:未來敏捷分析工具的地位,就會像今朝的excel一樣普遍,認知能力和工具齊頭並進。
  • 麥肯錫/IBM:為客戶提升價值,幫助客戶更真切地觸碰未來的諮詢顧問。

相比之下,目前國內優秀的BI企業,要麼過度迎合客戶需求,要麼失去了差異化的思考,走向“拿來主義”和“形式主義”,未能在科學的、客觀的體系框架做出有價值的創新性研究,形成自己的差異化硬實力,因此,我個人對“國產BI”未來幾年的發展依然持比較保留的態度。在這種情況下,充分地利用Tableau、Power BI這類優秀工具,更能保持“數據心智”上的“年輕態”,更能觸碰未來,把握未來。


參考文獻:


了解 喜乐君 的更多信息

订阅后即可通过电子邮件收到最新文章。

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading