跳至正文

【中石油】“大数据分析与数据思维”分享全文

前言:21世纪是数据的时代,毋庸置疑;如果我们把它看作是如同石油一样的生产要素,那么谁才能通过它获得财富呢?那些勇于冒险、能提前看到未来的人。
万物即数,财富隐藏在数据的相互关系与逻辑之中;数据决策的过程就是寻找和挖掘财富的过程——数据分析引导有意义的价值和行动。
简言之:“万物即数”,分析即探索,决策即择优。

【后补】在为中石油提供分享前,我临时加入了一个判断每个人决策倾向的特别案例,“如果给你两个按钮的选择权,左侧的按钮按下去获得100万,右侧的按钮按下去,有50%的概率一无所有,50%的概率获得1亿元,你会如何选择?”  

屏幕快照 2019-08-08 上午8.06.40.png

你会如何选择?内心的直觉会告诉你一个答案,不要犹豫,记下来。然后继续看:

我问在场的中石油各市区信息处及业务部门处级领导干部,以及到场的各级信息员,几乎一半的人举手选择左侧的按钮(确定性的100万)。不少人举手在意料之中,但是比例之高超过我的预料。

我们世界中充满了这样的选择题,从概率和分析角度,整个世界的决策都是可以被量化的,决策就是选择,决策就是择优!而数据分析帮助我们作出更优的选择。关键是,很多人不知道这其中的奥秘,因此做出来其实不理性的决定,代价就是损失了很多钱!

其一,用经济学预期价值衡量,左侧按钮价值100万,右侧按钮价值5000万(50%0+50%1亿),很明显,右侧价值是左侧的50倍。

其二,考虑到人的“损失厌恶心理”(100万的潜在损失带来的心理负担需要至少200万的获得才能抵消,即损失和获得心理上不对等),选择右侧按钮的潜在损失是100万,但是收益却是5000万,这种比例是足以抵消心理压力的,因此右侧按钮才是最佳选择。

但是为什么很多人选择左侧按钮?——因为辅助决策的逻辑、理性和常识不足,因此我们都是普通人,没有成为银行家、金融家和政治家。

其三,从分析的角度,我们想要说的更多——在上面的两个选择之外,分析会帮助我们作出更多的选择。比如:

  • 500万把这个选择权卖掉,净赚500万! 很多银行家都会乐意购买你价值5000万的选择权。
  • 还想分享可能的1亿收益?那就300万首付卖掉选择权保留分红权,如果对方中了1亿,分成30%,综合价值300+1500万!
  • 考虑做个商业模式?把这个选择权打包为彩票,2元一张卖2亿张,头等奖1亿!不考虑中间费用,可以赚3亿!放心,老百姓最喜欢这种高杠杆(但是没有希望)的暴富机会,中国农民和无产者那么多,懂得概率的人很少买彩票。
  • 把上面的模式滚雪球,做个上市公司?……
屏幕快照 2019-08-08 上午8.12.52.png

如果你能多想三步、四步、五步……然后用分析计算概率和可能性,你的决策就远远、远远地超过此前的AB选择!只有小孩子和学生才追求唯一的答案,成年人的世界应该学会打破规则。

这就是决策的逻辑,也就是分析的价值!

一个让人心慌、心疼又有诱惑力的开场。接下来,我们就要了解为什么数据如此重要?数据分析如何优化决策过程?如何在企业中实践大数据分析?

20世纪,是人类辉煌的工业文明时期,石油当之无愧的成为了20世纪最重要的生产要素。

21世纪,石油的辉煌还在延续,但数据已经悄然成为新的自然资源,一大批互联网公司开始兴起,市值短期超越百年企业,借助大数据丰富、快速而又多样化的特征快速超越传统的行业。

屏幕快照 2019-08-08 上午8.15.38.png

未来多年,数字技术将持续推动经济的巨大变革,推动传统产业和公司的转型与升级,打破原来的商业模式并不断催生新的生态环境。

在这种情况下,每一家企业都应该认真思考自己的数据战略,越来越多的挑战者来自于看不见的赛道,他们可以依据数据的优势发起难以反抗的进攻。在可见的未来,企业将分为两类:数据驱动的公司和传统公司。

归根结底,“任何一家公司都是数据公司”,只是我们对待无形资产的态度差异。

屏幕快照 2019-08-04 上午8.21.15.png

目录

一、认识大数据
何为数据? | 何为“大” | 为何重要

二、价值创造——数据的根本价值
产生价值的行动和决策 | 决策即选择 | 决策的场景

三、使用大数据的契机
技术平民化  |  可视化分析,是进入大数据最好的入口

四、应用大数据
数据文化 | 知道问题的层次
IT与业务合作 | 构建自助化分析的数据文化
模型分析思维 | 数据整理

一、认识大数据及重要性

1、何为数据?——万物皆数

古希腊毕达哥拉斯学派认为“万物皆数”,数字就是世界的本源,通过数字可以洞察一切的真实。他不仅使用勾股定理阐述了三角形的原理,还创造了“五度相生律”,用数字来制作了音符!

如今,信息时代和数字化时代,我们每个人的生活、工作,每一家公司都被爆炸性的数据所包裹,手机从原来的100M内存发展到128G、256G都放不下。整个商业的世界,如同早年钻探石油一样,就是从数据挖掘价值和利润的过程,甚至连巨头公司IBM也在为此而积极转型。

数据正在成为新的自然资源,将成为企业的竞争优势,所以IBM的转型战略是要运用数据推动行业和专业转型。    ——IBM商业价值报告

“万物皆数”,我们身边都是字符、数字、日期、地理位置和判断,所有这一切,都通过计算机的0和1转化和保存。我们每个人都置身“黑客帝国”,都是Matrix中被数字化的代码。

屏幕快照 2019-08-04 上午10.03.09.png

2、何为“大”?数据爆炸

大数据之所以称之为“大”,有三个最基本的特征(3V):容量(Volume)、速度(Velocity)和多样性(Variety)。随着计算机技术的发展,特别是移动互联网的成长,之前缓慢成长的数据直接开始指数爆发,不仅数量激增、速度飞快,而且从非结构化数据多种多样。如今几天的数据量就超过几百万年人类所有的数据量,即便如此,真正的大数据洪峰却还没有到来——不久的将来,物联网带来的飓风般的超级数据。

1-1406101GQ6.jpg

而价值也正式孕育在这样的数据洪流之中,那些掌握了数据挖掘、数据分析和数据决策技术的企业,将会在商业战争中赢得先机。

3、为什么重要?从大数据到商业决策

石油存在于地球何止几百万年,但是没有经过提炼的石油几无价值,数据也是一样。大数据本身不足以让我们聪明,获得大数据也不能让我们聪明,只有投入时间、经验和智慧用心去整理、挖掘、提炼和总结数据背后的逻辑,才可能转化为价值。

那为什么过去几百年数据没有像如今如此兴盛?这完全依赖于技术的进步。计算机技术、信息技术、云计算技术、数据技术等各类技术的快速发展,让数据的记录、存储、传递、创造、分析、共享等各个环节都有了长足发展。一直以来,科学家的分析往往是基于样本的,技术的进步让我们可以分析总体,从而减少了分析的偏差。

屏幕快照 2019-08-08 上午7.32.35

还有一个非常关键的变化是,随着数据科学和分析技术的进步,技术越来越平民化了,之前只有IT才能掌握的分析工具,如今“飞入寻常百姓家”,业务人员一旦具备了接触和分析大数据的机会和能力,数据的价值才得以大面积的落地。分析数据不再是少数人的专利,而是整个企业的普遍文化

数据转化为价值,其一,依赖于技术进步,其二依赖于技术平民化后的业务主导的分析文化。

二、价值创造:大数据的根本价值

所有的一切,根本在于价值,简称曰利益!大数据的价值也在于此。

上面我们分析的是从大数据中挖掘价值的可能性——基于总体的分析帮助我们接近客观的真相。从数据到价值的具体道路是怎样的呢?

1、价值在于人为的“提炼”

如何从数据到价值,我们这里介绍一个非常重要的模型:DIKW金字塔模型。多年来这一直是最好的数据解释模型。DIKW分别代表数据、信息、知识和智慧四个层面,越来越靠近人的理性和能动性。

屏幕快照 2019-08-08 上午7.36.45.png

世界混沌,皆是数据,随处可见的汽油标号、单位、单价、规格都是数据的表示;但是倘若我们拿出任何一个或者多个数字给外人看,都只是没有意义的字符。只有当我们在数据中加入了人的解释,赋予数据以存在的背景,展示数据之间的逻辑关系,我们才能知道它要表述的内容,比如说“95号汽油7.6元/升”,这就是基本的数据组成信息的过程。

中石油 金字塔模型.png

一旦拥有了信息,我们就增加了对外部世界的认识,语言和文字帮助我们人类超越自身的局限,让我们得以傲视整个地球的其他生物。但仅仅如此还不够,那些聪慧的人还会从众多的信息中寻找普遍的规律,进而理解更加广阔的背景,也就拥有了看问题的更高的视角;这些人是天然的领导者和洞察者。“知识就是力量”,知识统治世界,拥有越来越多知识的人和更进一步的智慧仅仅一墙之隔,到了这个层次,不仅可以轻松的知其然,还能知其所以然,也就借助数据把握了总体,进而可以辅助决策择优。

数据分析,就是把数据整理为信息,进而提取知识,从而增进智慧和决策效率的过程。

所以,任何宣扬“读书无用”或者“知识无用”的人,要么是智商低下的自大者,要么就是别有用心的阴谋家。

2、分析即判断,决策即择优

数据分析的过程,就是数据总结信息,进而提取知识的过程。这个过程的终极目的,在于辅助人类的决策,准确的说,是寻找最优解(择优)。

人类第一台电子计算机的发明,本意就是如此——通过计算导弹数据和轨迹来实现精准打击。如今,我们可以把“导弹”比作产品,投放的对象则是需要这些产品的客户。为了准确的实现这一目的,我们需要在终端的决策意向中不断的择优,选择最有效而可行的方案。决策就是选择的过程,而数据分析则帮助我们作出最好的决策。

从这一点上看,哪怕是最基本的Excel分析,也会提高决策的准确性;基于大数据的分析,则会让你拥有超越同行的高度视角和勇气。

屏幕快照 2019-08-08 上午7.38.28

「除了上帝,所有人都要有数据说话。」

3、数据分析的场景(“提炼”)

数据的价值在于寻找数据中的规律性,进而辅助决策。具体到企业的应用中,我们可以区分为几大场景,根据是否清晰问题和答案/结果两个方面,可以划分为不同的象限。

企业的分析主要分为两大类,一种是确定性的知道自己想要什么,一般都是静态的结果或者定时刷新的KPI仪表板,另一种是在业务环境中随时提问、随时解答的动态分析。我按照两个维度(问题和答案/结果)把分析场景划分为几个区间,暂且用下面这个尚不成熟的图来表示:

屏幕快照 2019-08-04 下午5.23.16

这里的关键是第三和第四象限,真正的业务环境是复杂多变,每一个决策背后都有无数的证实和证伪过程。好的分析能结合不同的需求而生成高互动性的报表,能帮助业务领导随时发现业务中存在的问题并作出有效的指导。比如通过特定的指标发现明显造假嫌疑的加油站、寻找成功率更高的石油勘测点、通过假设验证寻找最优的VIP营销策略等。

屏幕快照 2019-08-04 下午6.07.06.png

4、超越分析象限,分析可以重塑行业模式

数据分析所能驱动的远远超过上面的象限的约束,基于数据分析的行业和客户洞察,甚至可以改变整个商业模式本身。我所知道的最棒的案例是赫尔曼·西蒙博士为德国铁路策划的铁路会员卡,堪称是最棒的定价策略。(可以参考赫尔曼·西蒙《定价制胜》)我也在身边找到了不少已经走在前列的服务公司,比如从销售轮胎到销售轮胎里程的服务商。

屏幕快照 2019-08-08 上午7.41.47.png

越来越多的传统公司基于数据驱动而作出商业决策的转向,比如曾经的GE发动机基于数据分析重建了自己的商业模式,不再是销售发动机,而是销售发动机的飞行时长和航空服务,按照飞行里程付费的模式有助于GE和客户各司其职实现利益的最大化。

三、使用大数据的契机:最佳的时机是现在

“种树最好的时候是十年前,其次是现在”。

1、技术的平民化

技术的发展,特别是诸多平民化技术打开了大数据分析的广阔天地,以Tableau的可视化查询专利技术VizQL为代表,让从来不懂得SQL语言的业务人员也能轻松与数据互动,进而发现隐藏在数据背后的真实。其次,自然语言处理技术也在蓬勃发展,Tableau已经推出了Ask Data的自然语言查询产品,让更多人轻松就可以获得更深刻的数据洞见。

  • VizQL 拖拽式查询语言
  • NLP自然语言处理技术
  • 可视化交互技术

“到2020年,50%的分析查询将通过搜索、自然语言处理或语音生成,或自动生成。”
“到2020年,平民数据科学家的数量增长5倍于专家数据科学家的数量增长。”

——Gartner BI Report

世界变化如此迅速,千万,“不要因为太忙,忽视了世界的变化”!如果换一个轮子跑的更快,就不要吝惜更换轮胎的几分钟时间。到了从传统的软件切换到面向业务的敏捷BI的时刻了。

too_busy_to_improve.jpg
不要因为太忙忽视了世界的变化(网络图片)

2、可视化分析技术的兴起

在所有的大数据技术中,可视化技术是最靠近前端,也是最容易为人理解的部分,它是数据访问者与数据交互的窗户,也是最靠近决策的环节。

可视化,是连接数据和访问的桥梁。通过Tableau的大数据分析工具,可以帮助业务人员更好的看到数据背后的逻辑,建立大数据使用和分析的信心!每个人都可以根据自己的习惯查看数据,甚至二次编辑模型,轻松易用的软件帮助更多人深刻地理解自己的业务数据,并促进自己的决策提升。

图片 1.png

 

四、应用:以价值创造为导向的数据战略

1、形成“数据创造价值”的数据文化

深刻的了解数据如何驱动业务决策,了解决策的不同场景,帮助每个人养成“数据中蕴含价值”的基本理念,这是进一步倡导数据战略的基础。最终要达成的企业文化是,当我们在思考一件事情时,我们应该从习惯性的“我想是这样的” 转变为 “我知道是这样的”。

屏幕快照 2019-08-04 下午6.36.08.png

过去,按照经验判断,如今环境变化太快,经验依然有价值,但是准确度在下降,关键是经验判断阻碍了创新——经验永远跳不出此前的框架。我们希望,在做决策时,我们可以从“我认为”转向“我知道”——基于数据,我知道是这样的,这是最细微的改变,也是最积极的改变。

2、问题和分析取决于视角

面向CEO和COO的数据分析,与面向部门主管的分析截然不同,我们的分析取决于客户的立场,取决于看数据的角度。不要试图用牛肉包子喂饱所有人。

  • CEO——关注趋势、预测、宏观KPI、重要警戒指标
  • 部门负责人——关心达成、进度、异常点分布、排名
  • 运营或者营销负责人——关注异常点、探索差异、寻找标杆
  • 基层员工——关注完成度、绩效奖励、员工排名、站点排名
屏幕快照 2019-07-16 下午12.30.14

3、从结果分析,走向过程分析

动态的业务分析,是数据创造价值的真正宝藏。那些善于使用数据的公司懂得把每一个决策都和数据验证相结合,数据不应该是作为事后的总结,而应该是事先的判断。

不要为了总结做分析,而应为了决策做分析

当企业习惯在业务决策过程中使用大数据分析工具,就会逐步养成自助分析的氛围,最终我们要达成的自助分析目标是:

  • 让人们能够轻松提出和解答自己的数据问题
  • 让人们能够轻松与团队成员共享其见解
  • 确保导向决策的数据准确无误。

4、IT部门和业务部门通力合作

到了停止互相伤害的时候了,方法是搭建各司其职的自助式分析。过去瀑布式的数据开发(业务提问题,IT寻找答案然后交付成果)已经不适用于当前的数据环境,因为无法解决“IT不懂业务,业务不懂IT”的困境,却总是希望IT承担数据分析的重任。

更好的方式是回归各自的角色,IT负责基础设置、安全、权限等工作,而业务部门负责解释数据并转化为行动;或者说,IT部分负责从数据到信息的环节,而业务部门主要负责从信息中形成知识。

屏幕快照 2019-08-08 上午7.47.06.png

“人人都是分析师”是趋势,也是目标:来自业务部门的数据分析师 和 IT部门的数据分析师,共同组成企业的分析力量。基于自助化的分析文化,我们将实现IT部门和业务部分工作效率的共同提升,二者的协力合作共同推进企业分析文化的进步。

5、养成模型思维

可视化分析带给我的非常重要的影响是,不要重复工作,特别是不要重复简单而枯燥的工作。我们几乎所有的事情,都是“类似情景的重复”,找到这些重复的场景并加以模型化,我们就会大幅度提高工作和生活的效率,从而有时间感受其间的美。

  • 凡是能一次完成的,不要重复做第二遍;用优化代替重复;
  • 把数据整理和数据分析分开,有助于建立更好的模型。
  • 模型就是最优策略的固化。

6、培养好奇心,好奇心是数据世界的通行证

最好的驱动力是好奇心,好奇心通往一切。最佳的策略是寻找企业的星星之火,让他们的好奇心驱动整个世界。

屏幕快照 2019-08-08 上午7.49.08.png

大数据的目的是分析效率的提升、绩效的改进。“每个公司都是数据公司”,但不是每家公司都懂得如何勘测和提炼;通过it部门和业务部门生产效率的提高,通过数据的挖掘和提炼,才能大幅度的提高效率,从数据中提炼价值。

Tableau,帮助这一切。

屏幕快照 2019-08-08 上午7.52.24.png

by 喜乐君 
Tableau Partner, QA Certification
提供Tableau全系产品的销售、服务和培训服务

【说明】部分照片来自网络,基本已经注明;最后几张照片来自Tableau峰会官方文件;其他照片为个人制作。 开篇AB奖金的故事,来自得到app“老喻的人生算法课”,推荐购买。

Aug 1~4, 2019 随ppt整理
Aug 6, 2019 update
Aug 8, 2019 update
Aug 9, 2019 Revise

了解 喜乐君 的更多信息

立即订阅以继续阅读并访问完整档案。

Continue reading