你好,我是郭炜。我是一个特别热爱数据的人,我自己有一个座右铭:“数据是有灵魂的,我将用我的一生去追寻他。”

从小学开始你就一直在学习和考试,用分数定排名,这些计算离不开数据;你工作了,开始自己挣工资,KPI的评估、年终奖的计算也离不开数据;你结婚了,要去买房,你开始思考等额本息和等额本金哪种贷款方式更适合你,这也是数据;平时和朋友玩牌,牌面现在有两张红桃、一张黑桃,你手里有一张红桃,你开始判断拿到全部红桃的概率、应不应该加注,这也是数据。

我们生命的点点滴滴,其实都是用数据在记录的。在当今这个时代,我可以说,人这一辈子都离不开数据。

万物背后的规律都是数据

数据无处不在,每个人都会觉得自己多多少少懂一些数据。但细究起来,你能够拍着胸脯说自己真正懂数据吗?

就拿我自己来讲,小时候我和小伙伴赌抛硬币,我觉得硬币有两面,是抛20次至少应该有8、9次是正面向上的,我就跑去和别人打赌抛20次至少8次向上,最后我输得很惨,请了好几顿冰棍。同样地,现在你去澳门赌场去赌大小,大概率也会输得很惨。这背后其实有深层次的数据逻辑和数学理论,你会在接下来的课程里具体学到这个理论——“大数定律”。

在管理中,我也曾听到部下和我吹嘘,竞争对手现在的平均客单价只有10万,我们的平均客单价有100万,我们服务的都是高端客户。但是我做了用户访谈后发现,我们三、五万客单价的单子还有很多,原来是背后一个1000万的单子拉高了整体的平均值。

如果我没有做深入的用户调研,可能我就会按照100万客单价级别的战略去做相关的规划,进而对公司造成影响。

我当时由于对平均值理解得不够,差点出了差错。同样,如果你不了解这些数字背后的逻辑,你也很可能会做出错误的决策。基于这件事,我在下节课讲平均值的时候就会告诉你,你天天“被幸福”、“被加薪”就是这样的错误的理念在作怪。

另外,现在有很多“数据科学家”会给你各种算法预测,更有甚者,直接给你画出一条“增长曲线”告诉你未来投资回报率会有多高,要求你进行基金投资或者你所在的部门增大投入,并告诉根据“大数据算法”进行这些投入之后,就能带你或者公司来多少回报。

但等你真的投入之后,你才发现这根本就不是一回事。于是,你会下结论说“数据预测”都不靠谱,其实这也是不正确的。毕竟在人家给你的数据报告中既可能有“幸存者偏差”,还有“因果倒置”。所以在接下来的课程里,我希望用通俗易懂的例子让你充分了解这些基本知识,这样在下次“数据科学家”给你号脉的时候,你就可以知道他是“真科学家”还是“伪科学家”。

所以你看,数据无处不在,你需要很好地去认识数据,这样才能让数据更好地指导你的生活。而数据背后的规律是什么呢?它是算法。

数据背后的规律是算法

现在的数据算法分析和过去的数据算法分析又有所不同,现在有了大数据和小数据之分。有人说,大数据加上人工智能才是一切,而又有人认为小而传统的逻辑数据才是真理。那谁才是对的呢?

我既做过小数据也做过大数据,在我看来,这两种趋势的结论其实都是对的,只是它的应用场景不同。

在大数据里面我们针对的是个人的数据,这些数据量虽然很大,但是每行数据蕴含的信息量(也叫熵)很小,所以我们会用很多人工智能的数据挖掘算法,来帮我们在浩如烟海的数据里找到其中的珍珠。

而小数据往往是在企业经营范围内产生的,他们的数据量很小,但是他们蕴含的数据价值(熵)会非常大,所以分析的时候要更讲究,因为每一个数据背后都蕴含着大量的知识,我们要了解它背后的规律才能掌握数据的命脉。

我来给你举个大数据和小数据的例子。从大数据的方向来说,抖音的推荐算法就是典型的大数据代表。抖音需要在复杂多变的环境找到你喜爱的视频并推荐给你,不断增强你的体验,从而让你爱不释手。如果抖音没有一个很好的推荐算法,其实是很难达到今天的地位的。

但是对于抖音背后的母公司字节跳动来讲,它的上市数据、经营收入、人员成本这些小数据同样重要。这些小数据会影响字节跳动的整体估值,以及每个员工所持有股票最后变现的金额。

所以你看,就算对于字节跳动这样大数据浩如烟海的一线大厂来说,大数据和小数据依旧要两手抓。大数据是业务支撑,小数据是内核动力,两者缺一不可,只是应用的场景不同。

在这门课里,我既会教你一些小数据的基本概念,也会教你大数据算法的基本原理,让你不再对那些奇怪的专用名词和算法感到陌生,帮你初步迈进数据分析和算法的门槛。

数据重要的是分析和表达

但是,光知道算法还远远不够。数据有它的复杂性,同样的数据往往可以从很多不同的角度诠释,诠释得特别好的人,我们就可以叫他数据分析师了。此外,作为管理者,也必须要有数据分析的常识,才能透过现象看本质。

我跟你讲一个典故:平江人李元度本来是一个书生,根本不知道领兵作战。曾国藩命令他领兵出战,每打一次仗便败一次。曾国藩很生气,准备写奏折弹劾他。在他的奏折上便有“屡战屡败”这样的词语。后来曾国藩的幕僚中有人为李元度求情,把“屡战屡败”改为“屡败屡战”,最后李元度因此被免罪。

你看,同样都是100%的失败,但是不同的解释会让结果完全不同。数据也是如此,你如何看待这个数据和它背后的解释,往往会让你得到完全不同的结果。

所以当我们有了数据和算法后,就好比手里拿了一块“璞玉”,还不能够完全发挥作用。我们要通过有效地分析数据、表达数据,从而让数据最终影响到人。在我们整个课程里,我会带着你学习怎样把数据表达得更为清晰,让你成为别人眼里的“数据分析师”。

小结

好了,这节课到这里也就接近尾声了。这节课其实相当于我们正式进入正课内容的一个小预习,通过这节课,我想告诉你,我们很多人平时很容易对数据想当然,但究根结底,我们对数据还需要进一步的认识。万物背后都是数据,不是我想出来的噱头,数据就是这么无处不在。

光认识数据对我们的生活很重要还不够,数据背后的规律是算法。就像客观世界背后蕴含着哲理一样,学了这门课程你能够从数据算法中同样领会到生活的哲理。比如在接下来的课程中你会发现,原来“物以类聚人以群分”这句话里面是有数学算法支持的,而《飘》里面提到的“tomorrow is another day”其实也是有数据算法根据的。我希望你学了这门课程,不要把它仅仅当成一个知识库来对待,而是通过这门课来培养一个时时思考数据规律的习惯。

最后,当你有了对数据思考的习惯,我希望你能够进一步去表达数据,用数据正确地影响他人,跨入数据分析师的门槛。在这样一个纷繁复杂的世界里,你要是能够有一个清晰、优雅的数据观,那么你能够把一件事情更好地想明白、说清楚。

数据就是外行看热闹,内行看门道。看清数据真谛的人才能真正把握自己的命运,把握自己企业的命脉,最终获得生活和事业的成功。所以希望你能够通过这门课,能够对自己的生活有一个新的认知,看到数据背后的逻辑和趋势。在接下来的课程学习中,你如果有任何的思考和疑问,一定要在留言区大胆提出来,我们共同成长。

课后思考

你在生活或工作中有曾经被哪些数据骗了的经历吗?明白之后又有哪些收获呢?可以写在这里,我们一起来讨论一下。

评论