坐飞机最安全? 数据诡计:经典数据欺骗术

thinkss
2016-08-15 发表
1830 0

#飞机真的是最安全的交通工具吗?#

数据分析是产品经理必备技能之一,但是有的时候会出现一个很有意思的现象:明明你看到的数据都是正确的,但是通过这些数据得出的结论却是错的离谱。那是因为你掉进了数据分析的诡计中。今天星河系教育小编和大家聊一聊数据分析的那些坑。


一 数据比较的诡计
产品经理在通过比较数据得出结论之前需要想一想,这两个数据真的具备可比性吗?在比较之前请考虑一下两个数据的比较的环境和场景是否对等。只有处在同一对等地位的两个数据进行比较才是靠谱的做法。



举例子:飞机最安全?

记得上初中的时候就学过一个“常识”:飞机是世界上最安全的交通工具!这个结论的数据支持就是:每旅行10亿公里造成的人员死亡数字。飞机是0.05,也就是坐飞机,每10亿公里死0.05个人,第二安全是汽车:0.4人,第三位是火车:1.2人。这个数据看上去没问题,完全可以证明飞机比其他交通工具安全的太多了。但是,当时还是孩子的小编总是存在一个疑惑,飞机一出事就是死亡率很高的事件,但是其他交通工具显然就不一样了,所以总觉的坐飞机还是没有数据显示中的那么安全,至少心里面还会打鼓的。



真实情况也是如此,以上的数据中飞机,火车,汽车之间处于一种不对等的地位。虽然他们都是交通工具,但是飞机就是为了长途旅行而设计的,所以在“长距离旅行(10亿公里)”这个前提上,对那些短途交通工具如:汽车 就是不公平的。
换一个听得懂的说法:刘翔和姚明都是体育界的名人,在田径场上,刘翔比姚明的贡献大的太多了!但是这不能证明,在体育界里,刘翔的贡献就大于姚明的,虽然二人都是体育界的人。同样,上面数据只能证明长距离旅行,飞机的死亡率最低。但是不能证明在交通工具的圈子里,飞机是最安全的交通工具。
我们看一下其他前提下的各个交通工具的安全系数吧!如果按照小时来计算,10亿小时,使用交通工具的死亡人数,飞机就排不到第一了,第一是公交车:11.1,飞机是30.8,排名第三。如果按照次数算,10亿次旅行中交通工具的死亡人数,公交还是最安全的,只有4.3,火车是20,飞机的数据最可怕:117!
再举个例子
另外,这种不对等的数据比较陷阱还有我们在15年前经常吹鼓的:改革开放后咱们的城市发展的多么多么快。美国的纽约上百年发展,咱们十几年不是也赶上了吗?多么可笑的一个比较啊!这也是典型的在不对等的环境和场景下比较数据得出的谬论。

环境和条件完全不对等,美国的发展是从0到1的,也就是说是从没有,然后创造、发现,最后发展起来。而中国的城市建设发展显然没有经过创造和发现。只是拿现成的技术、理念来学一学、用一用。而且用的也不怎么好……



类似的事情打个比方。勾股定理咱们都学过。但是发现这一理论的人绝对花了很长时间来研究这一理论。具体时间我不知道,但是怎么也应该是用“年”为单位来计算的吧。但是我们学习和使用勾股定理只要花上一节课的时间就够了,大概40分钟。那我们可以做出这样的比较吗?古人花了好几年才会用勾股定理,我们只要40分钟就OK了!我们太伟大了!这显然是可笑的。
更弱智的还有油价问题。中国的油价比世界发达国家的油价便宜,涨价是应该的!但是谁都知道,中国人的收入比发达国家差的太多了。这种单方面的比较是不平等、不靠谱的。
二 数据也会“躲猫猫”
有的数据“躲起来了”,你只获取了一部分的数据,所以没有能得出正确的结论。产品经理在获取数据后一定要先想一想这些数据是否是比较全面的。
别以为“获取比较全面的数据”很容易,因为有些时候,有些企业或部门会专门发布不全面的数据来达到自己的不可告人的目的。他们发布的数据完全是真实的实实在在存在的数据,但是他们却只发布一些对它们有利的数据,而隐去不发布那些对它们不利的数据。这种行为用专业点的词就叫做:选择性数据披露。
举几个例子吧。

最近一家公司就因为对外进行了选择性数据披露被查。现在是2016年,但是这家公司却一直对外发布自己公司2015年各个月的业绩。原因就是这家公司在2015年的业绩十分漂亮!900%多的净利润增长,产品销量增长3000%多!这些数据都是真的,但是公司却隐瞒了自己2016年这几个月的业绩。2016年的业绩可谓是惨淡至极:1,2,3月份没有卖出一件产品。公司这么做的目的就是为了刺激股民,让自己的股票升值。



股民们看到这家公司的新能源产品2015年这么牛,他们自然就会觉得2016年这家公司也会不错。身在局中的股民根本没有意识到自己已经掉入了公司设计好的数据诡计中。产品经理获取数据的时候也需要小心!

其实,玩选择性数据披露最多的是新闻部门,尤其是亘古不变的晚七点的新闻。有人调侃,我真希望自己生活在《新闻联播》中。新闻中播报的数据(姑且不论数据是否真实)都是真实存在的,新闻只播报对自己有利的数据而不去报道对自己不利的。



前几年一件事小编我就记忆很深。网络上出现中国间谍在国外被捕的新闻。当天晚上的新闻(不是新闻联播)就反复播出国外间谍来中国刺探情报被捕的新闻而丝毫不提自家的“丑事”。第二天,所有网络媒体上的关于中国间谍的报道就“喜闻乐见”的统一失踪了。
所以,产品经理在进行可行性调研的时候,对新闻媒体甚至其他自媒体发布的信息也需要存有怀疑,因为有些信息已经找不到了,而这些消失或被隐藏的信息往往是产品经理最需要看到的信息。
三 平均数陷阱

平均数陷阱相信大家或多或少都会知道一些。平均数只是用于那些数据落差不大的情况。如果数据落差极大,平均数得出的结果会让人哭笑不得。



最有意思的例子就是比尔盖斯进酒吧。假设,这里有一个小酒吧,然后比尔盖斯走进这家酒吧去喝酒了。这个时候老板正在为酒吧的未来发展指定策略,需要统计一下顾客的资产水平,看看是不是需要提高自己产品的价格或质量。然后老板就开始对酒吧内的顾客拥有的平均资产进行统计。因为比尔盖斯拥有百亿身家,所以即便这家酒吧的顾客都是一文不名的乞丐,他们和世界首富做一下平均数,算出来的结果就是这些人都是亿万富翁。而这个结果自然是十分不靠谱的。如果老板按照亿万富翁俱乐部来打造自己的酒吧,其结果一定是死得很惨。
以上三个例子都是平时比较常见,比较容易陷进去的数据陷阱,产品经理和各位读者们需要格外的留神。

  • 热门回复
  • 全部回复
    暂无回复喔~~

生活服务

分享给好友