(2019.11.16)
《简单统计学》是耶鲁大学统计学教授加里-史密斯的一本统计学通俗读物。这本书的副标题是:如何轻松识破一本正经的胡说八道。书中给出了几十个统计学谬误,其中不乏著名经济学家所犯的统计错误,包括有名的畅销书《魔鬼经济学》、《从优秀到卓越》的作者。在这个大数据泛滥的时代,作为一个有智慧的读者,需要有一些基本的统计学知识,这样才不会被满口统计数字的专家们忽悠。
其中最常见的谬误有三项:存活者偏差、自选择偏差、均值回归,下面我们就简单加以解释。
存活者偏差
关于存活者偏差,有一个非常著名的例子。二战时期的英国皇家空军(RAF),计划在飞机上安装厚钢板,以帮助它们抵抗德国战斗机和陆基高射炮的攻击。这些防护板极为沉重,无法覆盖整个飞机,为了在防护和机动性之间做出平衡,必须选择在哪些部位安装防护板。因此,RAF开始对结束轰炸任务的飞机进行调查,以收集飞机上子弹孔和弹片孔的位置数据。他们发现大多数弹孔位于机翼和飞机尾部,驾驶舱、发动机和油箱的弹孔则非常稀少——这是否说明机翼和飞机尾部中弹的可能性更大,因此应该把防护板应当安装在这些部位呢?
这个想法当然大错特错,因为返航飞机的驾驶舱和油箱之所以很少出现弹孔,是因为这些部位被击中的飞机几乎肯定坠毁,无法顺利返航。能够返航的飞机在机翼上出现弹孔的可能性更大,因为这些弹孔的伤害很小。一个逃到美国的匈牙利裔犹太人瓦尔德发现了这个问题,他提出的建议与最初的结论完全相反:应当加固没有弹孔的位置,而不是弹孔最多的位置。
生活之中,这种偏差经常出现,尤其是在金融行业。比如,道琼斯30工业指数持续上升,回报率可观。但是其中的股票已经早就不是最初的30只股票了,如果保持其中的最初股票,回报率还是否有这么高呢?在P2P贷款兴盛的时候,经常有平台声称自己的贷款违约率远远低于同行业,其实也是在利用存活者偏差在做文章。如果平台的贷款额增长很快,那么旧贷款的违约率即使很高,也会因为新的贷款的增加而使得整体违约率非常低。但是这并不说明其资产质量更好,一旦贷款停止增长,问题就会暴露出来。
自选择偏差
关于自选择偏差,有一个著名的笑话:一位记者在春运的火车上采访乘客,然后他欣慰地发现,所有被采访的对象都买到了火车票!
不了解自选择偏差的谬误,往往会得出很多可笑的结论。比如在美国的亚利桑那州,气候晴朗,空气清新,但是肺病死亡率却非常之高。难道是这里有什么不为人知的肺病诱因?而事实上是因为这里的气候宜人,所以吸引了全国的肺病患者纷纷来这里养病,肺病患者在人群中的比例远远高于其他地区。即使对于患者而言,死亡率下降了,但是由于患病人群的人数过高,按照普通人口统计的肺病死亡率也就格外高。
在美国2016年总统大选的时候,民调就犯了明显的自选择偏差的错误。在大选前,几乎所有的民调都预测希拉里会赢,结果却是特朗普赢得了大选:一个可能的原因是希拉里的支持者在回答民调时不会隐瞒自己的投票倾向,而特朗普的支持者会隐瞒。沉默的多数将特朗普送进了白宫。
均值回归
现在的书店里面总是充斥着林林总总的成功学书籍,这类书籍的书名总是非常抓人眼球,比如“我的成功可以复制”,“从平凡到伟大”等等,不一而足。但是,其主要的观点就是:跟着成功人士学习,跟着成功的公司学习,你和你的公司也会变得成功。
在美国,成功学也是经久不衰的畅销书品种,销量达到400万册的《从优秀到卓越》就是其中的佼佼者。作者吉姆·柯林斯(Jim Collins)及其研究团队花了 5 年时间,考察了 1435 家公司 40 年的历史,发现了股价表现优于平均水平的11家公司。柯林斯对这11家大公司进行了一番仔细分析,认为自己发现了其中的一些共同特点,并为每个特点起了一个吸引眼球的名字,比如第五级领导者。
但是,该书2001出版之后,11家公司中的电路城在2009年宣告破产,房利美的股价也下跌了99%,最后被政府接管,而其他9家公司在股市上也表现平平。如何解释这种情况?难道是这些公司在短短的几年间管理能力出现了较大的下滑?其实这种现象通过简单的均值回归就可以解释。
如果在股市里面找出11家40年来表现超常的公司,然后试图从中找出某种共同点,是很容易的,因为样本量太少,而可供解释的因素太多。如同诺贝尔经济学奖得主罗纳德 科斯曾经说的:“如果你对数据拷打足够长的时间,它一定会招供。”
但是,个人的成功,以及企业的成功,很可能是这些因素之外的原因,包括运气。成功是个小概率的随机事件,而未来的业绩,与以往的成功,并不存在必然的联系,更不能保证学习他们的以往经验就一定能成功。成功学最大的谬误,就是把特例当成普遍规律来忽悠读者。
如果数据欺骗了你,不要悲伤,也不要哭泣,少读一点成功学,好好读一下这本《简单统计学》。
0
推荐