财新传媒
位置:博客 > 陈剑 > “大数据”时代:谁的金矿?

“大数据”时代:谁的金矿?

 

最近我在执教的金融硕士班上给学生们布置学期的独立研究论文,一个学生给我发来一份邮件,说他想写写“大数据”带来的金融商机:他打算模拟一个“大数据”的交易所买卖基金(ETF),专门投资提供大数据所关联的软件、存储、云计算等服务的供应商,问问我对此有什么看法。正好我对这个话题也很感兴趣,就给他回了一封长信。下面就是这封信的内容。

“我喜欢这个话题,我也喜欢你对这个话题的热情。最近关于“大数据”已经有很多的讨论,但我不认为这是一个新的想法。在消费者金融业,人们已经开发了多年的基于大数据的模型,比如按揭贷款违约模型,信用卡模型,信用评分模型,我相信对此你应该很熟悉(我的这个学生有在消费者信用评级社的工作经验)。然而,为什么从大数据估计出来的模型并没有阻止我们进入金融危机?我认为有两个基本原因:

 

1.      计量经济学模型(或任何基于历史数据的预测模型),都假设在相同条件下,人们会做出相同的行为选择,这通常是正确的。但在模型中没有被捕获的变量(即所谓潜在变量Latent Variable),有可能在某时某地发生改变,从而改变人们的行为。像新的抵押贷款承保指引,人们对拥有自有住房的看法,等等。这种影响是很难单独被“大数据”模型抓获的。

2.      预测不仅需要模型,也需要输入,比如假设:未来的利率如何变化,房价增长率如何?但是在很多时候,没有一个好办法来事先判断假设的合理性。例如,在2007年的时候假设房屋价格将保持长期的4.2%年增长率(当时美国房价已经保持了10年的持续高速增长),当时看上去也许是一个非常合理的假设。但现在回头来看,这个假设不但是完全没有用的,甚至是非常有害的。

 

我认为这种“大数据”技术的革命性意义在于它可以改变游戏规则:即创造更加公平的竞争环境。在以往的情况下,只有大公司可以收集和使用大的数据,但现在用廉价的存储和云计算能力,小而专的企业也可以参与其中(个人认为,云存储和云计算在未来都会成为普通商品,就如同个人电脑、硬盘、闪存一样,而能够真正发掘出金子的将是那些懂得如何分析大数据、开发预测模型、或者运用模型成功进行市场营销和风险管理的公司)。例如,我的公司现在可以处理和两房(房利美和房地美)几乎同样规模的抵押贷款数据(数以千万计的贷款数据和上亿的交易记录),而我们的模型估计、实施、以及预测可能是更加经济、更为高效的。

 

尽管如此,我认为你可以继续进行ETF的现金流折现模型的想法。不过,我更感兴趣的是研究风险投资,因为我觉得小公司/初创企业将能够比你提到的ETF的大牌公司更加有效地利用这项技术。让我听听你怎么看。”

 

昨天,学生回信说他打算试试看怎么分析小企业如何可以运用数据采矿(data mining,即从数据中发现有用信息)技术来发掘商机。而对我来说,能够指导出一篇好的研究论文,那也像挖到了金矿一样令人高兴。



推荐 22