经济学人:
奥卡姆剃刀是社会科学的基石,对金融经济学家来说,它几乎是信条。该原则以14世纪的僧侣奥卡姆的威廉命名。它认为,对任何现象来说,最简单的解释就是最好的解释。如今,金融分析师们对“过度拟合”深感担忧:他们构建的模型凭借其复杂性,能够很好地映射到现有数据,但对未来的预测却很差。然而,如今奥卡姆正面临审判。新的研究表明,对于大型机器学习模型而言,简约性被高估了,复杂性或许才是王道。如果真是这样,现代投资方法将被颠覆。
这场争论始于2021年,当时耶鲁大学的布莱恩·凯利(Bryan Kelly)和周康英(Kangying Zhou)以及瑞士洛桑联邦理工学院的塞米翁·马拉默德(Semyon Malamud)发表了《复杂性在回报预测中的优势》。在一篇论文中,凯利先生和他的合著者使用一个包含12000个独立“参数”(或称设置)的模型,仅分析了12个月的数据。使用如此多的参数——这与奥卡姆剃刀原理的设想相反——传统上被认为会增加过度拟合的风险。然而,事实上,这种复杂性似乎有助于该模型预测未来。论文作者问道,奥卡姆剃刀原理是否就是奥卡姆的失误?
这是一场学术辩论,但其结果将产生深远的影响。凯利先生同时也是量化对冲基金AQR的投资组合经理。该公司曾以使用比同行更传统、更简约的方法而闻名。但现在,它正在拥抱复杂性带来的明显好处。凯利先生认为,研究人员担心数据过度拟合,却对数据拟合不足的担忧太少了。
利用小数据集做出更准确的预测可能带来巨大的利润。许多金融研究受制于样本量小和实验难度。收集更多数据通常需要等待,而且在某些领域,数据极其稀缺。在研究市场崩溃、银行挤兑和主权债务违约等极端事件时,研究人员通常只有现代历史上几个例子。寻求优势的对冲基金花费数十亿美元购买另类数据,从中国铁路交通的卫星图像到从社交媒体上抓取的投资者情绪数据。
最近,关于复杂性的争论达到了白热化。凯利先生和他的合著者们面临着一连串的质疑。牛津大学的阿尔瓦罗·卡特亚(Álvaro Cartea)、金琪(Qi Jin)和史元涛(Yuantao Shi)认为,如果使用的数据收集不善、存在错误或其他噪声,复杂性的优势可能就不复存在了。芝加哥大学的斯蒂芬·纳格尔(Stefan Nagel)认为,对于非常小的数据集,所谓的复杂模型实际上模拟的是动量交易策略,它们的成功只是“幸运的巧合”。凯利先生和马拉默德先生已经用另一篇详细的论文回应了他们的评论。
现在就为奥卡姆的格言写悼词还为时过早。但即使是怀疑论者也不会完全否定大型复杂模型能够比简单模型做出更准确的预测——他们只是认为这并非总是成立。与此同时,如果复杂性的优点真的存在,那么许多投资者的运作方式可能会发生巨大的变化。如果卡蒂亚先生和他的合著者是正确的,那么聘请最优秀的机器学习工程师将比以往任何时候都更加重要,获取和清理数据也是如此。科技公司为超级明星程序员提供的数十亿美元的高薪,或许也会开始出现在投资公司。
投资公司也将从规模中获得更大的收益。训练和运行模型所需的计算能力成本高昂,因此可能成为保护大型对冲基金免受竞争的“护城河”。规模较大的机构将有能力进行更多尝试,并涉足更广泛的资产类别。规模较小的机构可能难以跟上。
竞争减少并非唯一的风险。在解读最先进的机器学习模型方面,人类仍在迎头赶上。投资者可能会越来越依赖那些极难解读的黑箱算法。小型模型的优势不仅在于易于部署,还在于投资者易于思考和调整。只要它们能赚钱,就很少有人会抱怨。然而,如果新模型出现任何问题——从平淡无奇的表现不佳到整个投资策略的失败——它们的支持者可能会渴望一种能够化解复杂性的工具。
评论
发表评论