“该策略投资于欧盟17国的股票,排除非普通股、外资上市、次级上市、金融公司及总资产为负或缺少行业标识的公司,市值需大于1000万美元,数据来源于Refinitiv Datastream。使用随机森林和梯度提升模型估算公司的“公平价值”,并标准化财务数据消除估值偏差。通过计算“估算的公平价值减去市场市值再除以市场市值”得出错误定价信号,每月将股票排序为五个分位组,做多前20%被低估的股票,做空后20%被高估的股票,策略按价值加权并每月重新平衡。”
资产类别:股票 | 地区:欧洲 | 频率:每月 | 市场:股票 | 关键词:机器学习,错误定价,欧洲,股市
策略概述
投资范围包括欧盟17国的股票,排除了非普通股、外资上市、次级上市、金融公司,以及总资产为负或缺少行业标识的公司。同时,股票的市值需大于1000万美元,数据来源于Refinitiv Datastream。目标是根据公司过去48个月的财务数据(如总资产、销售额、长期债务等,见表A),使用机器学习模型估算公司的“公平价值”。这些变量会被标准化,并映射到[-1,1]区间以消除市场风格和时间特定的估值偏差。
策略使用随机森林和梯度提升模型来估算公司的公平价值,并通过平均两种模型的估计值来获得最终的估计值。错误定价信号通过“估算的公平价值减去市场市值,再除以市场市值”计算得出。每月基于错误定价信号将股票排序为五个分位组,做多前20%(被低估的股票)并做空后20%(被高估的股票)。该策略为价值加权,并每月重新平衡。
策略合理性
该策略的功能性源自两个主要因素:
- 机器学习模型的非线性捕捉能力:机器学习模型(如随机森林和梯度提升)能够处理复杂的非线性关系,并从财务数据中提取更多有用的信息,相比传统的线性回归模型,它们能够更好地揭示股票的定价错误并产生更高的风险调整后回报。
- 错误定价的捕捉:基于公司的财务数据,机器学习模型可以有效识别被低估和高估的股票,并通过相应的多空策略从定价错误中获利。通过历史财务数据,模型能够提供比市场价格更接近公司内在价值的估计。
论文来源
Boosting Agnostic Fundamental Analysis: Using Machine Learning to Identify Mispricing in European Stock Markets [点击浏览原文]
- Matthias X. Hanauer, Marina Kononova, Marc Steffen Rapp, Technische Universität München (TUM); Robeco Asset Management, 马尔堡大学经济学院
<摘要>
受Bartram和Grinblatt的研究启发,我们应用线性回归(LR)和基于树的机器学习(ML)方法,利用21个财务变量每月估算欧洲股票的同行隐含公平价值。通过比较LR和ML模型,我们记录了预测变量在SHAP值下的重要性差异。基于偏离公平价值的交易策略,我们发现ML策略相较于LR策略能够获得显著更高的风险调整回报。我们的研究结果展示了在基本面分析中考虑非线性和交互关系的重要性,并揭示了市场中存在的显著非理性。


回测表现
| 年化收益率 | 7.44% |
| 波动率 | 10.61% |
| Beta | 0.7 |
| 夏普比率 | 1.4 |
| 索提诺比率 | N/A |
| 最大回撤 | N/A |
| 胜率 | N/A |
