“本文提出的交易策略基于XGBoost机器学习算法预测公司质量,并利用该质量指标构建交易组合。数据来源于Compustat和CRSP,并经过标准化和处理。XGBoost模型使用历史财务和会计数据进行训练,通过时间序列交叉验证优化超参数,并预测公司质量的代理指标(Q)。投资组合每年7月1日至次年6月30日持有,按月再平衡。策略的表现通过均方误差和平均绝对误差评估,同时可结合止损、多样化等风险管理措施。”
资产类别:股票 | 地区:美国 | 频率:每月 | 市场:股票 | 关键词:公司质量,机器学习
策略概述
本文中概述的交易策略基于使用机器学习(特别是XGBoost算法)预测公司质量,并随后利用这一质量指标构建交易组合。以下是简化的交易策略:
<数据>
收集来自Compustat和CRSP的普通股票的历史会计和股票回报数据。 将Compustat的观察数据与每月CRSP数据匹配,以6月作为参考日期。 独立变量在模型训练和测试中进行标准化。 会计数据中的缺失值根据会计知识进行填充,而具有剩余缺失值的公司年份被排除。 模型输入变量在每年顶部和底部百分位进行温莎化,以减轻异常值的影响。
<公司质量预测模型>
定义依赖变量,基于本文提供的复杂公式(方程4)表示真实公司质量。 使用过去三年的历史数据(t-3至t-1)训练XGBoost回归模型。 通过对训练数据集进行五折时间序列交叉验证,调整超参数(如学习率、最大深度、子样本和正则化项)。 根据最小绝对预测误差的平均值选择最佳超参数。 使用最佳超参数在整个训练数据集上重新训练XGBoost模型。
该模型以历史财务和会计数据以及行业资本成本作为输入,利用机器学习(XGBoost)估算公司质量的代理指标(Q)作为输出。通过均方误差(MSE)和平均绝对误差(MAE)等评估指标评估模型的表现。目标是基于这些输入和机器学习技术开发出公司质量的实证代理。
<投资组合评估>
所选投资组合从日历年t的7月1日持有至日历年t+1的6月30日。 通过投资组合回报的均方误差(MSE)或平均绝对误差(MAE)等指标评估投资组合的表现。
<投资组合再平衡>
每月重复步骤1到4,考虑最新可用数据。
<风险管理>
可以实施止损订单、多样化或头寸规模等风险管理策略,以管理投资组合风险。 该简化交易策略基于研究论文的方法,通过机器学习预测公司质量,并随后基于这些预测构建交易组合。参数调整和投资组合构建的具体细节可以根据个人偏好和风险承受能力进行定制。此外,实际实施应考虑交易成本、税收和现实因素。
策略合理性
本文关注功能性的基本原因围绕价值投资的核心要素:识别优质公司并以合理价格收购它们,通常称为“便宜”(Lee 2014)。虽然确定股票的便宜程度相对简单,但评估公司质量更具挑战性,因为其前瞻性特征。精确测量公司质量对投资者以及各利益相关者(包括潜在员工、公司董事会和金融监管机构)都具有重要意义。此外,鉴于机器学习模型在预测股票回报中的崛起,准确的公司质量衡量指标有助于机构投资者解释复杂预测模型背后的经济逻辑。本研究探索了机器学习在构建比传统启发式方法更精确的公司质量衡量指标方面的潜力。它表明,机器学习,特别是XGBoost,可以有效利用分解的财务数据并处理缺失值,从而得出更准确的公司质量衡量指标。这些基于公司未来实现的剩余收益现值之和的改进衡量指标在价值投资中具有实际应用,能够更好地解释股价并在价值投资策略中产生更高的回报。
论文来源
Measuring Firm Quality Using Machine Learning [点击浏览原文]
- Changyi Chen, Bin Ke, Qi Zhao,国立新加坡大学(NUS),华南理工大学
<摘要>
公司质量是基本分析文献中的基础构念。Asness等人(2019年)是该文献的一个近期代表性例子,基于19个受估值理论指导的基本比率衡量公司质量(称为Asness的Q得分)。我们研究是否可以利用机器学习的力量,使用这19个基本信号构建更好的公司质量衡量指标。我们展示了一种先进的机器学习模型XGBoost,该模型基于这19个比率,能够比基于Asness的Q得分的线性OLS回归模型(我们的基准)提高27%的表现。然而,我们未能找到经济上显著的证据,表明添加先前文献中识别的更多原始会计数据项或财务报表,或者使用从杜邦分解得出的替代比率,能够产生更强的预测模型。我们表明,基于XGBoost和这19个比率的公司质量衡量指标能够更好地解释同期股价,相较于Asness的Q得分。此外,基于我们的XGBoost模型的价值投资交易策略,其表现明显优于基于Asness的Q得分的相同交易策略。


回测表现
| 年化收益率 | 29.53% |
| 波动率 | 31.75% |
| Beta | N/A |
| 夏普比率 | 0.93 |
| 索提诺比率 | N/A |
| 最大回撤 | N/A |
| 胜率 | N/A |
