该策略基于股票表现概率排序,采用随机森林回归预测回报,并使用滚动窗口进行回测。投资组合按股票预期表现分类,买入高表现概率股票,卖出低表现股票。优化模型参数后,投资组合波动性较低,回报较高,并在危机中展现出更强抗风险能力。

策略概述

<数据来源>
作者从Refinitiv的Datastream中收集了1990年至2018年的国际股票市场数据,涵盖了来自68个国家的股票。分析所用的技术指标基于前一年股票价格数据计算。为了确保数据的可靠性,作者专注于流动性较好的股票,并排除每月回报最高和最低的0.1%的股票。最终数据集包括来自67个国家的18,973只股票,尽管并非所有股票在整个投资期内都符合流动性标准。

<模型构建>
为了克服基于绝对股票回报预测的投资组合的弱点,尤其是使用机器学习方法时,作者提出了一种基于股票表现概率的排序方法,并与随机森林回归器的预测结果进行比较。在模型的构建中,作者通过回归模型计算股票的预期回报,采用了滚动窗口技术进行回测。分析结果显示,基于分类的投资策略相较于基于回归的策略偏向小市值股票较少,平均市值更高,波动性和最大回撤较低,夏普比率(1.95)也更高。

<参数优化>
作者通过调整随机森林模型的参数进行优化,确定最佳决策树数量和最大特征数量。他通过绘制OOB(袋外)误差率曲线,发现2000个估计器是最佳决策树数量。模型中的决策树深度为23,以平衡过拟合问题。

<投资组合评估>
作者构建了基于模型的多种投资组合,并且研究了正确与错误分类的实际回报差异。结果显示,高表现概率的股票组合回报率较低表现股票组合显著高出,年化收益率差距达41个百分点。此外,波动性和最大回撤较低的投资组合在危机期间表现出更强的抗风险能力,夏普比率也较高。价值加权的投资组合显示出相似的模式,同时降低了尾部风险。

策略合理性

提出的使用随机森林分类模型进行股票排名的方法的核心功能是帮助资产管理者解决未来选择表现优异股票的挑战。传统的基于有效市场假说的预测模型在准确预测未来股票价格走势方面表现有限。然而,随着计算能力的提升,研究人员转向了支持向量机、深度学习和集成模型等机器学习算法,这些算法在预测短期股票价格趋势方面展现了良好效果。该随机森林分类模型利用了机器学习算法的能力,捕捉股票行为中的非线性模式和异常,从而提高股票排名和选择的准确性。通过基于多棵决策树的分类结果计算超额收益概率,该模型旨在为风险厌恶型投资者提供波动性较小但仍能显著跑赢市场的投资组合。

该方法的功能性通过对流动性股票数据集的性能评估得到了验证,结果显示出显著的阿尔法收益,并能够在样本外测试中构建表现优异的均值-方差投资组合。总体而言,这种模型的功能性为文献贡献了一种替代性的股票排名与选择方法,通过机器学习技术识别潜在的表现优异股票,从而优化投资策略。

论文来源

Automated Stock Picking using Random Forests [点击浏览原文]

<摘要>

我们通过在国际流动性股票数据集上应用基于技术特征的随机森林模型推导出股票排名。与预测回报不同,我们的排名基于超额表现概率。通过应用十分位分组,我们发现多空投资组合的夏普比率高达1.95,且年化六因素阿尔法显著高达21.79%。此外,我们表明,在投资组合优化的背景下,超额表现概率比其他回报预测指标更能有效预测未来回报。基于该指标的均值-方差投资组合波动性更小且收益更高,优于等权重或市值加权投资组合。我们的发现对公司规模、地区限制和非危机时期具有稳健性,并且不能通过套利限制来解释。

回测表现

年化收益率15.25%
波动率12.48%
BetaN/A
夏普比率1.13
索提诺比率N/A
最大回撤-8.3%
胜率N/A

Leave a Reply

Discover more from Quant Buffet

Subscribe now to keep reading and get access to the full archive.

Continue reading