“投资范围涵盖三种机器学习方法:随机森林、梯度提升回归树和稳健弹性网,评估模型性能。数据使用Refinitiv环境数据,覆盖1,500家公司,包含81个环境变量,确保数据质量。实证结果表明,机器学习方法优于OLS,生成有效的多空投资组合,显示环境变量对回报的影响。交易策略分析绿色与棕色股票,收集相关数据,构建投资组合并进行风险管理。”
资产类别:股票 | 区域:美国 | 频率:月度 | 市场:股票 | 关键词:机器学习
策略概述
<方法论>
第 2 节介绍了三种不同的机器学习方法,并随后应用于研究环境变量对资产回报的影响。
- 随机森林 (RF):该方法基于决策树,通过将数据划分为行为相似的观测组来工作。它使用自举样本构建多棵树,并在每棵树中选择最优变量进行节点分割。预测回报是通过在每个分区内取平均值计算的。本文通过改变树的数量和树的深度来探索不同情景下模型性能的变化。
- 梯度提升回归树 (GBRT):与随机森林不同,GBRT 使用许多浅层树,并迭代地结合它们的预测。这种集成方法减少了过拟合,并提高了模型的稳定性。本文讨论了不同的超参数组合,例如树的数量和学习率,以优化模型的性能。
- 稳健弹性网 (RENET):该方法解决了财务数据中相关解释变量和异常值的问题。它结合了 Huber 稳健目标函数和弹性网惩罚函数以选择相关特征。Huber 损失函数用于在存在异常值时保持稳健性。弹性网惩罚结合了 LASSO (L1) 和 RIDGE (L2) 惩罚,以进行变量选择和系数缩减。
本文还概述了其性能评估方法,包括基于样本外非中心 R 方和多空投资组合回报评估模型。强调了不同的训练、验证和样本外测试样本的使用,以有效优化和评估模型。
<数据>
第 3 节中,作者使用了来自 Refinitiv 的环境数据,该数据集涵盖了详细的环境变量,样本期从 2020 年 1 月开始。研究指出,该时间点早于 2020 年 4 月对公司最终 ESG 评级的重新评估,强调了基础环境指标的稳定性。该数据集涵盖约 1,500 家公司,其中 Compustat 公司中 25% 至 30% 的样本包括持续的环境变量。为了确保数据质量,作者设定了严格的标准,要求环境变量覆盖至少 60% 的公司年度观测值,对于超过 20% 环境变量缺失的观测值将被排除。数据集包含 81 个环境变量,包括排放、创新和资源使用,既有连续变量,也有哑变量。作者采用滚动分析方法,从 2007 年开始,训练、验证和样本外测试样本随时间变化。此外,文章比较了环境变量与 20 个已知预测股票回报的公司特征的预测能力,形成了一个综合数据集用于分析。
<实证结果>
第 4 节中,作者展示了他们的研究结果。他们首先证明,机器学习方法生成了统计上显著的样本外 R 方,超过了传统 OLS 方法。然后,他们揭示了基于这些机器学习方法构建的多空投资组合持续产生显著的平均回报和异常回报。此外,Fama-MacBeth 回归中预测的回报与未来的实际回报呈正相关。作者讨论了变量选择的结果,说明哪些环境变量在预测回报中尤其具有影响力。最后,他们提供了证据表明,这些多空投资组合对气候问题冲击敏感,表明这些投资组合在气候关注度增加期间表现更好。
<交易执行>
绿色股票与棕色股票
- 目标:利用表 3 中确定的绿色和棕色股票之间的表现差异获利。
- 假设
- 您可以获取表 3 中使用的环境表现数据或相关预测。
- 您可以以低交易成本实施交易。
- 历史表现模式将持续。
- 步骤
- 数据收集:收集您想交易的股票的环境表现数据或预测。确保您拥有与研究中使用的相同指标,例如与排放、创新和资源使用相关的指标。
- 排序:使用相同的机器学习方法(RF、GBRT 或 RENET)根据环境表现指标预测您选择的股票的回报。 根据所选机器学习方法对股票进行排名,从预测回报最高的绿色股票到预测回报最低的棕色股票。
- 投资组合构建
- 构建一个包含绿色股票(即预测回报最高的股票)的长仓投资组合。
- 构建一个包含棕色股票(即预测回报最低的股票)的空仓投资组合。
- 确保您的多头和空头仓位在资金分配上保持平衡。
- 再平衡:定期再平衡您的投资组合,例如每月或每季度,以保持长仓和空仓在最高和最低分位数中的头寸。
- 风险管理:实施风险管理技术,例如设置止损单或仓位大小限制,以保护您的投资组合免受重大损失。
- 监控:持续监控您的多空投资组合的表现,并根据需要进行调整。
- 退出策略:如果环境表现数据或预测发生重大变化,或者策略不再产生正回报,请考虑退出交易。
请记住,过去的表现并不保证未来的结果。在实施任何交易策略之前,务必进行充分的研究和回测。此外,在做出重大投资决策之前,请考虑咨询财务顾问或专业人士。
策略合理性
本文所提出的策略的功能性来源于几个关键因素。它们基于环境可持续性的重要性日益提高,满足了在气候变化背景下对环境责任投资机会日益增长的需求。通过利用详细的环境数据,这些策略提供了对公司环境表现的细致理解,包括第 3 类排放和运营指标等因素。机器学习技术通过捕捉环境变量与资产回报之间的复杂、非线性关系,提高了预测的准确性。通过识别具有卓越环境表现的公司,这些策略为投资组合中减轻环境和气候相关风险提供了途径,产生阿尔法,促进透明度,并鼓励长期投资视角,最终与向绿色经济的过渡保持一致。
论文来源
Granular Environmental Variables and Stock Returns
- W. O. Brown、X. Gao、Y. Han、D. Huang、F. Wang
<摘要>
单个环境变量可能包含在聚合环境评分中被掩盖的用于回报预测的信息。我们将机器学习方法应用于细粒度的环境变量,并发现做多高预测回报股票、做空低预测回报股票的多空投资组合每月可赚取约1%的回报。高预测回报股票与强劲的环境运营表现相关。与第 3 类排放相关的变量为被忽视的风险。当媒体对气候问题的关注度更高时,多空投资组合表现更好。

回测表现
| 年化收益率 | 16.1% |
| 波动率 | 12.85% |
| Beta | N/A |
| 夏普比率 | N/A |
| 索提诺比率 | N/A |
| 最大回撤 | N/A |
| 胜率 | N/A |
