“该策略关注于574种加密货币,数据来源于CryptoCompare和IntoTheBlock,涵盖2017年7月1日至2022年7月6日。使用34个预测变量(如交易量和流动性比率)并应用多种机器学习模型(如OLS、PLS、LASSO、SVM、RF、GBRT和神经网络)。每周根据模型预测的回报对资产进行排名,并形成等权和价值加权投资组合,执行长短策略,买入预测回报最高的资产,卖出最低的资产。”
资产类别:加密货币 | 区域:全球 | 频率:每周 | 市场:加密货币 | 关键词:机器学习,加密货币
策略概述
信息的来源是CryptoCompare.com,提供OHLC价格和交易量数据,以及IntoTheBlock.com,提供区块链活动数据。使用了一系列过滤器来清理数据集,以排除潜在的数据错误,遵循了Bianchi和Babiak(2022)的方法。应用这些过滤器有助于创建最终的样本,其中包含574种不同的加密货币。研究期间为2017年7月1日至2022年7月6日。在文章创作时,CoinMarketCap.com报告了超过24,000种在不同交易所交易的代币。专注于更具交易性和更大规模的代币,使得使用的样本涵盖了大部分全球市场(574种加密货币)。
根据文献(Liu等人(2022),Bianchi和Babiak(2022)),鉴别、分类和复现了34个基于金融文献的预测回报变量,例如交易量、流动性比率、换手率、CAPM beta、风险价值、长期反转等(见第44、45页的表1)。选择了机器学习方法,基于Gu等人(2020)、Bali等人(2022)和Leippold等人(2022)。因此,考虑了10种不同的模型。训练期为150天,验证期为50天。
- 普通最小二乘回归(OLS)
- 相对简单的模型,不涉及正则化、超参数调整或验证。存在过拟合的高风险(尤其是在高维环境中)。OLS假设拟合一个多元预测回归,利用所有特征作为模型输入,根据文献。
- 部分最小二乘(PLS)
- 是一种有效的降维技术,考虑了协变量与证券回报之间的关联。三遍PLS回归侧重于与加密货币回报强相关的特征。回归中的成分数量是调整参数。
- 带惩罚的线性回归(LASSO,ENET)
- 通过对斜率系数施加惩罚项来解决过拟合问题。采用了两种非常流行的正则化方法——最小绝对值收缩和选择算子(LASSO)以及弹性网络(ENET)。
- 支持向量机(SVM)
- 模型搜索超平面,将多维向量空间按区域划分为聚类。向量表示加密货币特征,在本文中。
- 随机树模型(RF,GBRT)——灵活的非参数算法,有效捕捉回报的交互作用和非线性关系。树是分阶段构建的,分割变量和决策节点决定了树的结构,根据作者。采用了两种流行的方法——随机森林(RF)和梯度提升回归树(GBRT)。
- 前馈神经网络(NN1,NN2)
- 包括一个输入层(即加密货币特征)、多个隐藏层(包含激活和转换特征的函数)和一个输出层(将隐藏层的结果转换为回报预测)。信息通过神经元流动,从输入层经过隐藏层到输出层。
- 作者使用了两个版本一个NN1和两个NN2层。第一层和第二层分别由16个和8个神经元组成。采用修正线性单元作为激活函数,并使用了Adam算法进行优化(Kingma和Ba,2014)。
- 预测组合(COMB)
- 对来自各种模型的多个预测进行加权。合并模型有助于降低它们的方差并减少预测误差。COMB预测是对上述九种单独模型的预测进行简单的等权平均。
该方法形成了单向排序投资组合。每周,根据不同的机器学习模型预测的预期回报对所有排名资产进行排名。接下来,将所有资产分为五分位数,形成等权和价值加权的投资组合。采用长-短策略,购买/卖出预测回报最高/最低的五分位数加密货币。
策略合理性
加密货币投资和机器学习工具在过去几年中吸引了投资者的注意。该策略功能的主要原因是将这两个领域相结合。接下来,本文中所提出的模型生成的所有预测都创造了可衡量的经济收益。变量重要性分析有助于精确确定关键变量。大多数模型的可预测性都基于相对简单的信号。例如,距离90天高点的距离、价值风险、名义价格、最大日回报、CAPM alpha和特有波动率等。在加密货币特征的一般类别方面,最重要的是波动性、流动性和过去的回报。本文的结果与对回报可预测性的错误定价观点相关。加密货币机器学习策略产生了惊人的阿尔法。这在其他资产类别中并不常见。主要是阿尔法的夏普比超过了发达或新兴股市中机器学习策略的夏普比。长-短期机器学习策略的收益高达60%可以用于交易成本。尽管如此,剩余的利润仍然很高。它们与股票市场中的对应品相媲美。
论文来源
Machine Learning and the Cross-Section of Cryptocurrency Returns [点击浏览原文]
- Nusret Cakici, Syed Jawad Hussain Shahzad, Barbara Bedowska-Sojka, Adam Zaremba, Fordham university, Montpellier Business School, Poznań University of Economics and Business, Montpellier Business School; Poznan University of Economics and Business; University of Cape Town
<摘要>
我们采用了一系列机器学习模型来探索加密货币市场的横截面回报可预测性。虽然所有方法都产生了可观的经济收益,但那些考虑了非线性和交互作用的模型效果最好。回报可预测性主要来自一些简单的特征,例如特异波动率、过去的阿尔法或最大日回报,并且很可能是由错误定价驱动的。因此,异常收益主要源自空头头寸,集中在难以套利的资产上,并随时间逐渐下降。尽管投资组合周转率较高,但机器学习策略在扣除交易成本后仍然盈利。然而,它们在很大程度上依赖于对小型加密货币的空头头寸,这在实践中可能会带来挑战。


回测表现
| 年化收益率 | 11.09% |
| 波动率 | N/A |
| Beta | N/A |
| 夏普比率 | N/A |
| 索提诺比率 | N/A |
| 最大回撤 | N/A |
| 胜率 | N/A |
