“加密货币数据。该研究从CoinMetrics收集了每日加密货币数据,CoinMetrics以提供优质加密货币特征数据而闻名。初始样本包括截至2022年1月市值排名前50的加密货币,随后剔除了稳定币和与比特币挂钩的币种,最终样本包含43种加密货币。数据时间跨度从2017年6月到2021年12月,按每周五的收盘价计算周收益率。每年提供了包括加密货币总数、市值、波动性和账户数量在内的汇总统计数据。该样本涵盖了加密货币市场的重要部分,占总市值的至少78%,代表了加密货币市场的显著比例。”
资产类别:加密货币 | 地区:全球 | 频率:每周 | 市场:加密货币 | 关键词:加密货币
策略概述
<数据来源>
该研究从CoinMetrics收集每日加密货币数据,这是一个提供优质加密货币数据的可靠来源。初始样本包括截至2022年1月市值排名前50的加密货币,随后剔除了稳定币和与比特币挂钩的币种,最终样本为43种加密货币。数据范围从2017年6月到2021年12月,按每周五的收盘价计算周收益率。样本涵盖了至少78%的总市值,代表了加密货币市场的重要部分。
<报纸数据>
研究从Factiva收集了关于市值前43位加密货币的新闻文章。搜索关键词包括加密货币的名称和缩写,数据覆盖2017年6月至2021年12月。样本期内,共有27,382篇文章符合搜索条件。
<BERT主题建模方法>
研究的目标是从新闻文章中提取主要主题,以获得对加密货币收益分析的有用信息。传统的主题建模方法(如LDA和LSI)有其局限性,因此该研究使用了BERT模型方法,BERT是一种先进的双向文本表示方法,可以用于主题建模。通过Sentence Transformers和RoBERTa提取文档嵌入,并使用UMAP算法进行降维和相似文档聚类。然后使用基于类的TF-IDF(c-TF-IDF)创建基于聚类的主题,确定每个主题的关键词。提取的主题包括技术内容(如牛市和熊市趋势、技术交易)以及基本面内容(如挖矿、哈希率、网络运营、硬件)。
<技术情绪指数(TSI)和基本面情绪指数(FSI)>
BERT帮助将新闻文章分类为技术性或基本面类。情绪分析通过统计提及特定加密货币的句子中的正面和负面词汇来进行。TSI和FSI情绪指标分别反映了技术交易或基本面交易中的悲观情绪。TSI与市场因子的相关性为-0.27,FSI为-0.18,二者之间的相关性仅为0.04,表明它们捕捉了与传统因素不同的风险维度。
<投资组合构建>
为了评估技术和基本面情绪对加密货币收益的影响,研究根据每种加密货币对TSI和FSI的敏感度构建投资组合。回归模型使用60周滚动窗口进行估计,以计算TSI或FSI的滚动贝塔值,并将加密货币按这些贝塔值排序,形成不同的投资组合。
<技术情绪投资组合>
将加密货币根据TSI的贝塔值分为四个投资组合,并每周重新平衡。研究还构建了一个零成本投资组合HM LTSI,做多TSI贝塔最高的投资组合,做空TSI贝塔最低的投资组合,捕捉高低技术情绪敏感度的加密货币之间的收益差异。
策略合理性
该研究开发了一种基于文本的因素定价框架,通过新闻文章的情绪分析来预测加密货币的收益。市场对基本面和技术交易的讨论情绪为加密货币的横截面收益提供了有价值的信息。情绪悲观的加密货币往往被高估,而情绪悲观的技术分析往往反映出更高的风险,因此投资者要求更高的风险溢价。文本情绪因素提供了超越现有模型的洞见,有助于更好地理解加密货币的收益。
论文来源
Quantifying Narratives and their Impact on Financial Markets [点击浏览原文]
- Ilias Filippou, My T. Nguyen, Ganesh Viswanath-Natraj, 华盛顿大学圣路易斯分校 – John M. Olin商学院,华威商学院
<摘要>
本文研究了基于文本的因素在加密货币市场中的横截面预测能力。通过使用BERT主题建模分析讨论市值前43位加密货币的新闻文章,构建了与基本面和技术交易相关的文本因素。我们发现技术新闻的悲观情绪在加密货币收益横截面上呈正价差,而基本面新闻的悲观情绪呈负价差。这些因素提供了超越现有因素模型的信息,表明在分析加密货币收益时,考虑基于文本的因素至关重要。


回测表现
| 年化收益率 | 37.02% |
| 波动率 | 26.67% |
| Beta | N/A |
| 夏普比率 | 1.3 |
| 索提诺比率 | N/A |
| 最大回撤 | N/A |
| 胜率 | N/A |
