本文研究通过经理人收益电话会议的言语线索预测未来收益变化,利用CNN、wav2vec 2.0和SVM模型分析声音特征。数据涵盖2015-2020年美国上市公司的收益电话会议,模型评估通过AUC衡量。结果显示,基于言语线索的交易策略产生显著的超额收益,年化平均超额回报达8.79%。这表明,投资者尚未充分利用电话会议中的言语线索作为决策依据,具有经济相关性。

策略概述

<理论背景>
本文提供了有关预测未来收益的研究的理论背景,并介绍了研究的制度环境。该部分首先强调了收益在评估公司成功、与同行比较、确定公司价值和股价中的重要性。以往的研究表明,由于运营活动、经济发展、管理激励和财务报告规则之间的复杂关系,预测收益具有挑战性。虽然早期研究表明,收益变化遵循随机游走模式且不可预测,但最近的研究集中于开发能够预测未来收益变化方向的模型。
作者回顾了各种收益预测方法,包括使用财务报表变量、财务比率、混合数据采样回归和集成算法。他们还提到了探索文本数据预测能力的研究,如年报的可读性以及财务报告和新闻稿的语气。然而,这些研究大多依赖于样本内分析,而没有检验文本数据对未来收益的样本外预测能力。
为解决这一研究差距,本文重点探讨了通过经理人在收益电话会议中的言语线索来预测收益变化方向的能力。收益电话会议被认为适合该研究,因为它们是常见的、重要的信息事件,分析师和投资者都会参加。这些电话会议中问答环节的问题可以引发情感反应,揭示经理人的情绪状态,而这些状态可能传达未来业务结果的信息。
作者强调了言语线索作为情感沟通渠道的重要性,并提出它们提供了与口头讲话内容不同的个人情绪状态的视角。言语线索被认为不太容易控制,可能无意中透露出情绪状态。对情境刺激(如收益电话会议中的问题)的评价被认为会影响经理人的情绪状态和对公司业绩的隐性评估。
心理学、神经科学、会计和金融领域的先前研究提供了证据,表明言语线索传达了有关未来公司业绩和财务造假有用的信息。然而,由于手动处理音频录音的挑战,关于言语线索样本外预测能力的研究有限。本文旨在通过使用机器学习算法和强制对齐技术自动检测和分析收益电话会议中的CEO言语来克服这一限制。

<数据>
本文描述了数据收集过程及其在预测美国上市公司收益变化方向中的应用方法。研究人员从Refinitiv Eikon收集了财务信息,并从2015年到2020年的收益电话会议中获取了音频录音和文本记录。他们使用了强化对齐算法将音频录音与相应的文本同步,并识别出问答环节中CEO的讲话。在对音频片段进行对齐和验证后,他们将它们合并为每个电话会议的单个音频文件。最终,他们得到了由2,372家独特公司组成的8,436个公司年份样本。
研究人员专注于预测未来一年收益变化的方向,因为这比预测变化幅度更为可靠。他们估算了去趋势的每股收益(EPS)变化,以考虑公司特定的趋势,并将收益增加编码为1,收益减少编码为0,用于二元分类。他们使用滚动前移的分割方案来训练和测试预测模型,逐步将训练集向前移动,同时保持固定数量的训练年。模型的评估使用了ROC曲线下面积(AUC),它衡量了模型对预测的排序能力,以及准确性、精确度和负预测值。总体而言,研究使用了一个大样本,旨在根据收益电话会议中CEO的言语预测美国上市公司未来一年收益变化的方向。

<模型>
本文的这一部分讨论了在企业环境中分析言语线索的实施挑战和模型。作者强调了人类声音的两个重要特征:言语的粒度和言语的顺序性。
为了解决这些特征,作者提出了三个言语线索模型。第一个模型Vocal Cues I使用卷积神经网络(CNN)处理管理者声音的频谱图。频谱图捕捉了声音随时间的频率和振幅变化,允许对言语线索进行粒度和顺序分析。作者使用集成方法将多个频谱图的概率估计结合起来进行预测。更多细节见4.1.2节。
第二个模型Vocal Cues II使用了wav2vec 2.0,一种为自动语音识别设计的深度学习架构。该模型处理原始波形,利用多层CNN、量化器和变压器获取语音单元的上下文表示。作者对预训练的wav2vec 2.0模型进行了微调,用于未来收益变化的分类。更多细节见4.1.3节。
第三个模型Vocal Cues III采用支持向量机(SVM)结合语音特征。该模型考虑了CEO言语的语音特征,但未对言语线索进行深入的顺序分析。更多细节见4.1.4节。
在基准模型方面,作者使用了Chen等人(2022年)提出的基于财务数据的两个收益预测模型。第一个基准模型是随机森林模型,使用高维财务变量。第二个基准模型是基于前一棵树的预测误差生长树的随机梯度提升算法。
总体而言,作者强调了粒度和顺序性分析言语线索的计算需求和内存限制。他们也承认仅分析60秒CEO讲话的潜在限制,但基于现有研究和实践对其进行了合理化解释。

<部分结果>
表3中展示的结果表明,基于管理者言语线索的交易策略所生成的样本外超额收益既具有统计学意义,也具有经济意义。CNN模型的月度组合回报率从9.34%到17.03%,wav2vec 2.0模型为5.43%到5.61%,SVM模型为7.22%到8.12%。所有使用言语线索的交易策略的年化样本外超额收益平均值(中位数)为8.79%(7.67%)。这些发现特别具有意义,因为这些组合的换手率较低,意味着它们是根据预测的未来一年收益变化形成的,并在全年保持不变。
这些结果表明,基于言语线索的模型对投资者具有经济相关性。尽管模型的AUC性能已经表明了这一点,但也有可能投资者已经将言语线索信息纳入其交易决策中。如果是这种情况,尽管模型具有显著的AUC,但它们可能无法产生显著的超额回报,因为这些信息已经反映在股价中。然而,基于观察到的超额回报,可以得出结论:投资者目前并未在做出投资决策时考虑言语线索中的信息信号。

策略合理性

本文提出的策略之所以有效,根本原因在于管理者讲话中的言语线索提供了有关未来公司收益的增量信息。文章认为,管理者的言语线索反映了他们的真实情感状态,能够传递他们对当前和未来公司业绩的内部评估信息。与数字化财务数据和经过精心编写的披露内容不同,言语的产生和言语线索难以控制,可能会无意中透露管理者不打算披露的信息。
该策略专注于使用两种不同的模型架构分析音频数据中的言语线索:卷积神经网络(CNN)和wav2vec 2.0。这些模型旨在整合大数据分析,并考虑到言语线索的粒度和顺序性。通过分析管理者在收益电话会议中与财务分析师和投资者互动的音频记录,研究识别出了可以用于预测未来一年收益变化方向的预测性言语线索。
文章表明,提出的言语线索模型具有显著的样本外预测能力,并且优于基于财务数据和文本输入的现有收益预测模型。这些模型还显示了其经济相关性,通过交易策略产生超额收益,并提高了财务分析师的表现。总体而言,该策略的功能在于利用言语线索作为一种新颖且具有理论依据的方法来预测未来的收益变化。

论文来源

Listen Closely: Using Vocal Cues to Predict Future Earnings [点击浏览原文]

<摘要>

在本研究中,我们旨在提升公司收益预测的准确性——这对于许多商业应用来说是至关重要的任务。现有的收益预测模型通常仅依赖于数值财务数据,而我们假设并发现,管理者讲话中的言语线索具有显著的预测能力:其接收者操作特性曲线下面积(AUC)在61.20%到63.44%之间,显著高于基于详细财务数据和文本输入的模型。我们进一步分析了这些模型对投资实践者的经济价值。研究发现,投资者可以利用这些模型的收益预测来实施交易策略,平均每年超越市场8.8%。此外,财务分析师可以通过言语线索提高其收益预测准确性超过40%。总体而言,我们的结果表明,管理者的言语线索是未来收益的重要信息信号,而这些信号目前被投资实践者忽视了。

回测表现

年化收益率17.03%
波动率N/A
BetaN/A
夏普比率N/A
索提诺比率N/A
最大回撤N/A
胜率N/A

Leave a Reply

Discover more from Quant Buffet

Subscribe now to keep reading and get access to the full archive.

Continue reading