系统化投资

人工智能如何重塑投资格局

本文件仅供派发于合格境内机构投资者使用,不得对外公开(请参阅重要披露)

2024年8月29日

焦点

  • 虽然人工智能(AI)的变革潜力近期才逐渐成为市场的焦点,但近二十年来,这些技术在我们系统化投资方法的演变中发挥了关键作用。
  • 与通用聊天机器人相比,我们用于证券分析的大型语言模型(LLM)是基于范围更小且经过精挑细选的数据集进行训练和微调,从而可以做到高度准确地执行特定的投资任务。
  • 在驾驭不断演变的市场主题方面,我们的主题机器人工具会将专家见解与大型语言模型和大数据的优势相结合,以更高的效率构建股票篮子并且投资范围更加广泛。

随着大型语言模型兴起和生成式人工智能工具广为普及,人们越发认为人工智能有望促进社会、经济和工作流程。

由于人工智能正逐渐向各行各业渗透,本文特此探讨其对投资管理的影响和在这方面的应用。近二十年来,在贝莱德系统化投资中,人工智能和机器学习在我们的投资流程中发挥关键作用。我们充分利用贝莱德在这方面的雄厚实力,旨在从定性领域持续转向定量领域,不断拓宽我们所能估量的范围,以寻求准更精确和差异化的投资结果。

利用人工智能从文本数据中发掘投资见解

大型语言模型(LLM)代表了人工智能研究的显著进步,这受益于模型发展、计算能力得到极大的提升,以及可用于训练的数据量迅速增长。新一代的模型采用转换器技术,这是一种神经网络架构,能够在处理较长的元素序列(如句中的字词)的同时考虑上下文关系。新一代的大型语言模型在大量文本(相当于维基百科规模的1,000多倍)的基础上进行训练。这些模型在训练过程中获得语法知识,以及一些事实知识和基本常识推理。

大型语言模型在投资应用中具实用价值的一项重要技能,就是能够有效分析现有文本数据并从中提取细化见解。作为系统化投资者,我们将来自各种文本来源(包括分析师报告、企业财报电话会议记录、新闻报道和社交媒体)的信息进行整合,为投资预测提供依据,并发掘获取超额回报的潜在机会。1

我们早期分析文本的方法主要是计算文件中出现正面和负面词汇的数量,从而得出一个整体市场情绪评分。虽然事实证明这些信号是有效的,但设计这些分析方法时并未考虑到可能影响文本含义的各种因素。如今,我们不再单独分析每一个词汇,而是利用大型语言模型来整体处理一段文本,考虑每一句甚至整份文件中字词之间的关联。

图表1以“公司”一词为例说明了这一点,我们利用大型语言模型评估其他字词对其含义的重要性。深橙色表示关联度最高的字词,包括公司名称(“XYZ”)、“强劲”和“盈利”。较浅的颜色表示关联性较小。我们致力于扩展对广泛的可用文本数据进行更深入分析的能力,从而在证券分析中提取更细微、更有价值的见解。

图表1:能够考虑文本块中的语境和字词之间的关系,这有望为我们提供更精确且具差异化的投资见解

图表1:能够考虑文本块中的语境和字词之间的关系,这有望为我们提供更精确且具差异化的投资见解

资料来源:贝莱德系统化投资,仅供说明,截至2024年7月。

与大型语言模型相关的通用聊天机器人经过与多个投资主题相关的大量数据输入的训练,使其能够执行广泛适用的大量任务。相比之下,我们对投资过程中使用的大型语言模型进行微调,从而可以执行特定的投资任务,例如预测市场在企业召开盈利电话会议后的反应。这些模型是基于范围更小且更具体的数据集进行训练,以确保高度准确地执行相关任务。

图表2中列示的是我们的盈利电话会议模型的预测准确性与公司O最新推出的GPT模型进行的比较,其中随机抽取了在2024年第一季度召开的500场公司盈利电话会议记录作为样本。值得注意的是,我们的分析表明,公司O的GPT模型的预测准确性随着新版本GPT-4的推出而有所下降。我们认为较合理的解释是,这些模型是根据其作为通用助手来进行训练和评估,重点是提高其生成输出的能力,从而让人觉得每个新版本都是有价值的。一些证据表明,这种形式的微调以牺牲其他应用为代价来增强通用功能,这可能会导致执行特定预测任务的性能下降。这与我们的专有模型形成鲜明对比,我们的模型是基于超过17,000家上市公司的400,000多份盈利电话会议记录,以及过往20年的市场数据进行训练,以明确学习盈利电话会议文本与随后的市场反应之间的关联性。

本文提及的特定公司或证券仅是为了解释不同模型在预测股票回报的准确性,不应解释为研究、投资建议或建议购买、出售、持有或直接投资公司或证券,亦并非为要约或邀请采取任何投资策略、或邀请投资于贝莱德的任何基金。

图表2:我们的专有模型经过微调,能够高度准确预测盈利发布后的市场反应
所示模型在预测盈利发布后40日股票回报的准确性

我们的专有模型经过微调,能够高度准确预测盈利发布后的市场反应

资料来源:贝莱德系统化投资,截至2024年5月。该分析采用500个盈利电话会议记录作为样本,计算了每个模型预测的股票回报,并将其与40日远期回报进行比较。准确性是每个模型预测正确的比例。分析所用模型为GPT-3.5(2023年3月)、GPT-4(2023年6月)、GPT-4 Turbo(2024年1月)、GPT-40(2024年5月)和贝莱德系统化投资模型(2023年12月)。

借力人工智能来驾驭驱动市场的主题

在我们驾驭瞬息多变的市场主题时,大型语言模型也发挥着关键作用。这些主题涵盖从长远趋势到新兴颠覆性趋势等一系列议题,往往能够推动可能并不相关的证券产生可观回报,并通常跨越行业、风格或地域等传统界限。

当某个议题引起市场关注时,例如居家办公迅速风靡或突破性创新产品发布,投资者通常会根据这些情况构建证券篮子,这个过程有可能是人为操作并且十分耗时,或者直接利用现有券商的篮子,但这些篮子可能缺乏透明度和覆盖范围有限。有鉴于此,我们设计了一个快速、灵活构建股票篮子的流程,并称之为“主题机器人”。借助“机器人”,我们能够结合大型语言模型的优势与专有数据,在一个简化工具的帮助下构建长仓/短仓或仅长仓股票篮子。

下文重点介绍了投资组合经理使用该工具就迅速流行的减肥药GLP-1主题构建篮子的案例分析。1这个例子展示了大型语言模型凭借广博的知识库和电话会议文本分析,帮助投资组合经理在短短几分钟内识别出大量受主题积极影响和不利影响的风险敞口。

识别受市场主题影响的股票的过程可能很微妙……

识别受市场主题影响的股票的过程可能很微妙

资料来源:贝莱德系统化投资,仅供说明,截至2024年7月。本通讯提及的公司名称仅供说明,不应诠释为对该公司的投资建议或投资推荐。

贝莱德系统化投资将专家见解大型语言模型大数据整合到一个可重复的框架中,以此来构建股票篮子,从而解决了这一问题。

贝莱德系统化投资将专家见解、大型语言模型和大数据整合到一个可重复的框架中,以此来构建股票篮子,从而解决了这一问题。

资料来源:贝莱德系统化投资,仅供说明,截至2024年7月。

Paragraph-3
Paragraph-4
Paragraph-5
Paragraph-6
Paragraph-7
Paragraph-8

投资组合经理首先指定主题和需要分析的参数,包括可选的种子公司

投资组合经理首先指定主题和需要分析的参数,包括可选的种子公司。

投资流程或会更改,仅供参考说明之用。无法保证会取得正面的投资回报。

大型语言模型通过确定受影响的商业模式,并利用从文本分析得到的额外见解将这些风险敞口与上市股票进行匹配,从而创建股票篮子

大型语言模型通过确定受影响的商业模式,并利用从文本分析得到的额外见解将这些风险敞口与上市股票进行匹配,从而创建股票篮子。

投资流程或会更改,仅供参考说明之用。无法保证会取得正面的投资回报。

输出结果提供了标准化的篮子表现,从中可以看出对上市种子公司的长仓为投资表现带来最大贡献……

输出结果提供了标准化的篮子表现,从中可以看出对上市种子公司的长仓为投资表现带来最大贡献

但其他很多为投资表现带来主要贡献的持仓为短仓,说明有望识别出交易中不太明显的部分。

但其他很多为投资表现带来主要贡献的持仓为短仓,说明有望识别出交易中不太明显的部分。

投资流程或会更改,仅供参考说明之用。无法保证会取得正面的投资回报。

通过深入分析输出结果,可以看到大型语言模型识别出的受影响商业模式的类型。

通过深入分析输出结果,可以看到大型语言模型识别出的受影响商业模式的类型。

投资流程或会更改,仅供参考说明之用。无法保证会取得正面的投资回报。

此外,大型语言模型还就每个类别提供详细的理据,以提高透明度

此外,大型语言模型还就每个类别提供详细的理据,以提高透明度。

投资流程或会更改,仅供参考说明之用。无法保证会取得正面的投资回报。

文本分析有助于识别甚至更间接的公司联系,并提供其如何受相关主题影响的详细视图。

文本分析有助于识别甚至更间接的公司联系,并提供其如何受相关主题影响的详细视图。

投资流程或会更改,仅供参考说明之用。无法保证会取得正面的投资回报。

重要的是,投资组合经理的专业知识贯穿整个流程,从确定具体主题或情景、利用人为确定的先验知识自定义分析、在大型语言模型的逻辑中完全透明地迭代输出,以及精炼投资组合所表达的见解。该工具的目的是实现快速、大规模地构建主题篮子,提供与投资主题直接或间接相关的公司的全面视图。

我们将这些主题见解用于系统化策略的广泛应用,包括利用股票投资组合的超额回报,衡量现有投资组合对新兴主题的敞口,以及随时间推移在驱动市场的广泛主题之间进行战术性轮换。 

在上述例子中,机器人只需要最少的人为干预就能帮助识别出主题交易中不太明显的部分。但在某些情况下,投资组合经理的见解对于纠正大型语言模型所犯的错误或提供更多背景以提高输出质量至关重要。虽然大型语言模型的进步和框架的不断发展旨在减少技术的局限性和相关风险,但投资专家的参与对于人工智能在投资管理中的任何应用仍然至关重要。

结论

随着人工智能的日益普及,引发了市场对其在投资领域潜在影响讨论的升温。贝莱德系统化投资,多年来一直秉持利用人工智能和机器学习来协助大规模投资的理念,例如使用大型语言模型来提高基于文本的投资分析的准确性以及构建主题篮子的效率。随着市场不断演变,我们利用这些工具将数据转化为具有价值的见解,以追求更好的投资结果。

Raffaele Savi
系统化投资主管兼系统化股票联席主管和联席投资总监
Jeff Shen 博士
系统化股票联席主管兼联席投资总监
Yaki Tsaig
系统化股票研究科学家
Taylor Dufour
系统化股票研究员兼投资组合经理