Zing 论坛

正文

LLM增强语义网络:提升股票横截面收益预测的新框架

本文提出两阶段框架,利用大语言模型过滤文本相似性构建金融网络中的虚假边,提升网络经济真实性,显著改善配对交易策略表现。

金融网络横截面收益预测大语言模型文本挖掘配对交易网络过滤
发布时间 2026/04/21 21:59最近活动 2026/04/22 10:21预计阅读 6 分钟
LLM增强语义网络:提升股票横截面收益预测的新框架
1

章节 01

导读 / 主楼:LLM增强语义网络:提升股票横截面收益预测的新框架

LLM增强语义网络:提升股票横截面收益预测的新框架\n\n## 文本金融网络的潜力与陷阱\n\n在量化投资领域,如何利用非结构化文本数据预测股票收益一直是研究热点。近年来,随着自然语言处理技术的进步,研究者开始构建基于文本的金融网络来捕捉公司间的横截面关联。基本思路是:如果两家公司在业务描述、风险因素或管理层讨论中具有相似的文本内容,它们可能在经济上存在某种联系,其股价走势也可能相互影响。\n\n这种直觉具有坚实的经济学基础。同行业公司面临相似的市场环境和竞争格局,供应链上下游企业相互依存,技术合作或诉讼关系也会建立公司间的联系。通过分析这些关联,投资者可以构建配对交易策略——当一对关联股票的价格出现偏离时,押注它们最终会回归均衡。\n\n然而,实践中基于文本相似性构建的网络往往充斥着虚假连接。文本接近并不必然意味着经济关联。两家公司可能在年报中使用相似的通用词汇(如"市场波动"、"监管风险"),但实际上分属完全不同的行业;或者它们可能恰好同时提及某个热门概念(如"人工智能"),但业务实质并无交集。这些虚假边(spurious edges)会严重污染网络结构,降低后续信号聚合的有效性,甚至导致交易策略产生系统性偏差。\n\n## 两阶段框架:从稀疏候选到精准过滤\n\n针对上述问题,研究者提出了一个创新的两阶段框架,巧妙地将大语言模型的推理能力融入金融网络构建流程。\n\n第一阶段是候选图构建。研究者从美国上市公司年报(10-K文件)中提取文本内容,使用预训练语言模型生成语义嵌入。基于这些嵌入的相似性,构建一个稀疏的候选连接图。这里的"稀疏"是关键设计——研究者有意采用较高的相似度阈值,确保只有文本高度相似的公司对才进入候选集。这种保守策略宁可遗漏一些真实连接,也要避免引入过多噪音。\n\n第二阶段是LLM增强的边过滤。这是框架的核心创新。对于候选图中的每条潜在连接,研究者设计了一套提示工程策略,引导大语言模型判断两家公司之间是否存在真实的经济关系。提示中包含两家公司的基本信息(行业、主营业务)以及从10-K中提取的关键文本片段,要求模型分析它们之间可能的关联类型(竞争、供应链、技术合作、共同客户等)或判定无实质关联。\n\n这种设计的精妙之处在于充分发挥了大语言模型的世界知识和推理能力。与基于嵌入相似度的机械匹配不同,LLM能够理解商业逻辑,识别文本相似背后的真实经济含义。例如,两家都提到"半导体"的公司,LLM可以判断一家是芯片制造商、另一家是设备供应商(真实供应链关系),还是两家都是无晶圆厂设计公司(竞争关系),抑或只是都在讨论行业趋势(无实质关联)。\n\n## 信号聚合:关系感知与距离加权\n\n经过LLM过滤后的精炼网络,被用于聚合配对级别的均值回归信号。研究者采用了一种关系感知且距离加权的聚合策略。\n\n关系感知体现在不同经济关联类型对信号传递强度的差异化处理。例如,供应链关系可能意味着较强的收益联动——上游成本波动直接影响下游利润;而单纯的行业归属关联可能只产生较弱的同向波动。框架根据LLM判定的关系类型,为每条边分配不同的权重系数,实现信号的差异化聚合。\n\n距离加权则借鉴了网络科学中的衰减效应。在金融网络中,公司间的间接关联(通过多跳路径连接)通常比直接关联的信号传递能力更弱。框架引入基于网络距离(最短路径长度)的衰减函数,对远距离信号进行降权处理,避免网络中的噪音通过长路径累积放大。\n\n聚合后的股票级信号被转化为具体交易决策:对于信号强度超过阈值的股票,建立多头或空头头寸;信号强度与仓位大小正相关。这种设计使得策略能够动态调整敞口,在信号强的机会上重仓,在信号模糊时保持谨慎。\n\n## 回测表现:夏普比率与风险控制的显著提升\n\n研究者在2011年至2019年的标普500成分股数据上进行了全面的历史回测。这一时间段涵盖了多种市场环境——包括欧债危机、美联储量化宽松、以及贸易战初期的市场波动——为策略的稳健性检验提供了丰富样本。\n\n核心结果令人印象深刻:引入LLM边过滤后,多空组合的夏普比率从0.742提升至0.820,提升幅度超过10%。更重要的是,最大回撤从-10.47%收窄至-7.85%,风险调整后的收益显著改善。这些改进完全来自于网络质量的提升——相同的底层信号生成逻辑,相同的聚合算法,唯一的区别是网络构建过程中是否使用LLM进行边过滤。\n\n深入分析表明,LLM过滤主要带来了两方面改进。首先,剔除虚假边减少了信号噪音,使聚合后的股票级信号更加纯净、预测能力更强。其次,保留的真实经济关联边具有更强的经济学逻辑支撑,其对应的配对均值回归信号更加稳健,在不同市场周期中的表现一致性更好。\n\n对比实验进一步验证了LLM的关键作用。研究者尝试了多种传统过滤方法——基于行业分类匹配、基于人工词典的关键词匹配、基于统计显著性的边筛选——这些方法虽然也能带来一定改进,但效果远不及LLM过滤。这证实了大语言模型在理解商业语义、识别经济关联方面的独特优势。\n\n## 方法论启示:LLM作为网络质量增强器\n\n该研究为金融文本挖掘领域提供了重要的方法论启示。传统上,NLP在金融中的应用主要集中在信息提取(如从新闻中提取事件、从财报中提取情绪),而本研究展示了LLM在网络结构优化中的价值——不仅仅是提取信息,更是判断关系、过滤噪音、提升数据质量。\n\n这种"LLM作为质量增强器"的范式具有广泛的适用性。在供应链网络构建中,LLM可以帮助区分真实的供应商-客户关系与偶然的共现关系;在知识图谱构建中,LLM可以验证实体间关系的合理性;在社交网络分析中,LLM可以识别真正有意义的互动与随机的关注关系。任何基于文本相似性构建网络的领域,都可能从这种增强框架中受益。\n\n此外,该研究也为大语言模型在经济金融领域的应用开辟了新方向。除了直接用于预测或生成,LLM可以作为中间层工具,提升其他机器学习流程的输入质量。这种间接应用模式可能更具实用价值——毕竟,金融预测的最终表现受多种因素影响,单纯依赖LLM进行端到端预测可能面临过拟合和可解释性挑战;而将LLM用于数据清洗和特征工程,则能更稳健地提升整体系统性能。\n\n## 局限与改进空间\n\n尽管取得了积极成果,该框架仍存在一些值得关注的局限。首先,LLM边过滤的计算成本较高。对于大规模网络,对每对候选连接调用LLM进行判断可能产生显著的API费用和延迟。研究者通过第一阶段的稀疏候选策略缓解了这一问题,但在覆盖更广的股票范围(如全美股或全球股票)时,成本仍是实际考虑。\n\n其次,框架目前采用离线批处理模式,网络结构定期更新(如每年根据新发布的10-K重建)。在快速变化的市场环境中,公司间的经济关系可能动态演变,静态网络可能无法及时捕捉这些变化。探索增量更新机制或实时边过滤策略,是提升框架时效性的方向。\n\n此外,LLM的判断虽然优于基于相似度的启发式方法,但仍可能存在偏差。例如,LLM可能对某些行业(如科技、金融)的商业模式更熟悉,判断更准确;而对新兴行业或小众领域可能产生更多误判。如何量化和校正这些系统性偏差,是未来改进的重要课题。\n\n## 结语:迈向更智能的金融网络分析\n\n该研究展示了将大语言模型与传统量化方法相结合的巨大潜力。通过在金融网络构建中引入LLM的推理能力,研究者成功提升了网络的经济真实性,进而改善了配对交易策略的风险调整后收益。这一成果不仅具有直接的实用价值,更为金融AI的发展提供了重要启示:未来的竞争优势可能不仅来自于更复杂的预测模型,更来自于更高质量的输入数据和更合理的网络结构。\n\n随着大语言模型能力的持续提升和成本的逐步降低,我们可以期待LLM增强网络分析框架在更多场景中得到应用。从股票收益预测扩展到债券定价、大宗商品分析、甚至宏观经济监测,文本金融网络的构建质量提升将释放更大的价值。同时,这一方法论也可能反哺网络科学研究本身,为其他领域的网络构建提供新的工具和思路。