Zing 论坛

正文

LLM增强语义网络:提升股票横截面收益预测的新框架

本文提出两阶段框架,利用大语言模型过滤文本相似性构建金融网络中的虚假边,提升网络经济真实性,显著改善配对交易策略表现。

金融网络横截面收益预测大语言模型文本挖掘配对交易网络过滤
发布时间 2026/04/21 21:59最近活动 2026/04/22 12:15预计阅读 2 分钟
LLM增强语义网络:提升股票横截面收益预测的新框架
1

章节 01

【导读】LLM增强语义网络提升股票收益预测的新框架

本文提出两阶段框架,利用大语言模型(LLM)过滤基于文本相似性构建的金融网络中的虚假边,提升网络经济真实性,显著改善配对交易策略的风险调整后收益表现。

2

章节 02

背景:文本金融网络的潜力与现存陷阱

在量化投资领域,基于文本的金融网络可捕捉公司间横截面关联,支撑配对交易策略(价格偏离时押注回归均衡)。但实践中,文本相似性构建的网络常存在虚假连接(如通用词汇或热门概念的偶然共现),污染网络结构,导致策略系统性偏差。

3

章节 03

方法:两阶段框架与信号聚合策略

两阶段框架:1.候选图构建:从美国上市公司10-K文件提取文本,生成语义嵌入,高相似度阈值构建稀疏候选图;2.LLM增强边过滤:通过提示工程引导LLM判断候选连接的真实经济关系(竞争、供应链等)。

信号聚合:关系感知(不同关联类型加权)+距离加权(网络距离衰减),转化为交易决策(信号强度与仓位正相关)。

4

章节 04

证据:回测表现显著提升

2011-2019年标普500成分股回测显示:LLM过滤后多空组合夏普比率从0.742提升至0.820(+10%+),最大回撤从-10.47%收窄至-7.85%。对比传统过滤方法(行业匹配、关键词匹配等),LLM效果更优,证实其理解商业语义的独特优势。

5

章节 05

方法论启示:LLM作为网络质量增强器

本研究展示LLM在网络结构优化中的价值(判断关系、过滤噪音),该范式可应用于供应链网络、知识图谱、社交网络等领域。LLM作为中间层工具提升输入质量,比端到端预测更稳健,为金融AI开辟新方向。

6

章节 06

局限与改进空间

1.计算成本高:大规模网络LLM判断费用与延迟显著;2.静态网络:定期更新难以及时捕捉动态关系;3.LLM偏差:对新兴/小众行业判断可能误判。改进方向:增量更新机制、实时过滤、偏差校正。

7

章节 07

结语:迈向更智能的金融网络分析

本研究结合LLM与量化方法,提升金融网络真实性,改善策略表现。未来LLM增强框架有望扩展到债券定价、大宗商品分析等场景,反哺网络科学研究,释放更大价值。