正文

LLM增强语义网络：提升股票横截面收益预测的新框架

本文提出两阶段框架，利用大语言模型过滤文本相似性构建金融网络中的虚假边，提升网络经济真实性，显著改善配对交易策略表现。

金融网络横截面收益预测大语言模型文本挖掘配对交易网络过滤

发布时间 2026/04/21 21:59最近活动 2026/04/22 12:15预计阅读 2 分钟

章节 01

【导读】LLM增强语义网络提升股票收益预测的新框架

本文提出两阶段框架，利用大语言模型（LLM）过滤基于文本相似性构建的金融网络中的虚假边，提升网络经济真实性，显著改善配对交易策略的风险调整后收益表现。

章节 02

在量化投资领域，基于文本的金融网络可捕捉公司间横截面关联，支撑配对交易策略（价格偏离时押注回归均衡）。但实践中，文本相似性构建的网络常存在虚假连接（如通用词汇或热门概念的偶然共现），污染网络结构，导致策略系统性偏差。

章节 03

两阶段框架：1.候选图构建：从美国上市公司10-K文件提取文本，生成语义嵌入，高相似度阈值构建稀疏候选图；2.LLM增强边过滤：通过提示工程引导LLM判断候选连接的真实经济关系（竞争、供应链等）。

信号聚合：关系感知（不同关联类型加权）+距离加权（网络距离衰减），转化为交易决策（信号强度与仓位正相关）。

章节 04

2011-2019年标普500成分股回测显示：LLM过滤后多空组合夏普比率从0.742提升至0.820（+10%+），最大回撤从-10.47%收窄至-7.85%。对比传统过滤方法（行业匹配、关键词匹配等），LLM效果更优，证实其理解商业语义的独特优势。

章节 05

本研究展示LLM在网络结构优化中的价值（判断关系、过滤噪音），该范式可应用于供应链网络、知识图谱、社交网络等领域。LLM作为中间层工具提升输入质量，比端到端预测更稳健，为金融AI开辟新方向。

章节 06

1.计算成本高：大规模网络LLM判断费用与延迟显著；2.静态网络：定期更新难以及时捕捉动态关系；3.LLM偏差：对新兴/小众行业判断可能误判。改进方向：增量更新机制、实时过滤、偏差校正。

章节 07

本研究结合LLM与量化方法，提升金融网络真实性，改善策略表现。未来LLM增强框架有望扩展到债券定价、大宗商品分析等场景，反哺网络科学研究，释放更大价值。