Zing 论坛

正文

GraphSSR:面向零样本图学习的大语言模型自适应子图去噪框架

GraphSSR是一种创新的两阶段强化学习框架,通过自适应子图采样与去噪机制,使大语言模型能够在未见过的图数据上实现零样本推理。该方法被ACM SIGKDD 2026研究轨道接收。

graph learninglarge language modelszero-shot learningsubgraph denoisingreinforcement learningACM SIGKDD图神经网络大语言模型零样本学习强化学习
发布时间 2026/05/31 17:45最近活动 2026/05/31 17:48预计阅读 2 分钟
GraphSSR:面向零样本图学习的大语言模型自适应子图去噪框架
1

章节 01

【导读】GraphSSR:面向零样本图学习的LLM自适应子图去噪框架

GraphSSR是一种创新的两阶段强化学习框架,通过自适应子图采样与去噪机制,使大语言模型(LLM)能够在未见过的图数据上实现零样本推理。该研究已被ACM SIGKDD 2026研究轨道接收,项目代码与数据集已开源。

2

章节 02

背景与挑战:图学习与LLM融合的核心难题

图学习的局限

传统图神经网络(GNN)依赖大量标注数据训练,面对分布外(Out-of-Distribution)图结构时性能急剧下降。

LLM应用于图学习的挑战

LLM虽具备强大零样本推理能力,但图数据的结构特性与自然语言差异大,如何有效编码图结构并避免噪声干扰,是亟待解决的问题。

3

章节 03

核心方法:自适应子图去噪与两阶段RL训练

核心思想

GraphSSR提出自适应子图去噪范式,将推理分解为**采样(Sample)-选择(Select)-推理(Reason)**三阶段,动态调整子图规模以适应不同问题需求。

两阶段强化学习训练

  1. 真实性RL阶段:通过子图真实性、选择一致性、答案正确性三层验证,确保模型遵循推理流程。
  2. 去噪RL阶段:引入结构简洁性奖励,鼓励模型选择更紧凑的子图,实现自适应调整。

数据生成与技术实现

  • 监督微调(SFT):基于GraphR1数据集构建提示,经教师模型推理和质量过滤生成训练数据。
  • 技术框架:SFT用LlamaFactory,RL基于verl v0.6.x(自定义循环与奖励逻辑),推理用vLLM部署API。
4

章节 04

评估基准:GOFA数据集上的零样本测试

GraphSSR在GOFA(Graph Open Financial Analysis)基准测试集上评估,包含:

  • 主测试集:53,114个样本
  • 补充测试集:35,603个样本 覆盖多种图推理任务,全面检验零样本泛化能力。
5

章节 05

意义与应用:跨模态学习与实际场景价值

领域意义

  • 证明LLM可有效处理结构化图数据,为跨模态学习开辟新路径。
  • 自适应子图选择提升模型可解释性(显式展示决策依赖的子结构)。

应用场景

适用于知识图谱问答、药物分子性质预测、社交网络分析、推荐系统等,尤其在标注数据稀缺的冷启动场景价值显著。

关键启示

任务分解与渐进式训练、自适应机制(因材施教)是LLM处理结构化数据的关键。