正文

GraphSSR：面向零样本图学习的大语言模型自适应子图去噪框架

GraphSSR是一种创新的两阶段强化学习框架，通过自适应子图采样与去噪机制，使大语言模型能够在未见过的图数据上实现零样本推理。该方法被ACM SIGKDD 2026研究轨道接收。

graph learninglarge language modelszero-shot learningsubgraph denoisingreinforcement learningACM SIGKDD图神经网络大语言模型零样本学习强化学习

发布时间 2026/05/31 17:45最近活动 2026/05/31 17:48预计阅读 2 分钟

章节 01

【导读】GraphSSR：面向零样本图学习的LLM自适应子图去噪框架

GraphSSR是一种创新的两阶段强化学习框架，通过自适应子图采样与去噪机制，使大语言模型（LLM）能够在未见过的图数据上实现零样本推理。该研究已被ACM SIGKDD 2026研究轨道接收，项目代码与数据集已开源。

章节 02

背景与挑战：图学习与LLM融合的核心难题

图学习的局限

传统图神经网络（GNN）依赖大量标注数据训练，面对分布外（Out-of-Distribution）图结构时性能急剧下降。

LLM应用于图学习的挑战

LLM虽具备强大零样本推理能力，但图数据的结构特性与自然语言差异大，如何有效编码图结构并避免噪声干扰，是亟待解决的问题。

章节 03

核心方法：自适应子图去噪与两阶段RL训练

核心思想

GraphSSR提出自适应子图去噪范式，将推理分解为**采样（Sample）-选择（Select）-推理（Reason）**三阶段，动态调整子图规模以适应不同问题需求。

两阶段强化学习训练

真实性RL阶段：通过子图真实性、选择一致性、答案正确性三层验证，确保模型遵循推理流程。
去噪RL阶段：引入结构简洁性奖励，鼓励模型选择更紧凑的子图，实现自适应调整。

数据生成与技术实现

监督微调（SFT）：基于GraphR1数据集构建提示，经教师模型推理和质量过滤生成训练数据。
技术框架：SFT用LlamaFactory，RL基于verl v0.6.x（自定义循环与奖励逻辑），推理用vLLM部署API。

章节 04

评估基准：GOFA数据集上的零样本测试

GraphSSR在GOFA（Graph Open Financial Analysis）基准测试集上评估，包含：

主测试集：53,114个样本
补充测试集：35,603个样本覆盖多种图推理任务，全面检验零样本泛化能力。

章节 05

意义与应用：跨模态学习与实际场景价值

领域意义

证明LLM可有效处理结构化图数据，为跨模态学习开辟新路径。
自适应子图选择提升模型可解释性（显式展示决策依赖的子结构）。

应用场景

适用于知识图谱问答、药物分子性质预测、社交网络分析、推荐系统等，尤其在标注数据稀缺的冷启动场景价值显著。

关键启示

任务分解与渐进式训练、自适应机制（因材施教）是LLM处理结构化数据的关键。

章节 06

总结与补充信息

总结

GraphSSR代表图学习与LLM融合的前沿探索，提升零样本图推理性能，为理解LLM处理结构化数据提供新视角。

补充信息

原作者/维护者：mysteriouslfz
项目链接：https://github.com/mysteriouslfz/GraphSSR
数据集链接：https://huggingface.co/datasets/wfdlfz/GraphSSR
论文接收：ACM SIGKDD 2026 Research Track