Zing 论坛

正文

Awesome-LLM-OPD:策略蒸馏论文的可视化知识图谱

一个收录175+篇On-Policy Distillation论文的可搜索在线图谱,配套ICML 2026综述论文,提供智能检索、分类浏览和趋势分析功能

On-Policy Distillation知识蒸馏论文图谱文献检索LLM学术资源可视化
发布时间 2026/06/02 11:38最近活动 2026/06/02 11:52预计阅读 3 分钟
Awesome-LLM-OPD:策略蒸馏论文的可视化知识图谱
1

章节 01

导读:Awesome-LLM-OPD——策略蒸馏论文的可视化知识图谱

Awesome-LLM-OPD是一个收录175+篇On-Policy Distillation(策略内蒸馏)论文的可搜索在线图谱,配套ICML 2026综述论文《A Survey of On-Policy Distillation for Large Language Models》(arXiv:2604.00626),提供智能检索、分类浏览和趋势分析功能,旨在解决传统静态论文列表的痛点。

访问链接:https://nick7nlp.github.io/awesome-llm-opd/

2

章节 02

背景:论文爆炸时代的OPD领域知识管理挑战

大语言模型研究领域发展迅速,OPD细分方向短短几年积累超175篇论文。传统静态论文列表(Awesome List)存在四大痛点:难以快速定位特定方法论文、无法直观展示领域趋势、缺乏跨论文关联分析、更新维护成本高。Awesome-LLM-OPD为此而生。

3

章节 03

核心功能:智能检索、组合筛选与可视化展示

  1. 智能模糊搜索:基于Fuse.js实现,支持标题关键词、作者姓名、方法组件检索,含拼写容错与近似匹配;
  2. 组合筛选系统:多维度交叉筛选(章节分类/损失函数/发表年份),可精确定位如“2024年使用FKL损失的论文”;
  3. 可视化展示:提供模型图谱热力图、损失函数分布图、月度演进趋势、方法时间线等;
  4. 每日自动更新:7阶段流水线(预检查→侦察→深度阅读→筛选→更新列表→刷新索引→损失分类→网站刷新),确保新论文24小时内可检索。
4

章节 04

技术架构:纯静态设计与自动化数据整合

  • 纯静态设计:采用HTML+Bulma CSS+Fuse.js架构,GitHub Pages托管,零运维成本、极速加载、高可用性;
  • 数据流水线:整合4类数据源(paper_notes.json/损失分类json/章节分组README/论文摘要tex),通过arXiv ID关联渲染;
  • 幂等设计:重复运行流水线无副作用,保证数据一致性。
5

章节 05

学术价值与多角色适用场景

学术价值:配套综述论文提供系统领域综述、统一数学框架、实验对比及未来方向,网站为论文在线companion;引用格式需包含arXiv:2604.00626。

适用场景

  • 研究人员:文献调研、方法对比、趋势分析、论文追踪;
  • 工程师:技术选型、实现参考、性能基准;
  • 学生:入门学习、论文阅读、方向探索。
6

章节 06

局限与未来发展规划

当前局限:仅覆盖OPD单一领域、依赖arXiv/Semantic Scholar数据源、自动化分类可能存在误差。

未来方向:扩展到Offline Distillation等其他蒸馏方法、增加论文影响力指标(引用数/Stars)、支持用户收藏与笔记功能、引入论文关联知识图谱。

7

章节 07

总结与社区贡献指南

Awesome-LLM-OPD是学术资源管理新范式,从静态列表转向动态图谱、人工维护转向自动更新,为大模型蒸馏研究者提供高效工具。

贡献指南:勿直接编辑自动生成的index.html或papers.json;论文添加/修正需提交Issue/PR到Awesome-LLM-On-Policy-Distillation仓库;网站模板问题可直接向本仓库提PR。