Zing 论坛

正文

LLM SEO:让网站在AI时代被智能体发现和引用的完整指南

深入解析llm-seo项目,一套帮助网站和开发者工具优化AI搜索可见性、获得LLM引用并提升智能体可发现性的五阶段工作流。

LLM SEOAI搜索优化智能体发现llms.txtJSON-LDMCPA2A协议AI爬虫GEO生成式引擎优化
发布时间 2026/04/05 09:10最近活动 2026/04/05 09:18预计阅读 5 分钟
LLM SEO:让网站在AI时代被智能体发现和引用的完整指南
1

章节 01

LLM SEO:让网站在AI时代被智能体发现和引用的完整指南

引言:AI搜索时代的SEO革命

传统搜索引擎优化(SEO)正在经历一场深刻的变革。随着ChatGPT、Claude、Perplexity等AI对话系统的普及,用户获取信息的方式已经从"搜索-点击-阅读"转变为"提问-获得答案"。这意味着网站不仅需要被传统搜索引擎收录,更需要被大型语言模型(LLM)理解和引用。

llm-seo是一个开源的Agent技能项目,专为这一新时代设计。它提供了一套系统化的方法论,帮助开发者和网站所有者优化其内容,使其更容易被AI爬虫发现、被智能体理解,并在AI生成的回答中获得引用。

什么是LLM SEO?

LLM SEO(Large Language Model Search Engine Optimization)是一种针对AI搜索和智能体发现的新型优化策略。与传统SEO关注关键词密度和反向链接不同,LLM SEO专注于:

  • AI爬虫友好性:确保GPTBot、ClaudeBot、PerplexityBot等AI爬虫能够正确抓取和理解网站内容
  • 语义清晰度:使用结构化数据和明确的定义性语言,帮助LLM准确理解网站提供的服务或产品
  • 引用价值:创建易于被AI系统引用和推荐的内容格式
  • 智能体发现:通过标准化的发现文件,让AI代理能够自动集成和使用网站提供的API或服务
2

章节 02

背景:从传统SEO到AI搜索的范式转变

传统搜索引擎优化(SEO)的核心目标是提升网站在传统搜索结果中的排名,依赖关键词密度、反向链接等因素。然而,AI对话系统的兴起改变了用户获取信息的方式——用户不再需要点击多个链接阅读内容,而是直接通过提问获得整合后的答案。这一转变要求网站内容不仅能被传统搜索引擎收录,更要能被LLM有效理解、引用,甚至作为智能体的工具被调用。LLM SEO正是为适应这一变化而诞生的新型优化策略。

3

章节 03

LLM SEO工作流:核心基础设施与LLM文本文件(阶段1-2)

第一阶段:核心SEO基础设施

任何LLM SEO优化的起点都是确保基础的SEO架构完善。这包括:

robots.txt优化:专门针对AI爬虫进行精细化控制,允许GPTBot、ClaudeBot、Claude-SearchBot、PerplexityBot、OAI-SearchBot等主流AI爬虫访问公开页面,同时阻止它们索引内部管理页面。

站点地图(sitemap.xml):为AI爬虫提供清晰的网站导航图,落地页设置1.0优先级,文档页面0.8,/llms.txt文件包含在内并设置0.6优先级。

元数据优化<title>标签是唯一能被大多数AI系统可靠获取的元数据,需采用描述性、定义性语言(如"X是...")而非营销式语言。

第二阶段:LLM文本文件

项目引入了llms.txtllms-full.txt两个专用文件:

/llms.txt:简洁Markdown文件(1-2KB),包含产品核心概述(功能、场景、开发者链接、定价),关键部分是"Instructions for LLMs"(受Stripe启发,引导AI使用最佳实践)。

/llms-full.txt:完整参考文档,包含所有功能、API端点、MCP工具、SDK示例等,建议从OpenAPI规范/MCP注册表动态生成以保持同步。

4

章节 04

LLM SEO工作流:结构化数据与智能体发现(阶段3-4)

第三阶段:结构化数据(JSON-LD)

采用"三重模式堆叠"策略,每个页面包含多个JSON-LD代码块:

  • Organization模式:公司信息、logo、URL
  • SoftwareApplication模式:应用元数据、定价、类别
  • FAQPage模式:FAQ部分(AI引用价值极高)
  • WebSite模式:网站级信息
  • Speakable模式:标记2-3个最重要内容段落作为AI检索优先项
  • HowTo模式:教程/指南页面
  • TechArticle模式:文档页面

此外,建议在/.well-known/目录放置security.txt文件(RFC 9116标准)。

第四阶段:智能体与API发现(条件性)

若提供API/SDK/MCP服务器,需关注:

OpenAPI规范端点:无需认证的端点(如/api/openapi/public),每个操作需有丰富语义描述。

智能体发现文件

  • /.well-known/agent-card.json:A2A协议元数据文件(Google和Linux基金会推动)
  • /.well-known/ai-plugin.json:OpenAI插件清单(遗留格式)

注册与索引

  • MCP注册表:在registry.modelcontextprotocol.io注册
  • PulseMCP/Smithery:列出以扩大发现
  • Context7:提交至context7.com/add-library或添加context7.json文件。
5

章节 05

LLM SEO工作流:测量与监控(阶段5)

优化的最后一步是建立监控体系。建议使用Google Analytics 4(GA4)设置自定义渠道组,跟踪AI流量来源,包括chat.openai.com、chatgpt.com、perplexity.ai、claude.ai、copilot.microsoft.com等平台。

6

章节 06

LLM SEO常见错误与解决方案

错误 解决方案
llms.txt中缺少"Instructions for LLMs"部分 添加Stripe风格的部分,引导AI使用当前模式
静态llms.txt与API不同步 从OpenAPI规范/MCP注册表动态生成
robots.txt中阻止所有AI爬虫 允许访问公开页面,仅阻止私有路由
在组件和JSON-LD中重复FAQ数据 提取到共享模块,两处导入
未设置metadataBase 必须设置——OG/Twitter绝对URL组合所需
缺少Speakable模式 标记关键内容段落作为AI检索优先级
每页只有一个JSON-LD代码块 使用三重模式堆叠——每页多个模式
未在MCP注册表/Context7注册 注册以获得最大AI代理可发现性
7

章节 07

LLM SEO未来展望:新兴标准与技术

llm-seo项目关注的发展中标准包括:

  • WebMCP:W3C倡议(Google + Microsoft),通过navigator.modelContext向浏览器AI代理暴露结构化工具,Chrome Canary已提供预览,预计2026年H2原生支持。
  • /.well-known/mcp.json:MCP服务器卡片自动发现(SEP-1649, SEP-1960),待规范稳定后实施。
  • Arazzo规范:多步骤API工作流编排,用于复杂智能体集成。
8

章节 08

结论:AI时代LLM SEO的必要性

随着AI系统成为用户获取信息的主要入口,LLM SEO不再是可选项,而是必需品。llm-seo项目提供全面、可操作的框架,帮助网站和开发者工具在新时代保持可见性和相关性。

通过实施五阶段工作流,开发者可确保产品不仅被传统搜索引擎发现,更能被AI系统理解、引用和推荐——这是未来数字可见性的关键所在。