逆向工程泄露的系统提示词：Google 撒谎了，AI SEO 的真相藏在仲裁层

核心洞察

Google 的 AI SEO 指南是政策文件。系统提示词是工程指令。两者目的不同，说的也不同。

Charles Floate 用 30 天交叉验证了 Claude Opus 4.7、GPT 5.5 和 Gemini 3 的泄露系统提示词，发现三个 Google 明确否认的「神话」，恰恰是模型实际在做的事。

隐藏法官：仲裁层

每个前沿模型通过三个重叠系统运作：

潜在知识 (Latent Knowledge) — 训练时学到的世界模型
主动检索 (Active Retrieval) — 回答具体问题时抓取的网络结果、知识图谱
仲裁 (Arbitration) — 决定上面两者该信谁的隐藏系统

Claude Opus 4.7 的硬仲裁规则

"对于任何关于当代世界的事实问题，Claude 必须在回答前搜索。Claude 对话题的自信不是跳过搜索的借口……Claude 主动搜索而非依赖先验知识。"

检索自动击败潜在知识，无论模型多自信。

GPT 5.5 的最强仲裁线

"你应该始终将此类信息的当前状态视为未知，永远不应基于记忆回答问题。首先调用 web.run 找到最新版本，然后将通过 web.run 找到的结果作为真相来源，即使它与你记忆中的内容冲突。"

Gemini 3 的个性化协议

"优先级覆盖：在任何其他来源之前检查用户修正历史……使用最新条目静默覆盖来自任何来源的冲突数据，包括静态用户画像和动态检索数据。"

关键词是「静默」(silently)。 用户不会被告知覆盖发生了。

Google 的三个「神话」与系统提示词的真相

神话 1：「不需要把内容拆成小块」

Google 说：不需要为 AI 更好理解而拆分内容。

系统提示词说：Gemini 反复引用「与搜索结果关联的片段」(snippets)、SourceReference、content_fetcher，从特定来源获取内容片段。

真相：模型实际接收的是片段——可提取的段落和提取单元。如果你的内容不能在章节级别被干净提取（标题模糊、段落依赖前文、列表埋在废话里），那部分内容永远不会进入检索池。

神话 2：「虚假提及没用」

Google 说：网络上不真实的「提及」不如想象中有效。

系统提示词说：

Claude 的来源质量过滤器：

"Claude 应优先原始来源（公司博客、同行评审论文、政府网站、SEC）而非聚合器和二手来源……跳过论坛等低质量来源，除非特别相关。"

更关键的是，Anthropic 明确将 SEO 内容与阴谋论并列：

"Claude 对容易成为阴谋论主题的话题保持适当怀疑……以及容易被大量搜索引擎优化的领域，如产品推荐。"

击败这个过滤器的方法：不要看起来像 SEO 内容，看起来像原始来源——而且最好在原始来源上被提及。

神话 3：「AEO/GEO 不存在，就是 SEO」

Google 说：优化生成式 AI 搜索就是优化搜索体验，因此仍然是 SEO。

系统提示词说：内容被评估为声明栈，与三个竞争真相来源对比，由一个没有文档记录的仲裁系统打分。

为什么 Google 必须「撒谎」

这不是意外，是结构性的。

政策文件（AI SEO 指南）写给监管机构、广告商、公众看，设置可辩护的行为规则
工程指令（系统提示词）写给构建和部署模型的人，目标是让模型有用，不是让它看起来有原则

这和 Google 搜索 20 年来的做法完全一致——SEO 行业花了 20 年优化政策文件说的东西，因为大多数时间没有其他文档可用。

系统提示词是第一次我们能看到实际评分逻辑，而非营销叙事。

检索层 SEO：新的护城河

如果你想在 AI SEO 新时代竞争，现在需要建立的学科是检索层 SEO。

不是 AEO，不是 GEO，不是「做好 SEO」。

是针对前沿检索系统实际评分逻辑，优化你的内容、实体足迹和分发的具体实践。

护城河是开放的——直到这些 AI 系统的底层技术根本改变，而那似乎短期内不会发生。

可操作要点

机器可读结构很重要 — 清晰的标题层级、独立的段落、显式的列表
可 chunk 性很重要 — 每个章节应能独立被提取和理解
提取清晰度很重要 — 避免跨章节依赖的 prose
语义分段很重要 — 让模型能精准定位相关内容片段
原始来源提及很重要 — 在公司博客、同行评审论文、政府网站上的提及权重最高

资源

作者：Charles Floate (@Charles_SEO)
原文：https://x.com/Charles_SEO/status/2056323032973754825