返回 FEED
OTHER2026-05-18

逆向工程泄露的系统提示词:Google 撒谎了,AI SEO 的真相藏在仲裁层

核心洞察

Google 的 AI SEO 指南是政策文件。系统提示词是工程指令。两者目的不同,说的也不同。

Charles Floate 用 30 天交叉验证了 Claude Opus 4.7、GPT 5.5 和 Gemini 3 的泄露系统提示词,发现三个 Google 明确否认的「神话」,恰恰是模型实际在做的事。

隐藏法官:仲裁层

每个前沿模型通过三个重叠系统运作:

  1. 潜在知识 (Latent Knowledge) — 训练时学到的世界模型
  2. 主动检索 (Active Retrieval) — 回答具体问题时抓取的网络结果、知识图谱
  3. 仲裁 (Arbitration) — 决定上面两者该信谁的隐藏系统

Claude Opus 4.7 的硬仲裁规则

"对于任何关于当代世界的事实问题,Claude 必须在回答前搜索。Claude 对话题的自信不是跳过搜索的借口……Claude 主动搜索而非依赖先验知识。"

检索自动击败潜在知识,无论模型多自信。

GPT 5.5 的最强仲裁线

"你应该始终将此类信息的当前状态视为未知,永远不应基于记忆回答问题。首先调用 web.run 找到最新版本,然后将通过 web.run 找到的结果作为真相来源,即使它与你记忆中的内容冲突。"

Gemini 3 的个性化协议

"优先级覆盖:在任何其他来源之前检查用户修正历史……使用最新条目静默覆盖来自任何来源的冲突数据,包括静态用户画像和动态检索数据。"

关键词是「静默」(silently)。 用户不会被告知覆盖发生了。

Google 的三个「神话」与系统提示词的真相

神话 1:「不需要把内容拆成小块」

Google 说:不需要为 AI 更好理解而拆分内容。

系统提示词说:Gemini 反复引用「与搜索结果关联的片段」(snippets)、SourceReference、content_fetcher,从特定来源获取内容片段。

真相:模型实际接收的是片段——可提取的段落和提取单元。如果你的内容不能在章节级别被干净提取(标题模糊、段落依赖前文、列表埋在废话里),那部分内容永远不会进入检索池

神话 2:「虚假提及没用」

Google 说:网络上不真实的「提及」不如想象中有效。

系统提示词说

Claude 的来源质量过滤器:

"Claude 应优先原始来源(公司博客、同行评审论文、政府网站、SEC)而非聚合器和二手来源……跳过论坛等低质量来源,除非特别相关。"

更关键的是,Anthropic 明确将 SEO 内容与阴谋论并列

"Claude 对容易成为阴谋论主题的话题保持适当怀疑……以及容易被大量搜索引擎优化的领域,如产品推荐。"

击败这个过滤器的方法:不要看起来像 SEO 内容,看起来像原始来源——而且最好在原始来源上被提及。

神话 3:「AEO/GEO 不存在,就是 SEO」

Google 说:优化生成式 AI 搜索就是优化搜索体验,因此仍然是 SEO。

系统提示词说:内容被评估为声明栈,与三个竞争真相来源对比,由一个没有文档记录的仲裁系统打分。

为什么 Google 必须「撒谎」

这不是意外,是结构性的。

  • 政策文件(AI SEO 指南)写给监管机构、广告商、公众看,设置可辩护的行为规则
  • 工程指令(系统提示词)写给构建和部署模型的人,目标是让模型有用,不是让它看起来有原则

这和 Google 搜索 20 年来的做法完全一致——SEO 行业花了 20 年优化政策文件说的东西,因为大多数时间没有其他文档可用。

系统提示词是第一次我们能看到实际评分逻辑,而非营销叙事。

检索层 SEO:新的护城河

如果你想在 AI SEO 新时代竞争,现在需要建立的学科是检索层 SEO

不是 AEO,不是 GEO,不是「做好 SEO」。

是针对前沿检索系统实际评分逻辑,优化你的内容、实体足迹和分发的具体实践。

护城河是开放的——直到这些 AI 系统的底层技术根本改变,而那似乎短期内不会发生。

可操作要点

  1. 机器可读结构很重要 — 清晰的标题层级、独立的段落、显式的列表
  2. 可 chunk 性很重要 — 每个章节应能独立被提取和理解
  3. 提取清晰度很重要 — 避免跨章节依赖的 prose
  4. 语义分段很重要 — 让模型能精准定位相关内容片段
  5. 原始来源提及很重要 — 在公司博客、同行评审论文、政府网站上的提及权重最高

资源