Thariq 是 Claude Code 团队成员,他前几天公开说:他把 Agent 输出从 Markdown 切到了 HTML。
这不是某个人的口味偏好。这是 Agent 规模化之后,输出格式作为协作瓶颈被显化的标志。
他遇到了什么问题
Thariq 自己说:现在 Agent 写的 specs、plans、reports 越来越大。他从来不读超过 100 行的 markdown 文件。
更严重的是——他团队里的其他人也不读。
100 行 markdown 在屏幕上滚下去就是一片灰色的纯文本。读 5 分钟不知道在讲什么,关掉。这种 spec 写出来等于没写。
如果 Agent 写的 spec 没人读,那这个 Agent 的价值就停留在"给我几段示例代码"那个级别。
Markdown 的天花板
Markdown 诞生于 2004 年,为的是"用纯文本语法写出能渲染成 HTML 的文档"。它的强项是轻量、纯文本、可 diff。
但它能表达的信息维度太少了:
- 表格?手写
|---|还能凑合 - 颜色?Unicode 色块近似值
- 图表?ASCII art
- 布局?完全没概念
- 交互?纯静态
Thariq 在帖子里贴了 Claude Code 试图"用 unicode 字符近似颜色"的截图——看着像行为艺术,但这就是 markdown 的天花板。
HTML 能做什么 markdown 永远做不了
Thariq 列了 HTML 能表达的事,几乎覆盖所有 Agent 输出场景:
- 表格(
<table>):数据对比 - CSS 样式(
<style>):颜色、间距、视觉层次 - SVG 矢量图(
<svg>):架构图、流程图、示意图 - 代码片段(
<script>):交互示例 - 可交互组件(JS + CSS):滑块、按钮、表单
- 空间数据(canvas + 绝对定位):布局、依赖关系图
- 图片引用(
<img>):截图、产物
Thariq 自己的工作流已经用了这些:让 Agent 生成含 SVG 架构图、含交互组件的设计稿、含可调参数的 playground 页面——所有这些都装在一个 HTML 文件里,能上传 S3 分享给团队任何人。
为什么不用 ClaudeAI 或 Claude Design
这是个关键问题。Thariq 给的答案很直接:
Claude Code 能读取所有本地上下文。
当他在 Claude Code 里让 Agent 写 HTML 时,Agent 可以:
- 读本地代码库,找到已有的 HTML 模式
- 扫文件系统,归类所有相关 HTML
- 读 git log,理解项目历史
- 调 MCP(Slack、Linear、Figma...)取业务上下文
- 读 web 浏览器抓外部数据
这些深度本地上下文是 ClaudeAI web 版和 Claude Design 给不了的。Claude Code 是唯一一个能"基于整个项目状态"生成产物的形态。
这个判断点出了 Agent 工具竞争的一个真相:上下文深度 > 模型能力。Claude Code 不一定比 ClaudeAI 强,但它"能看见你全部的工作状态"。
这个迁移意味着什么
对 Agent 开发者
- 默认输出格式应该考虑升级到 HTML(或带样式的中间格式)
- 工具调用产物(如 Claude Code 的 plan mode)应该支持 HTML
- "代码之外的产物"(specs、design docs、reports)的呈现是 Agent 价值的新战场
对普通用户
- 别再让 Agent 给你"5 个章节的 markdown 报告"了——让它生成 HTML,上传到 S3,发个链接
- 用浏览器看 Agent 产物,而不是在 IDE 里滚动文本
- 跟同事分享 Agent 产物,发 HTML 链接远比发 .md 文件被打开的概率高
对 Markdown 工具
- Obsidian、Typora、VS Code 的 markdown 渲染都在"凑合"
- 如果 HTML 输出成为主流,markdown 可能退回到"源代码"地位——Agent 写 HTML,你读 HTML,markdown 只是中间的中间产物
诚实说不适合谁
不是所有人都该迁移。
- 短输出场景(Agent 回一句话、生成一段代码、修复一个 typo)→ markdown 够用,HTML 反而冗余
- 纯命令行 workflow(pipeline 自动化、日志聚合)→ markdown 仍是首选
- 需要 git diff 的协作(多人改同一份 spec)→ HTML 没有"行级 diff"概念,markdown 在版本控制上仍胜
- 低速设备(嵌入式、低配终端)→ HTML 渲染开销大
迁移 HTML 是规模化协作场景的选择,不是所有场景的银弹。
Thariq 没说的两件事
1. HTML 的可维护性远差于 markdown。HTML 嵌套、缩进、属性爆炸后,纯文本 diff 几乎不可读。如果 Agent 之间用 HTML 互相传 spec,会陷入"谁也看不懂谁"的混乱。HTML 适合"人类最终消费的形态",但未必适合 Agent-to-Agent 通信。
2. 浏览器渲染 HTML ≠ 跨平台一致。同一份 HTML 在 Chrome、Safari、邮件客户端、微信浏览器里渲染会差很多。Agent 生成的 HTML 经常用了某个库的现代 API,在用户打开时是空白。Thariq 没提这层工程负担。
结论
Thariq 的判断点出了一个Agent 时代的格式升级周期:当 Agent 输出的规模和复杂度都超过 markdown 的承载力,HTML 接班是必然。
但更深的洞察是:Agent 输出的可消费性比"Agent 输出多"重要。1000 行没人读的 markdown 不如 100 行能看完的 HTML。
SOTA Sync 的判断:未来 12 个月,HTML + 一键预览会成为 Agent 工具的标配体验。Notion/Linear 类的"在线文档 + 协作"形态会被 Agent-native 形态冲击——后者是"Agent 直接生成结构化 HTML 文档,附带交互和上下文链接"。