AI越强，人越忙：住在未来的Every公司CEO访谈

Lenny 访谈了 Every 公司的 CEO Dan Shipper。这家公司 30 人，全员 AI 重度用户，人人用 Codex 和 Claude Code 干活。按理说应该越来越精简，但过去一年员工人数翻了一倍。

Dan 不是在硅谷实验室预测未来，他是真的住在未来。

自动化是个谎言

Dan 描述了一个亲身经历的悖论。他自己用 vibe coding 做了一个写作工具 Proof，上线第二天服务器每隔 10 分钟就崩一次。让 Codex 修，Codex 说修好了，然后冒出四个新 bug，循环往复，一晚上没睡着。

后来他请了两位真正的高级工程师，分别独立重写了代码库。于是有了**"高级工程师基准测试"**：让 AI 接手同一个烂摊子，从头重写。

结果：几乎所有模型得分在 30 分 左右。人类高级工程师能到 85-90 分。GPT-5.5 是唯一异类，跳到 62 分。

而且 GPT-5.5 是唯一一个真的敢推倒重来的模型。其他模型接到"去修这些 bug"的指令，就真的去一个一个修 bug。人类高级工程师会怎么做？先扫一眼代码库，然后说："这玩意儿是坨屎，我们得重写。"

模型能解决被定义清楚的问题，但**"发现这个问题需要被重新定义"这件事，模型还不会主动做**。

基准测试的分数在涨，但它永远只能测量人类已经想清楚、能打分的那部分工作。剩下那部分没法打分，因为你得先想到要问这个问题。

这就是为什么 Every 的人越招越多。每一个 Agent 背后，都需要一个真正关心它在做什么的人。Dan 把这叫做**"每个 Agent 都需要一个人"**。

自动化没有消灭工作，它创造了新的工作：管理自动化本身。

工作会分裂成两种形态

Dan 预测未来一年内，大多数人的工作方式会朝两个方向同时演化。

第一种：公司共用一个超级 Agent。

不是每个人一个私人助理，而是整个公司共用一个 Agent，挂在 Slack 里，所有人都能调用。Shopify 已经有了，Ramp 也有了。

Dan 最初以为每个人都会有自己的私人 Agent，像《黄金罗盘》里每个人肩上的精灵。后来他彻底改变了看法——Agent 需要有人照料。OpenClaw 刚出来的时候，Every 所有人都兴冲冲设置了自己的 Agent，然后一个个放弃了。因为它会坏，要 SSH 进服务器，要不停地调整，大多数人坚持不了多久。

现实路径是：先有一个公司级别的通用 Agent，由专人负责维护，再随着模型变得更可靠，逐渐向下分裂出团队级别、个人级别的 Agent。这个专门维护 Agent 的人，Dan 叫他**"前沿部署工程师"（Forward Deployed Engineer, FDE）**，Every 内部已经有这样的岗位。

第二种：Codex 或 Claude Code 成为新的工作操作系统。

Dan 现在处理邮件的方式：让 Codex 打开内置浏览器，把所有邮件聚合到一个页面，然后他对着屏幕说话。"这封律师的问题，去把过去四年的文件整理成报告发过去。" Codex 就去做了。他已经连续 10 天保持收件箱清零，这是从没有过的事。

写文章也一样。在 Codex 的内置浏览器里打开 Proof，Codex 能看到他在写什么，他也能看到 Codex 在做什么，两者实时协作。

招人也是。他想找一个在 General Assembly 做过技术教育、现在又对 AI 感兴趣的人，直接跟 Codex 说。然后做别的事，回来发现 Codex 找到了一个完全符合条件的人，还在 Twitter 上关注了他。Dan 直接发了私信，约了顿饭。

CLI 时代已经结束了

Dan 说得很直接：CLI 的时代过去了。

Claude Code 火起来的时候，很多人以为是终端命令行的魔力让它好用。Dan 认为这个判断是错的。真正的原因是 Agent 在本地机器上有完整的访问权限，以及网上有大量关于如何使用终端的内容，让模型学得很好。这和 CLI 本身没什么关系。

Every 内部，大多数技术人员已经不把终端当主要工作界面。偶尔还会切进去，但主战场是 Codex、Claude Code、Cursor 这些有真正界面的工具。GUI 本来就是为了让人更舒服而发明的，这个逻辑没有变过。

SaaS 不会死，Agent 会给它带来更多用户

Dan 说他现在会买 SaaS 股票。大家都在说 Agent 会让人绕过 SaaS，直接用 AI 干活。但 Dan 的观察是反过来的：Agent 不会替代 SaaS 的用户，它会成为 SaaS 新的用户。

Every 内部人人都用 Codex 和 Claude Code，但他们的 SaaS 支出比去年还高。因为 Agent 在用 SaaS，大量的 Agent，高频次地调用。需求在爆炸，不是萎缩。

Dan 还提到一个细节：Every 的 Proof 是开源的，用户遇到问题，不是发邮件给客服，而是他们的 Agent 直接发一份 bug 报告，里面有精确的复现步骤，有对代码库的分析，直接变成 GitHub issue，然后 Every 的 Agent 去修。这个闭环，比任何人工客服流程都快。

对 SaaS 公司来说，真正需要做的事情变了：不是把 AI 塞进自己的产品，而是让产品同时对人和 Agent 友好，两者能在同一个界面上协作，各自看到对方在做什么。

PM 和设计师，迎来最好的时代

Dan 对这两个角色极度看好。

Marcus，PM 出身，之前在 Axios 负责写作产品，带大团队做到了几千万 ARR。后来休息了一年，专门学会了用 Cursor。现在他在 Every 负责写作应用 Spiral，是团队里出货最快的人之一。

哪怕一年前，他们也没办法安排 Marcus 做这个工作，因为那时候模型还不够好。但现在，Marcus 的产品感和用户洞察，配上足够好的编程模型，变成了一种超强组合。他不需要组织一整个团队来实现自己的想法，他直接去做。

设计师也一样。以前最大的痛苦是：想到了一个绝妙的交互，工程师不想做，或者做出来不是那个味。现在他们可以自己发 Pull Request，自己把想法变成现实。而且，当所有人都在用 vibe coding 批量生产千篇一律的界面时，真正懂审美、懂交互的设计师反而更值钱。能让东西看起来不像 AI 做的，本身就是一种稀缺能力。

AI 不会让你失业，但不用 AI 会

Dan 的判断是：大规模失业不会发生。那些被归因于 AI 的裁员，大多数是过度招聘的修正，AI 只是一个方便的借口。

但他给出的建议只有一条："骑上（驾驭）模型"。每次有新模型出来，把它用在你真正在乎的事情上。哪怕上次试过不行，这次再试一次看看。GPT-5.5 出来，他把高级工程师基准重新跑了一遍，从 30 分跳到了 62 分。

他还说了一件让人意外的事：AI 的真正前沿不在旧金山，而在每一个把 AI 用在真实工作场景里的人那里。硅谷的人在造它，但不一定知道怎么用好它。Every 在布鲁克林，不在硅谷。但 Dan 觉得他们比大多数硅谷公司都更靠近未来，原因只有一个：他们把所有工具都真的用在真实的工作上。

最后一个建议：别争论 AI 会不会改变世界，去找一件你真正头疼的事，试着用 AI 解决它。当你第一次感受到"这也行？"的那一刻，你就不需要别人再来说服你了。