返回 FEED
AGENT2026-05-28

AI越强,人越忙:住在未来的Every公司CEO访谈

Lenny 访谈了 Every 公司的 CEO Dan Shipper。这家公司 30 人,全员 AI 重度用户,人人用 Codex 和 Claude Code 干活。按理说应该越来越精简,但过去一年员工人数翻了一倍。

Dan 不是在硅谷实验室预测未来,他是真的住在未来

自动化是个谎言

Dan 描述了一个亲身经历的悖论。他自己用 vibe coding 做了一个写作工具 Proof,上线第二天服务器每隔 10 分钟就崩一次。让 Codex 修,Codex 说修好了,然后冒出四个新 bug,循环往复,一晚上没睡着。

后来他请了两位真正的高级工程师,分别独立重写了代码库。于是有了**"高级工程师基准测试"**:让 AI 接手同一个烂摊子,从头重写。

结果:几乎所有模型得分在 30 分 左右。人类高级工程师能到 85-90 分。GPT-5.5 是唯一异类,跳到 62 分

而且 GPT-5.5 是唯一一个真的敢推倒重来的模型。其他模型接到"去修这些 bug"的指令,就真的去一个一个修 bug。人类高级工程师会怎么做?先扫一眼代码库,然后说:"这玩意儿是坨屎,我们得重写。"

模型能解决被定义清楚的问题,但**"发现这个问题需要被重新定义"这件事,模型还不会主动做**。

基准测试的分数在涨,但它永远只能测量人类已经想清楚、能打分的那部分工作。剩下那部分没法打分,因为你得先想到要问这个问题。

这就是为什么 Every 的人越招越多。每一个 Agent 背后,都需要一个真正关心它在做什么的人。Dan 把这叫做**"每个 Agent 都需要一个人"**。

自动化没有消灭工作,它创造了新的工作:管理自动化本身

工作会分裂成两种形态

Dan 预测未来一年内,大多数人的工作方式会朝两个方向同时演化。

第一种:公司共用一个超级 Agent。

不是每个人一个私人助理,而是整个公司共用一个 Agent,挂在 Slack 里,所有人都能调用。Shopify 已经有了,Ramp 也有了。

Dan 最初以为每个人都会有自己的私人 Agent,像《黄金罗盘》里每个人肩上的精灵。后来他彻底改变了看法——Agent 需要有人照料。OpenClaw 刚出来的时候,Every 所有人都兴冲冲设置了自己的 Agent,然后一个个放弃了。因为它会坏,要 SSH 进服务器,要不停地调整,大多数人坚持不了多久。

现实路径是:先有一个公司级别的通用 Agent,由专人负责维护,再随着模型变得更可靠,逐渐向下分裂出团队级别、个人级别的 Agent。这个专门维护 Agent 的人,Dan 叫他**"前沿部署工程师"(Forward Deployed Engineer, FDE)**,Every 内部已经有这样的岗位。

第二种:Codex 或 Claude Code 成为新的工作操作系统。

Dan 现在处理邮件的方式:让 Codex 打开内置浏览器,把所有邮件聚合到一个页面,然后他对着屏幕说话。"这封律师的问题,去把过去四年的文件整理成报告发过去。" Codex 就去做了。他已经连续 10 天保持收件箱清零,这是从没有过的事。

写文章也一样。在 Codex 的内置浏览器里打开 Proof,Codex 能看到他在写什么,他也能看到 Codex 在做什么,两者实时协作。

招人也是。他想找一个在 General Assembly 做过技术教育、现在又对 AI 感兴趣的人,直接跟 Codex 说。然后做别的事,回来发现 Codex 找到了一个完全符合条件的人,还在 Twitter 上关注了他。Dan 直接发了私信,约了顿饭。

CLI 时代已经结束了

Dan 说得很直接:CLI 的时代过去了。

Claude Code 火起来的时候,很多人以为是终端命令行的魔力让它好用。Dan 认为这个判断是错的。真正的原因是 Agent 在本地机器上有完整的访问权限,以及网上有大量关于如何使用终端的内容,让模型学得很好。这和 CLI 本身没什么关系。

Every 内部,大多数技术人员已经不把终端当主要工作界面。偶尔还会切进去,但主战场是 Codex、Claude Code、Cursor 这些有真正界面的工具。GUI 本来就是为了让人更舒服而发明的,这个逻辑没有变过。

SaaS 不会死,Agent 会给它带来更多用户

Dan 说他现在会买 SaaS 股票。大家都在说 Agent 会让人绕过 SaaS,直接用 AI 干活。但 Dan 的观察是反过来的:Agent 不会替代 SaaS 的用户,它会成为 SaaS 新的用户

Every 内部人人都用 Codex 和 Claude Code,但他们的 SaaS 支出比去年还高。因为 Agent 在用 SaaS,大量的 Agent,高频次地调用。需求在爆炸,不是萎缩。

Dan 还提到一个细节:Every 的 Proof 是开源的,用户遇到问题,不是发邮件给客服,而是他们的 Agent 直接发一份 bug 报告,里面有精确的复现步骤,有对代码库的分析,直接变成 GitHub issue,然后 Every 的 Agent 去修。这个闭环,比任何人工客服流程都快。

对 SaaS 公司来说,真正需要做的事情变了:不是把 AI 塞进自己的产品,而是让产品同时对人和 Agent 友好,两者能在同一个界面上协作,各自看到对方在做什么。

PM 和设计师,迎来最好的时代

Dan 对这两个角色极度看好。

Marcus,PM 出身,之前在 Axios 负责写作产品,带大团队做到了几千万 ARR。后来休息了一年,专门学会了用 Cursor。现在他在 Every 负责写作应用 Spiral,是团队里出货最快的人之一。

哪怕一年前,他们也没办法安排 Marcus 做这个工作,因为那时候模型还不够好。但现在,Marcus 的产品感和用户洞察,配上足够好的编程模型,变成了一种超强组合。他不需要组织一整个团队来实现自己的想法,他直接去做。

设计师也一样。以前最大的痛苦是:想到了一个绝妙的交互,工程师不想做,或者做出来不是那个味。现在他们可以自己发 Pull Request,自己把想法变成现实。而且,当所有人都在用 vibe coding 批量生产千篇一律的界面时,真正懂审美、懂交互的设计师反而更值钱。能让东西看起来不像 AI 做的,本身就是一种稀缺能力。

AI 不会让你失业,但不用 AI 会

Dan 的判断是:大规模失业不会发生。那些被归因于 AI 的裁员,大多数是过度招聘的修正,AI 只是一个方便的借口。

但他给出的建议只有一条:"骑上(驾驭)模型"。每次有新模型出来,把它用在你真正在乎的事情上。哪怕上次试过不行,这次再试一次看看。GPT-5.5 出来,他把高级工程师基准重新跑了一遍,从 30 分跳到了 62 分。

他还说了一件让人意外的事:AI 的真正前沿不在旧金山,而在每一个把 AI 用在真实工作场景里的人那里。硅谷的人在造它,但不一定知道怎么用好它。Every 在布鲁克林,不在硅谷。但 Dan 觉得他们比大多数硅谷公司都更靠近未来,原因只有一个:他们把所有工具都真的用在真实的工作上。

最后一个建议:别争论 AI 会不会改变世界,去找一件你真正头疼的事,试着用 AI 解决它。当你第一次感受到"这也行?"的那一刻,你就不需要别人再来说服你了。