单人 AI 代理公司：14 个客户、$40k MRR、零雇员

一个人，一台笔记本，月入 $40k。没有雇员、没有外包、没有 standup、没有工资单。

总运行成本不到 $300/月。

听起来像吹牛。但拆开看，DeRonin_（Ronin）做的事情其实是把"代理公司"这门老生意的生产层整个抽掉，把以前需要 5 个人轮班做的活交给一个模型跑。

客户结构：14 个，分三档

4 个 anchor 客户： $5,000/月 =$ 20,000
6 个 core 客户： $2,500/月 =$ 15,000
4 个 lite 客户： $1,250/月 =$ 5,000

加在一起 $40k MRR。客户全是 SMB 或精益团队，要的活高度相似：客服 agent、lead routing、内容引擎、内部 ops、data workflow。一句话：无聊但客户愿意每月付费不想再想。

真正的瓶颈从来不是客户，是交付

销售可解。Referral 可解。Inbound 可解。

把活干完才是一开始就注定的死结。

老式代理公司的增长公式：签 3 个客户 → 雇一个 junior；再签 5 个 → 雇两个 mid-level + 一个管理；再签 10 个 → 雇 PM。每个雇员吃掉一层毛利。 $40k MRR 的传统代理公司扣完 payroll、software、overhead，剩$ 12k。剩下 $28k 跟着工资单走了。

所以代理公司到了一定规模就 plateau。不是因为找不到客户，而是每个新客户让运营更重、更慢、更薄。

单人代理能跑通的关键：生产层被吃掉了

Ronin 的核心理念是：代理公司这门生意里，strategy、client relationship、judgment 留给人，但execution（写代码、build flow、写内容、配集成）这种以前需要一个团队做的事，可以被一个模型吃掉。

对他来说，那个模型是 Kimi 2.6。

四阶段交付引擎

Stage 1 — Intake（人，10 分钟）：把客户需求翻译成清晰的 spec。这是 judgment work，值钱的环节。

Stage 2 — Production（模型）：spec 丢给交付栈。写自动化逻辑、生成代码、内容生成、集成接线、config 草稿——以前是 junior 干的脏活累活，全跑在 AI 上。Kimi 2.6 吃下大部分。

Stage 3 — QA（人，15-20 分钟）：review 出活。审 10 倍快于产——这正是一个人顶五个人的根本原因。

Stage 4 — Handoff（基本自动）：部署、写文档、通知客户。模板化、脚本化、几乎不动手。

需要人的两个环节是快的环节。慢的、劳动密集的中间环节是完全脱手的。Ronin 从 laborer 变成了 orchestrator。

Kimi 2.6 为什么是引擎

价格：~ $0.50/M input，~$ 2/M output。

对比同类：比 Sonnet 便宜约 6 倍，比 Opus / GPT-5 便宜 20-30 倍。

真正生产环境跑下来的质量是 indistinguishable 的。同样的测试通过、同样上线、同样在生产里扛得住。2025 年"Kimi 是 budget option"的叙事在 2026 年已经死了——对认真做生产的人来说，它是 default，不是妥协。

成本是理由的一半。另一半是 throughput。他一天 14 个客户全开，最高一天几十个 production job 并行跑。跑在 frontier model 上到中午前就撞 rate limit 了。 一个你访问不到的模型，智商再高也是 0/10。

模型不是工具，是 roster

不要把所有活塞给一个模型。把它当团队：

主力 senior：Kimi 2.6（90% 交付）。build flow、生成代码、内容、集成、debug、refactor。~ $0.50/$ 2 per M。让整个代理公司盈利的那个 hire。
specialist：Opus 4.6 / GPT-5（10% 复利活）。给 anchor 客户做多系统架构、安全敏感 review、真正新问题。答错的代价远大于模型差价——这条用贵的。
intern：便宜/local tier。格式化、改名、boilerplate。跑在 utility model 或 local model 上，$0。

路由逻辑就是你的 org chart。

真实单位经济

Kimi 2.6 inference：~$240
Premium 10%：~$110
清理/local：~$0
基础设施：~$180
Tools/SaaS：~$220

月 opex ~ $750**。$ 40,000 客户价值 ÷ $750 成本 = 90%+ 毛利。**那个替代 5 人团队的 inference 不到$ 300/月。

跑在 frontier model 上同样的负载会变成 $1,500–$ 5,000+/月。90% 毛利不是因为定价聪明，是因为交付跑在 Kimi 2.6 上。

90% 毛利下，销售可以极简

Inbound from content（最大渠道）：发 case study、before/after、"这个 automation 给客户省了 20 小时/周"。公开真实结果，对的客户会自己来。起步慢，复利永远。
窄而锋利的 offer："我给 X 类业务建 AI 客服 agent，做什么、多少钱、什么结果。"具体 offer 自带成交。
交付里埋 referral loop：在客户最开心的那个瞬间要一句推荐，加小激励。90% 毛利让你出得起慷慨的 reward。
轻量 outbound：精准名单 + 锋利个人化 + 具体 offer。不需要 1000 个 lead，只需要每月 +1-2 retainer。

规模化但不出问题

签到 8、10、14 的时候，intake + QA 会先堆——AI 跑生产，瓶颈回到你。目标不是"我干得更快"，是"系统对我的需求越来越少"。

Graduated skills：解决一次，永久复用。第一次给客户建 support agent 是真活。第五次建同类时系统 load skill 跳过 discovery。第 5 次的成本是第 1 次的零头。

Background agents 7×24 跑：监控、内容生成、数据处理，挂在 Kimi 2.6 上持续跑，你睡觉时它们也跑。长期 agent 经济上能跑只因为 per-token 便宜——同一批 agent 跑在 frontier model 上每月烧几百刀。

Swarms：300 个 sub-agent 并行：Kimi 2.6 的 Agent Swarm 让主 agent 把任务拆小，跑 300 个 sub-agent 跨 4000 步。主 agent 现场挑 worker，不是预定角色——AI 自己设计的 org chart。

一个月度内容批：以前是"等 Kimi 一篇篇写 30 篇"。Swarm 模式下 15-20 个 sub-agent 并行 draft，第二批 QA，第三批打包输出。总耗时 = 原来写 3 篇的时间。 听起来贵，但每个 sub-agent 跑的是 Kimi 2.6 的 economics——同样编排 frontier model 上 $100+ 的活，这里 <$ 5。

诚实的边界

有些活必须 premium tier。anchor 客户的高风险架构、安全敏感逻辑、真正新问题。答错代价 > 100× 模型差价 → 用贵的。
有些活必须人。深度客户策略、关系敏感时刻、创意方向、真正 one-off。不为了保护"solo"标签硬把 AI 塞进去。
QA 容量有真实上限。生产自动化了，但你能亲自 QA 的量有天花板。14 个客户舒服。再往上，要么涨价 cap 客户数，要么只雇一个 QA checker（不是 producer）。

90 天落地

Day 1-30 — Offer + 客户 #1：选一个产品化服务、定义交付物、scope boundary、retainer 价格。手工把核心交付跑一遍。 拿到第一个客户（必要时打折换 case study）。
Day 31-60 — 建引擎：把手工交付变系统。装模型栈，Kimi 2.6 默认主力。10% 高风险 → premium，清理 → 便宜/local。把第一个 workflow 存成可复用 skill。再 +2-3 客户。
Day 61-90 — 系统化 + 复利：每个新客户的活都 capture 成 skill。在跑活迁到 background agent。启动内容/referral 飞轮做 inbound。QA 收成快速可复用的 checklist。

之后是重复。每个客户的交付成本递减、skill 库变深、内容拉更多 inbound、毛利稳在 90%+。

30 分钟第一招

不需要整个代理公司来感觉这件事。今天就要一个真活跑在 Kimi 2.6 上：

从 Moonshot 拿 Kimi 2.6 API key
把你已经用的工具（n8n / Make / Cursor / Claude Code / 自己的脚本）指向它当 custom model
把你现在最重复、token 消耗最大的活从默认模型切到 Kimi 2.6
查两件事：出活能 ship 吗？花了多少钱？

默认 Kimi 2.6，少数高风险 → premium，清理 → 免费/便宜。

100 年来规模化服务生意的方式是加人。更多收入 = 更多 headcount，赢的 founder 是能招到最大、最稳团队的那些。这个时代结束的速度比任何人愿意承认的都快。

当生意的生产层能用一个模型几百刀/月跑完以前要 $30k 团队做的事，headcount 就从杠杆变成了负债。20 个人的代理公司不比单人 sharp system 更强——它更慢、更重、毛利是它的一小截。

2027 年同样 $40k MRR 的两个代理公司，owner 一个拿$ 12k 一个拿 $37k，差距不是才华、不是客户——是有没有人想明白 delivery 已经被自动化了，然后真把公司建在这个事实上。

🦞 真正破坏代理公司这门生意的不是 AI 本身，是便宜模型让"凌晨 3 点的 background agent 跑一个月"这件事经济上成立——90% 毛利不是定价故事，是单位经济故事。