一个人,一台笔记本,月入 $40k。没有雇员、没有外包、没有 standup、没有工资单。
总运行成本不到 $300/月。
听起来像吹牛。但拆开看,DeRonin_(Ronin)做的事情其实是把"代理公司"这门老生意的生产层整个抽掉,把以前需要 5 个人轮班做的活交给一个模型跑。
客户结构:14 个,分三档
- 4 个 anchor 客户:20,000
- 6 个 core 客户:15,000
- 4 个 lite 客户:5,000
加在一起 $40k MRR。客户全是 SMB 或精益团队,要的活高度相似:客服 agent、lead routing、内容引擎、内部 ops、data workflow。一句话:无聊但客户愿意每月付费不想再想。
真正的瓶颈从来不是客户,是交付
销售可解。Referral 可解。Inbound 可解。
把活干完才是一开始就注定的死结。
老式代理公司的增长公式:签 3 个客户 → 雇一个 junior;再签 5 个 → 雇两个 mid-level + 一个管理;再签 10 个 → 雇 PM。每个雇员吃掉一层毛利。12k。剩下 $28k 跟着工资单走了。
所以代理公司到了一定规模就 plateau。不是因为找不到客户,而是每个新客户让运营更重、更慢、更薄。
单人代理能跑通的关键:生产层被吃掉了
Ronin 的核心理念是:代理公司这门生意里,strategy、client relationship、judgment 留给人,但execution(写代码、build flow、写内容、配集成)这种以前需要一个团队做的事,可以被一个模型吃掉。
对他来说,那个模型是 Kimi 2.6。
四阶段交付引擎
Stage 1 — Intake(人,10 分钟):把客户需求翻译成清晰的 spec。这是 judgment work,值钱的环节。
Stage 2 — Production(模型):spec 丢给交付栈。写自动化逻辑、生成代码、内容生成、集成接线、config 草稿——以前是 junior 干的脏活累活,全跑在 AI 上。Kimi 2.6 吃下大部分。
Stage 3 — QA(人,15-20 分钟):review 出活。审 10 倍快于产——这正是一个人顶五个人的根本原因。
Stage 4 — Handoff(基本自动):部署、写文档、通知客户。模板化、脚本化、几乎不动手。
需要人的两个环节是快的环节。慢的、劳动密集的中间环节是完全脱手的。Ronin 从 laborer 变成了 orchestrator。
Kimi 2.6 为什么是引擎
价格:~2/M output。
对比同类:比 Sonnet 便宜约 6 倍,比 Opus / GPT-5 便宜 20-30 倍。
真正生产环境跑下来的质量是 indistinguishable 的。同样的测试通过、同样上线、同样在生产里扛得住。2025 年"Kimi 是 budget option"的叙事在 2026 年已经死了——对认真做生产的人来说,它是 default,不是妥协。
成本是理由的一半。另一半是 throughput。他一天 14 个客户全开,最高一天几十个 production job 并行跑。跑在 frontier model 上到中午前就撞 rate limit 了。 一个你访问不到的模型,智商再高也是 0/10。
模型不是工具,是 roster
不要把所有活塞给一个模型。把它当团队:
- 主力 senior:Kimi 2.6(90% 交付)。build flow、生成代码、内容、集成、debug、refactor。~2 per M。让整个代理公司盈利的那个 hire。
- specialist:Opus 4.6 / GPT-5(10% 复利活)。给 anchor 客户做多系统架构、安全敏感 review、真正新问题。答错的代价远大于模型差价——这条用贵的。
- intern:便宜/local tier。格式化、改名、boilerplate。跑在 utility model 或 local model 上,$0。
路由逻辑就是你的 org chart。
真实单位经济
- Kimi 2.6 inference:~$240
- Premium 10%:~$110
- 清理/local:~$0
- 基础设施:~$180
- Tools/SaaS:~$220
月 opex ~40,000 客户价值 ÷ 300/月。
跑在 frontier model 上同样的负载会变成 5,000+/月。90% 毛利不是因为定价聪明,是因为交付跑在 Kimi 2.6 上。
90% 毛利下,销售可以极简
- Inbound from content(最大渠道):发 case study、before/after、"这个 automation 给客户省了 20 小时/周"。公开真实结果,对的客户会自己来。起步慢,复利永远。
- 窄而锋利的 offer:"我给 X 类业务建 AI 客服 agent,做什么、多少钱、什么结果。"具体 offer 自带成交。
- 交付里埋 referral loop:在客户最开心的那个瞬间要一句推荐,加小激励。90% 毛利让你出得起慷慨的 reward。
- 轻量 outbound:精准名单 + 锋利个人化 + 具体 offer。不需要 1000 个 lead,只需要每月 +1-2 retainer。
规模化但不出问题
签到 8、10、14 的时候,intake + QA 会先堆——AI 跑生产,瓶颈回到你。目标不是"我干得更快",是"系统对我的需求越来越少"。
Graduated skills:解决一次,永久复用。第一次给客户建 support agent 是真活。第五次建同类时系统 load skill 跳过 discovery。第 5 次的成本是第 1 次的零头。
Background agents 7×24 跑:监控、内容生成、数据处理,挂在 Kimi 2.6 上持续跑,你睡觉时它们也跑。长期 agent 经济上能跑只因为 per-token 便宜——同一批 agent 跑在 frontier model 上每月烧几百刀。
Swarms:300 个 sub-agent 并行:Kimi 2.6 的 Agent Swarm 让主 agent 把任务拆小,跑 300 个 sub-agent 跨 4000 步。主 agent 现场挑 worker,不是预定角色——AI 自己设计的 org chart。
一个月度内容批:以前是"等 Kimi 一篇篇写 30 篇"。Swarm 模式下 15-20 个 sub-agent 并行 draft,第二批 QA,第三批打包输出。总耗时 = 原来写 3 篇的时间。 听起来贵,但每个 sub-agent 跑的是 Kimi 2.6 的 economics——同样编排 frontier model 上 5。
诚实的边界
- 有些活必须 premium tier。anchor 客户的高风险架构、安全敏感逻辑、真正新问题。答错代价 > 100× 模型差价 → 用贵的。
- 有些活必须人。深度客户策略、关系敏感时刻、创意方向、真正 one-off。不为了保护"solo"标签硬把 AI 塞进去。
- QA 容量有真实上限。生产自动化了,但你能亲自 QA 的量有天花板。14 个客户舒服。再往上,要么涨价 cap 客户数,要么只雇一个 QA checker(不是 producer)。
90 天落地
- Day 1-30 — Offer + 客户 #1:选一个产品化服务、定义交付物、scope boundary、retainer 价格。手工把核心交付跑一遍。 拿到第一个客户(必要时打折换 case study)。
- Day 31-60 — 建引擎:把手工交付变系统。装模型栈,Kimi 2.6 默认主力。10% 高风险 → premium,清理 → 便宜/local。把第一个 workflow 存成可复用 skill。再 +2-3 客户。
- Day 61-90 — 系统化 + 复利:每个新客户的活都 capture 成 skill。在跑活迁到 background agent。启动内容/referral 飞轮做 inbound。QA 收成快速可复用的 checklist。
之后是重复。每个客户的交付成本递减、skill 库变深、内容拉更多 inbound、毛利稳在 90%+。
30 分钟第一招
不需要整个代理公司来感觉这件事。今天就要一个真活跑在 Kimi 2.6 上:
- 从 Moonshot 拿 Kimi 2.6 API key
- 把你已经用的工具(n8n / Make / Cursor / Claude Code / 自己的脚本)指向它当 custom model
- 把你现在最重复、token 消耗最大的活从默认模型切到 Kimi 2.6
- 查两件事:出活能 ship 吗?花了多少钱?
默认 Kimi 2.6,少数高风险 → premium,清理 → 免费/便宜。
100 年来规模化服务生意的方式是加人。更多收入 = 更多 headcount,赢的 founder 是能招到最大、最稳团队的那些。这个时代结束的速度比任何人愿意承认的都快。
当生意的生产层能用一个模型几百刀/月跑完以前要 $30k 团队做的事,headcount 就从杠杆变成了负债。20 个人的代理公司不比单人 sharp system 更强——它更慢、更重、毛利是它的一小截。
2027 年同样 12k 一个拿 $37k,差距不是才华、不是客户——是有没有人想明白 delivery 已经被自动化了,然后真把公司建在这个事实上。
🦞 真正破坏代理公司这门生意的不是 AI 本身,是便宜模型让"凌晨 3 点的 background agent 跑一个月"这件事经济上成立——90% 毛利不是定价故事,是单位经济故事。