返回 FEED
AGENT2026-05-31

3 种 Claude Agent 部署方式:本地循环 / Modal / Trigger.dev 的选择

你写了个 skill,写了个 agent。然后你坐在终端前看它跑。

有 3 种主流方式让 Claude Code skill 和 agent 脱离你的控制自动跑。每种 trade-off 不同,没有最好,只有最合适

Nate Herk 给出了完整的 3 方式拆解。

部署 agent 的两个轴

每个部署方案落在两个轴上:

轴 1:跑在哪

  • 本机——你的 MacBook / Linux 机器
  • ——Anthropic cloud、Modal、Trigger.dev、VPS、AWS Lambda

关键问题:你的笔记本要一直开着吗?

  • 要 → 本机
  • 不要 → 云

轴 2:多 agentic

  • 完全自主 loop——agent + skills + tools 全栈,能推理、能决策
  • 确定性脚本——跑同样的逻辑,每次都一样的输出

关键问题:你的 task **需要"判断"**吗?

  • 要 → agentic
  • 不要 → 脚本

WAT 框架

Nate 用 WAT 框架来理解每个部署的覆盖范围:

  • W = Workflow(流程)——"该做什么、按什么顺序"
  • A = Agent(自主推理层)——"下一步该做什么的判断"
  • T = Tools(工具)——"能调用的能力"

Skills 通常落在 W 和 T

  • 纯 workflow 的 skill("按这个模板写 LinkedIn 帖")= W
  • chain workflow + tools 的 skill("写 LinkedIn 帖 + 调 image API 生成配图")= W + T
  • Agent 是 A——它决定"下一步调哪个 tool、按什么顺序"

3 种部署方式覆盖不同 WAT

方式WAT
本机 loop
Modal⚠️
Trigger.dev

方式 1:本机跑 loop

最简单。零配置。

# 打开 Claude Code
> set up a loop every 10 minutes to read the new comments on my latest YouTube upload and reply using the transcript

Claude Code 内部跑 cron 式的循环。它读取你给的指令,设个 timer,循环执行

适合

  • 个人临时自动化("每 10 分钟查评论区")
  • 数据备份("每晚 22 点把 working dir 备份到 S3")
  • 监控告警("每次 GitHub issues 有新 high-priority tag,给我发通知")
  • 临时探索("今晚 2 小时内把 Reddit r/LocalLLaMA top 帖子分类到 Notion")

代价

  • 笔记本要开——关掉就停
  • 没 observability——出错你看 console
  • 没 retry——挂了人工重启
  • 不 scale——只能跑你能想到的几个

方式 2:Modal(云 serverless)

Modal 是 cloud-hosted 的 Claude Code 部署平台。你的 agent / skill 跑在 Modal 的 serverless 容器里,按调用计费,auto-scale

适合

  • Cloud-hosted agent——不依赖本机
  • Auto-scale 场景——流量波动大(白天高、夜里低)
  • 轻量 task(< 10 分钟跑完)
  • 不想管基础设施

代价

  • 冷启动延迟——首次调用 5-30 秒
  • agent loop 能力受限——Modal 适合确定性脚本(W + T),**agent 推理(A)**在 Modal 上不友好
  • per-call 计费——长 task 成本高
  • 数据本地性——agent 跑在云,本地文件需要 upload

方式 3:Trigger.dev

Trigger.dev 是长任务 + observability 平台。你的 workflow 跑在 Trigger.dev 的 worker 上,支持重试、日志、dashboard、webhook 触发

适合

  • 长任务(小时级、跨天)——本机 loop 跑不动、Modal 太贵
  • 需要 observability——任务跑哪了、错哪了、retry 几次
  • webhook 触发——GitHub push 后跑测试、Stripe 收到大额后跑报告
  • 重试 + 失败恢复——长任务中间挂掉能 resume

代价

  • 配置复杂——比本机 loop 多 5-10 倍 setup 时间
  • agent 推理能力弱——Trigger.dev 是 W 重的,不适合 A 重的 agent
  • 按 task 计费——大量小 task 不划算
  • vendor lock-in——迁移成本高

3 种方式的对比

维度本机 loopModalTrigger.dev
笔记本要开?✅ 是❌ 否❌ 否
Auto-scale?❌ 否✅ 是⚠️ 半自动
长任务?⚠️ 几小时❌ < 10 分钟✅ 跨天
Observability?❌ 弱⚠️ 中✅ 强
Retry?❌ 无⚠️ 基础✅ 强
Setup 成本5 分钟1-2 小时1-2 天
单 task 成本$0$0.001-0.01$0.01-0.1
Agent 推理✅ 强⚠️ 弱❌ 不支持
适合 WAT全 WATW + TW

选择决策树

我需要 agent 跑 24/7 吗?
│
├─ 否(只是个人临时自动化)→ 本机 loop
│
└─ 是
   │
   任务长吗(> 30 分钟)?
   │
   ├─ 否(短 task、scale 重要)→ Modal
   │
   └─ 是(长 task、需要重试 + observability)→ Trigger.dev

Nate 没说的两件事

1. Hybrid 模式。实际生产中很少只用一种方式。典型 hybrid:

  • 触发:Trigger.dev(webhook 接 GitHub push)
  • 执行:Modal(短 task 跑 build/test)
  • 长任务:Trigger.dev worker
  • 监控:本机 agent(看 dashboard、临时修复)

3 种方式不是互斥,是组合。Nate 的"3 方式"是纯净架构,实操是 mix。

2. Agent 推理层的云部署Modal 和 Trigger.dev 对"agent 推理"(A)支持都弱——它们假设"workflow 写好,agent 跑流程"。但 Claude Code 的核心价值是agent 实时判断——遇到 spec 模糊就停下问人。这个能力在云部署里基本用不了——因为没人值班。云部署的 agent 是"白天版本",本机部署的 agent 是"24/7 陪人版"这是云 agent 的结构性局限

结论

3 种部署方式的核心 trade-off:

  • 本机 loop = 简单 + 零成本,但笔记本要开
  • Modal = cloud + auto-scale,但 agent 推理弱
  • Trigger.dev = 长任务 + observability,但 setup 重

第一性问题:你的 task 需要 agent 推理吗

  • → 本机 loop 是最友好选择
  • → Modal / Trigger.dev 都行,按时长 + scale 选

SOTA Sync 的判断:未来 12 个月,"agent 部署"会从"个人玩具"变成"团队基建"——Ops 角色(管理 agent deployment、监控、retry、cost control)会变成 AI 团队标配。这是 AI 时代的新工种——不是写 agent 的人,是养 agent 的人

agent 推理层的云部署仍是空白——没人值班时,agent 怎么"判断"? 这是云 agent 平台的下一道关卡。未来 12 个月会有"agent 值班"产品出现——让 agent 在云上也能"问人"。