Agent-First 研究工作室：从系统化到自动化的三阶段路线图

核心原则：先系统化，再自动化

Rohit Chauhan 是一名加密与股票研究员，用 6 个月时间搭建了一套多 LLM 驱动的研究工作室。他的核心发现是：大多数 Agent 构建失败，不是因为工具不够，而是因为人们试图自动化一个自己还没理解的流程。

"Automating a messy process makes a messy process run faster. The automation does not clean the process. It compounds the entropy at machine speed."

这句话是整个三阶段方法论的起点。

Phase 1：系统化（2026 年 1-5 月）

Phase 1 没有写一行自动化代码。它的产出是一套可手动执行的系统：

KMS 文件夹结构：按项目组织的知识管理系统
通用项目模板：每个研究项目从同一个骨架开始
CLAUDE.md 层级：全局 → KMS 根目录 → 项目级，三层提示词体系
Wiki-first 纪律：先写 wiki，再写笔记，再发布
Kill-my-thesis 对抗层：在起草笔记前，用另一个模型故意挑战自己的论点
声音参考文档：保持跨内容的一致性表达风格
Call tracker：记录每次研究判断的质量和结果
Trade journal：持仓记录和纪律管理
发布序列：Substack → YouTube → X 的跨平台分发规则
9 步研究流程：无跳过规则，每一步都有明确目的

Phase 1 结束时，每个步骤都已被手动执行过数十次。失败模式被记录，陷阱被命名，哪些步骤无聊到值得自动化、哪些步骤永远属于人类，都已经清晰。

Phase 2：自动化（2026 年 5 月上线）

Phase 2 是本文的主体，它自动化的是情报基础设施，而非研究本身。

已自动化

晨间简报（每天 6:30 AM IST）：

6 个 Hermes Worker 并行运行：
- W1：Grok x_search 抓取夜间加密推特动态
- W2-W4：3 个 Gemini Flash 数据 Worker（加密、股票、宏观）
- W5：Gemini Flash 处理精选 YouTube 转录
- W6：Gemini Flash 抓取网络新闻
Gemini 2.5 Pro 合成 6 份输出为单一简报
Gemini Flash 验证合成结果，标记幻觉
Telegram 推送到手机

内部三阶段：质量评分（对照 rubric）→ 想法提取到 idea tracker → 通过 Hermes 子进程调用 Claude Code 更新 wiki

晚间持仓提醒（每天 7:00 PM IST）：拉取所有 Open/Watching 仓位的实时价格，Grok Tier 1 扫描跟踪标的，保存简报并推送到 Telegram。

月度技能刷新：每月 1 日检查 Claude Code 新技能和 Anthropic SDK 变更。

仍手动

Llama AI 拉取：需要在浏览器中手动操作，无法 VPS 自动化
TradingView 图表分析：需要 Mac 桌面应用远程调试模式
研究会话启动：判断本周研究什么，需要人类综合 call tracker、trade journal、晨间简报和社区讨论
发布决策：v1 草稿是否足够好、声音校准、最终审查、tracker 更新、跨平台分发——每一步都是人类检查点

Phase 2 的真实价值

Phase 2 不是"运行研究"，而是"清理跑道"。它把每天 2-3 小时的数据收集和晨间情报工作自动化，让研究者能在清醒时直接做研究判断。

Phase 3：规模化（6-12 个月后）

三个组件，按顺序构建：

Llama AI 浏览器自动化：用 browser-use Python 库让 Hermes 自动登录 Llama AI、输入提示词、轮询完成、导出 markdown。单会话验证后，扩展到 3 个并行实例做行业深度研究。
研究编排 Skill：一条 Telegram 命令触发端到端流水线。输入：research Kaspa$KAS。Hermes 解释请求 → 并行触发目标 MCP → Grok CT 情绪分析 → Llama AI 浏览器拉取 → 合成模型构建 wiki → Grok kill-my-thesis → Sonnet 4.6 起草 v1 → Telegram 推送草稿链接。人类打开草稿时，它不是空白，而是一个需要声音校准和最终审查的连贯 v1。
并行专业 Agent：加密 Agent、股票 Agent、宏观 Agent 同时运行各自领域，每个有自己的编排 Skill、领域特定 MCP 和声音校准。人类审阅和编辑三个输出，但不生产它们。

Phase 3 的时间线

6-12 个月。瓶颈不是工具——browser-use 存在，Hermes 能 spawn 并行子进程，多 Agent 编排模式已有公开框架。瓶颈是 Phase 1 揭示的那个纪律：每个新步骤必须先被充分文档化和手动执行，才能自动化。

成本结构（2026 年 5 月实际账单）

层级	月成本	组成
最小可用栈	~$51	Claude Code Pro ( $20) + X Premium Plus ($ 16) + TradingView Pro ($15)
核心研究栈	~$90	最小栈 + Llama AI Pro ($30-50)
完整栈	~$150-200	核心栈 + Hermes 自动化 + Gemini 晨间简报 + VPS ($6-12)

渐进路径：第 1 月建 KMS 和手动流程；第 2 月加 Llama AI 和 kill-my-thesis；第 3 月加 Hermes 自动化。

8 个 MCP 中 5 个完全免费：FRED、SEC EDGAR、Financial Datasets、Fear & Greed、Whale Tracker。CoinMarketCap 和 Alpha Vantage 免费 tier 足够个人使用。真正成本集中在 5 项：Claude Code / Anthropic API、xAI via X Premium Plus、Google AI Studio、Llama AI Pro、VPS。

什么 Agent 不能替代

Phase 3 不是让操作者变得可选。以下判断永远属于人类：

研究什么、为什么现在研究
构建什么论点
证据支持什么确信度层级
何时 kill condition 触发
论点可挽救还是方向错误

Agent 消除的是机械工作时间：数据收集、合成、初稿生产、日常监控、跨平台分发、tracker 记录。对单人操作者来说，这是每周 2 篇笔记 vs 8 篇的区别。编辑判断的速度不变——它是那个不能通过工具扩展的约束。

复合的起点

文章开头说："你今天写的每篇研究笔记都从零开始。"

这套系统移除的就是这个条件。今天的笔记从以下开始：

上一次会话结束时更新的项目 CLAUDE.md
经过 3 次研究迭代精炼的 wiki 页面
4 小时前 Hermes 合成的晨间简报
一个故意"看不见" wiki 的模型产生的 kill-my-thesis 裁决
41 行历史数据告诉你论点质量在真实结果下的表现
一个知道你持仓、无需提醒的 trade journal

没有从零开始。一切复合。

"Build the second brain first. The compounding starts on day one."