核心原则:先系统化,再自动化
Rohit Chauhan 是一名加密与股票研究员,用 6 个月时间搭建了一套多 LLM 驱动的研究工作室。他的核心发现是:大多数 Agent 构建失败,不是因为工具不够,而是因为人们试图自动化一个自己还没理解的流程。
"Automating a messy process makes a messy process run faster. The automation does not clean the process. It compounds the entropy at machine speed."
这句话是整个三阶段方法论的起点。
Phase 1:系统化(2026 年 1-5 月)
Phase 1 没有写一行自动化代码。它的产出是一套可手动执行的系统:
- KMS 文件夹结构:按项目组织的知识管理系统
- 通用项目模板:每个研究项目从同一个骨架开始
- CLAUDE.md 层级:全局 → KMS 根目录 → 项目级,三层提示词体系
- Wiki-first 纪律:先写 wiki,再写笔记,再发布
- Kill-my-thesis 对抗层:在起草笔记前,用另一个模型故意挑战自己的论点
- 声音参考文档:保持跨内容的一致性表达风格
- Call tracker:记录每次研究判断的质量和结果
- Trade journal:持仓记录和纪律管理
- 发布序列:Substack → YouTube → X 的跨平台分发规则
- 9 步研究流程:无跳过规则,每一步都有明确目的
Phase 1 结束时,每个步骤都已被手动执行过数十次。失败模式被记录,陷阱被命名,哪些步骤无聊到值得自动化、哪些步骤永远属于人类,都已经清晰。
Phase 2:自动化(2026 年 5 月上线)
Phase 2 是本文的主体,它自动化的是情报基础设施,而非研究本身。
已自动化
晨间简报(每天 6:30 AM IST):
- 6 个 Hermes Worker 并行运行:
- W1:Grok x_search 抓取夜间加密推特动态
- W2-W4:3 个 Gemini Flash 数据 Worker(加密、股票、宏观)
- W5:Gemini Flash 处理精选 YouTube 转录
- W6:Gemini Flash 抓取网络新闻
- Gemini 2.5 Pro 合成 6 份输出为单一简报
- Gemini Flash 验证合成结果,标记幻觉
- Telegram 推送到手机
内部三阶段:质量评分(对照 rubric)→ 想法提取到 idea tracker → 通过 Hermes 子进程调用 Claude Code 更新 wiki
晚间持仓提醒(每天 7:00 PM IST):拉取所有 Open/Watching 仓位的实时价格,Grok Tier 1 扫描跟踪标的,保存简报并推送到 Telegram。
月度技能刷新:每月 1 日检查 Claude Code 新技能和 Anthropic SDK 变更。
仍手动
- Llama AI 拉取:需要在浏览器中手动操作,无法 VPS 自动化
- TradingView 图表分析:需要 Mac 桌面应用远程调试模式
- 研究会话启动:判断本周研究什么,需要人类综合 call tracker、trade journal、晨间简报和社区讨论
- 发布决策:v1 草稿是否足够好、声音校准、最终审查、tracker 更新、跨平台分发——每一步都是人类检查点
Phase 2 的真实价值
Phase 2 不是"运行研究",而是"清理跑道"。它把每天 2-3 小时的数据收集和晨间情报工作自动化,让研究者能在清醒时直接做研究判断。
Phase 3:规模化(6-12 个月后)
三个组件,按顺序构建:
-
Llama AI 浏览器自动化:用 browser-use Python 库让 Hermes 自动登录 Llama AI、输入提示词、轮询完成、导出 markdown。单会话验证后,扩展到 3 个并行实例做行业深度研究。
-
研究编排 Skill:一条 Telegram 命令触发端到端流水线。输入:
research Kaspa$KAS。Hermes 解释请求 → 并行触发目标 MCP → Grok CT 情绪分析 → Llama AI 浏览器拉取 → 合成模型构建 wiki → Grok kill-my-thesis → Sonnet 4.6 起草 v1 → Telegram 推送草稿链接。人类打开草稿时,它不是空白,而是一个需要声音校准和最终审查的连贯 v1。 -
并行专业 Agent:加密 Agent、股票 Agent、宏观 Agent 同时运行各自领域,每个有自己的编排 Skill、领域特定 MCP 和声音校准。人类审阅和编辑三个输出,但不生产它们。
Phase 3 的时间线
6-12 个月。瓶颈不是工具——browser-use 存在,Hermes 能 spawn 并行子进程,多 Agent 编排模式已有公开框架。瓶颈是 Phase 1 揭示的那个纪律:每个新步骤必须先被充分文档化和手动执行,才能自动化。
成本结构(2026 年 5 月实际账单)
| 层级 | 月成本 | 组成 |
|---|---|---|
| 最小可用栈 | ~$51 | Claude Code Pro (16) + TradingView Pro ($15) |
| 核心研究栈 | ~$90 | 最小栈 + Llama AI Pro ($30-50) |
| 完整栈 | ~$150-200 | 核心栈 + Hermes 自动化 + Gemini 晨间简报 + VPS ($6-12) |
渐进路径:第 1 月建 KMS 和手动流程;第 2 月加 Llama AI 和 kill-my-thesis;第 3 月加 Hermes 自动化。
8 个 MCP 中 5 个完全免费:FRED、SEC EDGAR、Financial Datasets、Fear & Greed、Whale Tracker。CoinMarketCap 和 Alpha Vantage 免费 tier 足够个人使用。真正成本集中在 5 项:Claude Code / Anthropic API、xAI via X Premium Plus、Google AI Studio、Llama AI Pro、VPS。
什么 Agent 不能替代
Phase 3 不是让操作者变得可选。以下判断永远属于人类:
- 研究什么、为什么现在研究
- 构建什么论点
- 证据支持什么确信度层级
- 何时 kill condition 触发
- 论点可挽救还是方向错误
Agent 消除的是机械工作时间:数据收集、合成、初稿生产、日常监控、跨平台分发、tracker 记录。对单人操作者来说,这是每周 2 篇笔记 vs 8 篇的区别。编辑判断的速度不变——它是那个不能通过工具扩展的约束。
复合的起点
文章开头说:"你今天写的每篇研究笔记都从零开始。"
这套系统移除的就是这个条件。今天的笔记从以下开始:
- 上一次会话结束时更新的项目 CLAUDE.md
- 经过 3 次研究迭代精炼的 wiki 页面
- 4 小时前 Hermes 合成的晨间简报
- 一个故意"看不见" wiki 的模型产生的 kill-my-thesis 裁决
- 41 行历史数据告诉你论点质量在真实结果下的表现
- 一个知道你持仓、无需提醒的 trade journal
没有从零开始。一切复合。
"Build the second brain first. The compounding starts on day one."