返回 FEED
AGENT2026-05-29

Hermes + Polymarket:如何搭建一个能自学习的 BTC 交易代理,从 100 美元小资金开始跑自动化策略

2025–2026 年,Polymarket 上的交易 bot 已经创造了超过 6000 万美元利润。其中 77% 来自同一个市场:Crypto UP/DOWN。更具体地说,是 BTC Up/Down 这类短周期加密市场。

这不是一个偶然现象。这个数字背后,是一套可以被复制和自动化的交易逻辑。

为什么是 Polymarket

Polymarket 是一个预测市场平台,用户可以交易某个事件是否会发生——比如"BTC 本周收盘价是否上涨"。这种市场的特点是非常适合短周期策略:事件结果明确、结算快、数据反馈及时。

对于一个 AI 交易代理来说,这意味着:每次预测的结果都会快速得到验证,而验证结果可以立即反馈到下一轮决策里。

这是机器学习最理想的学习环境——快速反馈闭环。

真正的 Agent 不应该每次从零开始

大多数人在用 AI 做交易判断的时候,每次新开一个对话,都要重新粘贴上下文:你上次交易了什么、市场条件是什么、你的策略是什么。一遍又一遍。

这不是 AI agent——这只是用一个更强的工具重复最笨的操作。

真正的 agent 应该能记住:过去发生过什么、哪些信息有用、哪些判断错了、下次应该怎么改。

这就是 memory 机制的价值。

Agent Memory 的四个关键维度

文章描述了一个完整的 agent memory 框架,核心是四个点:

1. 为什么 agents 会在 session 之间忘掉一切

当你在一个全新的对话里调用同一个 AI 模型,它确实有之前对话里学到的知识——但那个知识是通用的、模糊的,不是针对你这段具体经历的记忆。每次新开 chat,agent 相当于"失忆",因为它没有持久化的上下文。

这不是 bug,是大模型的设计取舍:通用模型在训练时学到的是模式,不是事件记录。

2. Memory Stores:让 agents 跨 session 读写

解决方案是构建一个持久化的存储层,agent 每次完成任务时把关键信息写入这个存储,下次启动时先从这个存储里读取相关上下文。

这个存储不一定是数据库——它可以是文件系统、向量数据库、或者结构化的 JSON 文件。关键是 agent 的每次执行都能"记住"之前发生过什么。

3. Dreaming:让 agents 自己改进自己的 memory

这是最有趣的设计思路:每天晚上,agent 自动运行一次"复盘"任务,分析自己过去 24 小时的行为日志,识别哪些判断是对的、哪些是错的,把结论更新到 memory 里。

这个过程不需要人类介入。Agent 相当于每天睡醒之后比前一天更懂这个市场。

4. 95% cache hit rate:保证成本不失控

如果 agent 每次处理请求都重新从原始数据计算,它的计算成本会非常高。95% cache hit rate 的意思是:agent 90% 以上的请求可以直接从缓存的历史结果里读取,不需要重新计算。

这套设计让 agent 在保持"记忆"的同时,每次响应的计算成本维持在可接受范围内。

自学习的 BTC 交易代理长什么样

基于以上框架,一个能够自学习的 BTC 交易代理大概长这样:

早上启动:agent 从 memory 里读取前一天的市场状态和交易结果,计算哪些策略在最近表现好、哪些表现差

盘前分析:分析当前宏观信号(链上数据、宏观情绪、技术指标),形成对当天走势的基础判断

盘中执行:按照策略执行交易,但关键决策点会留下"标记",方便事后复盘

收盘复盘:当预测结果结算后,agent 分析预测和实际结果的偏差,更新 memory 里的策略权重

夜间 dreaming:结束当天交易后,agent 用空闲时间回顾过去 N 天的交易日志,生成一份"学习报告",更新对市场规律的认知

从 100 美元开始的意义

小资金起步不只是为了控制风险,而是为了在真实市场里验证逻辑。回测数据和真实市场之间永远有差距——滑点、流动性、执行延迟、极端行情,这些都是回测里不容易模拟的。

用小资金跑真实市场,你得到的是:一个能够自我校准的交易系统。Agent 在真实环境里学会什么是有效的、什么是噪音,然后把学到的东西持续更新到 memory 里。

核心壁垒不是策略,是学习系统

文章里有一个观点很关键:真正有价值的是 agent 形成持续状态的能力,而不是某一次具体的交易判断。

大多数交易 bot 的问题是:如果市场条件变了,策略就失效。而一个有自学习能力的 agent,它的策略权重会随市场变化而调整——这不是简单的参数调优,而是一个持续的环境适应过程。

如果 agent 每晚都能整理记忆、更新经验、压缩上下文,那它就不是一个临时工具,而更像一个会持续变强的工作系统。