返回 FEED
AGENT2026-05-15

LangChain Labs 发布:专注 Agent 持续学习的应用研究

LangChain 今天正式发布 LangChain Labs,一个新的应用研究计划,专注于持续学习(Continual Learning)。目标是推进开放的、面向每个 Agent 的应用研究。团队正与跨行业合作伙伴合作,确保这项技术对更广泛的 Agent 构建社区有用。

核心问题:Agent 数据里的信号

每次 Agent 运行都包含有用的信号。开放的问题是如何捕获这些信号、将其转化为可用数据、然后应用这些改进。

捕获、转换和理解大规模 Agent 数据——这正是 LangSmith 被构建的目的。这为团队和客户解决持续学习问题提供了绝佳的起点。

这些改进可以应用在 Agent 栈的不同层面:优化 Agent harness、选择不同模型、或微调模型。

早期研究合作伙伴

LangChain Labs 与以下早期研究合作伙伴启动这项工作:

  • Harvey — 法律 AI
  • Nvidia — 计算基础设施
  • Prime Intellect — 去中心化 AI 训练
  • Fireworks — 推理服务
  • Baseten — 模型部署

Harvey 应用研究负责人 Niko Grupen:"我们很高兴与 LangChain Labs 团队合作,推动复杂法律工作中高效、自改进 Agent 的应用研究。"

四大研究方向

1. 从大规模 Agent 数据中挖掘信息以改进 Agent

Agent 正以 rapid rate 被集成到软件系统中。很快 Agent 将在几个月内产生比人类历史上所有数据总和还多的数据。从这些数据中提取有用信号,用于评估/环境生成、harness 工程和后训练,仍然是一个困难的问题。

Traces 是这些数据的来源,团队希望帮助每个团队用 traces 构建更好的 Agent。

2. Pareto 前沿上的高效 Agent

Agent 在真实的组织约束下运行:成本、延迟和任务性能。对于世界上许多最重要的任务,我们尚未发现最高效的模型 harness、模型和反馈循环组合,让 Agent 能够自改进。

3. 系统构建评估和模拟环境

要正确评估 Agent,通常需要在代表其生产使用方式的环境中端到端运行它们。这些环境可能难以且耗时创建。团队正在研究如何更容易地创建和运行用于评估、模拟和强化学习的环境。

4. 跨模型 Prompt 优化

Prompt 是特定于模型家族的,从一个模型家族迁移到另一个可能既烦人又耗时。

团队相信多模型的未来,团队可以轻松为任务选择合适的模型。跨模型的 Prompt 优化可以帮助使这些迁移更容易,减少所需的手动调优量。

早期工作示例

与合作伙伴的一些早期工作包括:

  • 测量 Agent 如何在不同垂直领域(如法律服务)之间泛化
  • Harness 工程和微调 Nemotron 等开源模型作为成本高效的 subagent
  • 构建评估/环境,让团队能把 trace 数据转化为可用数据以改进 Agent

开源社区优先

LangChain 的开源生态系统一直是构建者互相学习的核心部分,团队希望 LangChain Labs 延续这一模式。将继续发布研究、评估和开源集成,帮助更广泛的 Agent 构建社区。

团队希望与探索 Agent 如何学习、适应和改进的团队合作。目标是推进更多开放研究,为下一代自改进 Agent 提供动力。