LangChain Labs 发布：专注 Agent 持续学习的应用研究

LangChain 今天正式发布 LangChain Labs，一个新的应用研究计划，专注于持续学习（Continual Learning）。目标是推进开放的、面向每个 Agent 的应用研究。团队正与跨行业合作伙伴合作，确保这项技术对更广泛的 Agent 构建社区有用。

核心问题：Agent 数据里的信号

每次 Agent 运行都包含有用的信号。开放的问题是如何捕获这些信号、将其转化为可用数据、然后应用这些改进。

捕获、转换和理解大规模 Agent 数据——这正是 LangSmith 被构建的目的。这为团队和客户解决持续学习问题提供了绝佳的起点。

这些改进可以应用在 Agent 栈的不同层面：优化 Agent harness、选择不同模型、或微调模型。

LangChain Labs 与以下早期研究合作伙伴启动这项工作：

Harvey 应用研究负责人 Niko Grupen："我们很高兴与 LangChain Labs 团队合作，推动复杂法律工作中高效、自改进 Agent 的应用研究。"

Agent 正以 rapid rate 被集成到软件系统中。很快 Agent 将在几个月内产生比人类历史上所有数据总和还多的数据。从这些数据中提取有用信号，用于评估/环境生成、harness 工程和后训练，仍然是一个困难的问题。

Traces 是这些数据的来源，团队希望帮助每个团队用 traces 构建更好的 Agent。

Agent 在真实的组织约束下运行：成本、延迟和任务性能。对于世界上许多最重要的任务，我们尚未发现最高效的模型 harness、模型和反馈循环组合，让 Agent 能够自改进。

要正确评估 Agent，通常需要在代表其生产使用方式的环境中端到端运行它们。这些环境可能难以且耗时创建。团队正在研究如何更容易地创建和运行用于评估、模拟和强化学习的环境。

Prompt 是特定于模型家族的，从一个模型家族迁移到另一个可能既烦人又耗时。

团队相信多模型的未来，团队可以轻松为任务选择合适的模型。跨模型的 Prompt 优化可以帮助使这些迁移更容易，减少所需的手动调优量。

与合作伙伴的一些早期工作包括：

LangChain 的开源生态系统一直是构建者互相学习的核心部分，团队希望 LangChain Labs 延续这一模式。将继续发布研究、评估和开源集成，帮助更广泛的 Agent 构建社区。

团队希望与探索 Agent 如何学习、适应和改进的团队合作。目标是推进更多开放研究，为下一代自改进 Agent 提供动力。