Agent 需要软件工程纪律
大多数 CIO 已将 Agent 集成到生产力套件中,在个别业务部门运行,并赋能团队拼接定制 Agent。但当被问及这些举措的总 ROI 时,大多数 CIO 仍在算数字。
许多团队正在构建孤立、脆弱的 Agent,没有连贯策略将它们串联起来,难以治理,导致 AI sprawl。
Glean 提出:CIO 应该像对待软件一样对待 Agent。
和其他软件系统一样,Agent 依赖上下文、工具、权限、工作流、运行时 safeguard 和持续监督。要驱动企业价值,Agent 应该被良好设计、测试、谨慎推出、生产监控、并随时间改进——就像工程团队交付其他类型的企业级软件一样。
Agent Development Lifecycle (ADLC)
采用类似软件开发生命周期模型的企业获得三件 ad-hoc AI pilot 无法提供的东西:
- 跨职能讨论 Agent 的共享语言
- 为每个 Agent 和整个组合定义 ROI 的可重复模式
- 每一步风险和所有权的清晰视图
ADLC 已帮助 Glean 客户(如 Sony、Databricks、Confluent)扩展 Agent 采用,每周数百万次 Agent 运行。Glean 内部工程团队部署的单个 Agent 每年回收 17,000+ 工程小时,ROI 超过 170 万美元。
七个阶段
1. Opportunity(机会)
用 plain language 说明 Agent 要解决的业务问题:今天谁受影响、没有 Agent 时工作如何进行、如果 Agent 成功会有什么 tangible change。把一切都锚定到业务已经关心的 outcome,而不只是有趣的 demo。
2. Design(设计)
描述 Agent 实际负责什么。定义工作单元(ticket、incident、call、workflow)、何时运行、需要什么信息、每次应该产生什么。明确 scope 内、scope 外、以及哪些假设需要早期测试。
3. Performance(性能)
把意图变成小而具体的成功指标集:期望推动的业务 KPI,加上 Agent-centric 的质量和安全信号。同意基线和目标范围,预先决定什么会导致你扩展、暂停或回滚 Agent。
4. Context(上下文)
识别 Agent 完成工作和被公平评估所需的最小权限感知数据源、工具、示例和反馈信号集。包括它能读取哪些系统、被允许采取哪些动作、以及用什么 telemetry 理解其表现。
5. Develop(开发)
把设计变成可靠的 Agent。选择正确的执行模型(结构化 workflow vs 更灵活的 auto-mode),然后针对 golden examples 测试、与现有流程并行运行、与 design partners 试点,直到 Agent 行为可预测——不仅在 hand-picked demo set 上。
6. Launch(发布)
把 rollout 当作 change-management 练习,不是开关切换。决定谁先看到 Agent、它如何出现在工作流中、需要什么培训和沟通、以及在扩大访问前必须有哪些 guardrails、SLO 和 kill switch。
7. Monitor & Improve(监控与改进)
像操作任何其他关键系统一样操作 Agent。使用 dashboards、alerts 和 runbooks 跟踪长期影响和质量,处理 incidents,把真实信号——用户反馈、覆盖、关键指标漂移——反馈到生命周期的早期阶段,让 Agent 持续改进。
这一步不是一次性阶段,而是随着 Agent 被维护、监控、升级和最终 sunset 的持续过程。
新产品能力
Auto-mode Agent(正式发布)
描述你想让 Agent 完成什么,auto-mode Agent 通过规划、推理和在企业图上行动来处理其余——在组织控制的 guardrails 和 managed actions 内。无预定义 workflow。无手动配置。
这是 Glean 为 Agent builder 发布的最重要的功能:从意图到可测试和迭代的东西的根本更快路径。
Debug 和 Trace Views
Agent 以不总是显而易见的方式失败。Debug view 展示每一步:inputs、tool calls、产生每个结果的决策。这种可见性 closes the loop:从"something went wrong"到"here's what to change"。
Sub-agents
不用构建一个 monolithic Agent 来处理流程的每个方面,团队可以构建可复用的 sub-agent,在需要时调用。这让 Agent 像最好的工程团队构建系统一样运作:模块化、可测试、每层受治理。
Agent Sandbox
为每个自主 Agent 提供安全、私密的运行时环境:文件系统用于组织和检索长时任务的中间输出(如分析大量 Gong calls),以及代码解释器用于超越语言模型推理单独能可靠处理的计算。
Agent Library
随着组织中 Agent 数量增长,discoverability 成为真正问题。Agent library 让管理员控制哪些 Agent 对谁可见、如何描述、如何分类。确保正确的 Agent 到达正确的人,catalog 不会变成噪音。
Agent Access Policies
管理员可以声明所有 Agent 必须遵守的组织级 guardrails,如防止实习生使用 Agent 写入任何记录系统。为企业提供 peace of mind,确保所有 Agent 受控。
Agent Insights
新 insights 界面展示哪些 Agent trending、哪些很少使用、用户在哪里给负面反馈、行为如何随时间变化。Agent 内的反馈机制让 builder 收集结构化信号来驱动迭代。
结语
下一波企业 AI 不会由拥有最多 Agent demo 的团队赢得。它将由能把 promising ideas 变成可重复、可测量 outcome 的团队赢得——这正是 ADLC 的设计目的。
在企业中,成功不会来自 ship 最多的 Agent。它将来自构建值得信赖、可治理、真正有用的 Agent——那种组织可以随时间改进并自信扩展的 Agent。