核心发布
Browserbase 推出 Browse.sh —— 目前最大的开源 AI 网页技能库(skill catalog)。
这套 CLI 工具预置了数百个主流网站的交互脚本,Agent 可以直接调用,无需从零解析陌生的页面结构。
问题背景
以往 Agent 每次跨站执行任务,都要重新解析陌生的页面结构:
- 每个网站的 DOM 结构不同
- 交互逻辑各异(按钮位置、表单字段、验证流程)
- Agent 需要大量试错才能完成任务
Browse.sh 提前跑通了这些交互逻辑,相当于给 AI 发了一本互联网黄页。
产品形态
| 特性 | 说明 |
|---|---|
| CLI 工具 | 命令行安装,一键调用 |
| 预置脚本 | 数百个主流网站的交互路径 |
| 开源免费 | 目录完全免费开源 |
| 官方验证 | 与平台合作发布官方技能 |
首发合作平台
Browserbase 联手四家平台发布官方验证的专属技能:
- Ramp — 企业财务管理平台
- Lovable — AI 应用构建平台
- Interaction — 交互设计平台
- Reducto — 文档处理平台
这些官方技能意味着:Agent 在这些平台上的操作路径已经过平台方验证,可靠性远高于 Agent 自行探索。
为什么这是基础设施
对 Agent 开发者
- 无需为每个目标网站写定制化脚本
- 调用现成技能,大幅降低开发成本
- 技能经过社区验证,稳定性更高
对网站/平台方
- 可以主动发布官方技能,控制 Agent 的交互方式
- 避免 Agent 以不可预期的方式操作网站
- 类似于 API 的"官方封装"
对生态
- 技能目录成为 Agent 上网的"标准接口"
- 类似于 npm 之于 JavaScript,pip 之于 Python
- 掌握技能目录的平台,掌握 Agent 的上网入口
与 Browserbase 产品矩阵的关系
Browse.sh 是 Browserbase 产品矩阵的最新一环:
| 产品 | 功能 |
|---|---|
| Browsers | 为 Agent 提供真实浏览器环境 |
| Web Data APIs | 搜索和获取网页数据 |
| Runtime | Agent 部署的沙箱环境 |
| Identity | Agent 的身份认证 |
| Stagehand | AI 浏览器自动化框架 |
| Browse.sh | 预置网页交互技能目录 |
战略意义
Browse.sh 的推出意味着 Browserbase 正在从"提供浏览器基础设施"向"定义 Agent 上网标准"演进。
关键判断:
- 谁掌握技能目录,谁就掌握 Agent 的上网入口
- 官方验证技能成为平台的"Agent 友好度"指标
- 开源策略加速生态形成,类似于 Docker Hub 或 npm registry
来源: Browserbase on X