Firecrawl 近日开源了旗下 Web Agent 的核心框架(firecrawl/web-agent,MIT 协议,565 stars)。这个 agent 为 Firecrawl 官方产品 firecrawl.dev/app/agent 提供底层支持,现在任何人都可以 fork、换模型、加 skills、自定义部署。
分层架构
Firecrawl 把整个技术栈拆成了明确的层级,每层都可以独立使用或替换:
应用层:Next.js 模板(chat UI、streaming、Skills、Subagents)
Express 模板(API server)
↑
Agent 核心:Deep Agents(LangChain)+ Skills + Subagents
↑
Firecrawl AI SDK:Search / Scrape / Interact(浏览器自动化)
↑
Firecrawl SDK:核心 API(Scrape / Search / Crawl / Extract)
↑
REST API:任意语言调用
从 ready-to-use 的 Next.js chat UI,到只换底层 SDK 的细粒度控制——按需取用。
核心组件
Harness:Deep Agents(LangChain),提供 plan-act 循环、并行 Subagent 生成、按需 SKILL.md 加载、context 管理。
工具集:Search(搜索)、Scrape(抓取)、Interact(浏览器自动化)、bash(shell 执行)。前三者由 Firecrawl 驱动,bash 由 just-bash 驱动。
Skills:可复用的 SKILL.md playbook,自动从 agent-core/src/skills/definitions/ 目录发现,通过 Deep Agents 的 middleware 按需加载。
Subagents:并行 worker,隔离执行独立任务,每个有独立工具集和 session 状态(如隔离的浏览器 interact session)。
快速启动
# 1. 安装 Firecrawl CLI 并认证
npx -y firecrawl-cli@latest init -y --browser
# 2. 脚手架一个 agent 项目
firecrawl create agent -t next
两步起一个带完整 Chat UI、streaming、Skills 和 Subagent 支持的 Next.js agent 应用。
与 browser-harness 的定位差异
同天发布的 browser-harness(592行代码,CDP 直连 Chrome)选择极简路线:框架几乎不做预设,工具全靠 AI 在执行过程中自己写。Firecrawl 走了完全相反的路:成熟工具链(Search/Scrape/Interact)+ 完整 harness(Deep Agents)+ Skills 系统 + 多模板部署选项。
两个方向都在探索同一个问题:浏览器自动化的边界在哪里。Firecrawl 选择了更快的落地路径(已有完整工具集),browser-harness 选择了更开放的进化路径(工具由 AI 现场构建)。