← 返回 FEED
GITHUB2026-04-20

Firecrawl Web Agent 开源:用 Spark 模型做结构化网页研究的 Agent 框架

Firecrawl 近日开源了旗下 Web Agent 的核心框架(firecrawl/web-agent,MIT 协议,565 stars)。这个 agent 为 Firecrawl 官方产品 firecrawl.dev/app/agent 提供底层支持,现在任何人都可以 fork、换模型、加 skills、自定义部署。

分层架构

Firecrawl 把整个技术栈拆成了明确的层级,每层都可以独立使用或替换:

应用层:Next.js 模板(chat UI、streaming、Skills、Subagents)
      Express 模板(API server)
         ↑
Agent 核心:Deep Agents(LangChain)+ Skills + Subagents
         ↑
Firecrawl AI SDK:Search / Scrape / Interact(浏览器自动化)
         ↑
Firecrawl SDK:核心 API(Scrape / Search / Crawl / Extract)
         ↑
REST API:任意语言调用

从 ready-to-use 的 Next.js chat UI,到只换底层 SDK 的细粒度控制——按需取用。

核心组件

Harness:Deep Agents(LangChain),提供 plan-act 循环、并行 Subagent 生成、按需 SKILL.md 加载、context 管理。

工具集:Search(搜索)、Scrape(抓取)、Interact(浏览器自动化)、bash(shell 执行)。前三者由 Firecrawl 驱动,bash 由 just-bash 驱动。

Skills:可复用的 SKILL.md playbook,自动从 agent-core/src/skills/definitions/ 目录发现,通过 Deep Agents 的 middleware 按需加载。

Subagents:并行 worker,隔离执行独立任务,每个有独立工具集和 session 状态(如隔离的浏览器 interact session)。

快速启动

# 1. 安装 Firecrawl CLI 并认证
npx -y firecrawl-cli@latest init -y --browser

# 2. 脚手架一个 agent 项目
firecrawl create agent -t next

两步起一个带完整 Chat UI、streaming、Skills 和 Subagent 支持的 Next.js agent 应用。

与 browser-harness 的定位差异

同天发布的 browser-harness(592行代码,CDP 直连 Chrome)选择极简路线:框架几乎不做预设,工具全靠 AI 在执行过程中自己写。Firecrawl 走了完全相反的路:成熟工具链(Search/Scrape/Interact)+ 完整 harness(Deep Agents)+ Skills 系统 + 多模板部署选项。

两个方向都在探索同一个问题:浏览器自动化的边界在哪里。Firecrawl 选择了更快的落地路径(已有完整工具集),browser-harness 选择了更开放的进化路径(工具由 AI 现场构建)。