AI 工具
English

Firecrawl MCP Server 上手:给 Claude 和 Cursor 装上网页抓取的手臂

Firecrawl 官方推出的 MCP Server 让 LLM 客户端直接拥有网页抓取和搜索能力。我接入了 Claude Code 试了几天,聊聊实际能干什么、坑在哪。

MCPWeb ScrapingFirecrawlLLM ToolsCursor

广告

MCP(Model Context Protocol)最近火得不行,各大工具都在出 MCP Server。Firecrawl 作为网页抓取领域的老面孔,也推出了官方的 MCP Server,让 Claude、Cursor 这些 LLM 客户端直接调用它的抓取和搜索能力。GitHub 上 6000 多 star,我接进来用了几天,说说感受。

它能给 LLM 客户端加什么能力

简单来说,装上这个 MCP Server 之后,你的 Claude Code 或 Cursor 就能做这几件事:

  • 抓取任意网页:给个 URL,它返回页面内容的 Markdown 格式,清理了广告、导航这些噪音
  • 批量抓取:给一个网站,它能递归爬取多个页面,适合做文档站的全站抓取
  • 搜索:直接在对话里搜网上内容,不用你手动复制粘贴
  • 结构化提取:从页面里按你定义的 schema 提取结构化数据,比如产品名称、价格、评分

这些能力对于经常需要”查资料、读文档、做调研”的开发者来说,价值很明显。

安装配置

MCP Server 的配置方式取决于你用的客户端。以 Claude Code 为例:

~/.claude/mcp-config.json 里添加:

{
  "mcpServers": {
    "firecrawl": {
      "command": "npx",
      "args": ["-y", "firecrawl-mcp"],
      "env": {
        "FIRECRAWL_API_KEY": "your-api-key"
      }
    }
  }
}

然后重启 Claude Code。它会自动识别可用的工具并提示你是否允许调用。

Firecrawl 有免费额度(每月 500 credits),个人玩够用了。注册拿 API key 就行。

实际使用场景

场景一:读技术文档

我让 Claude 去读一个我没用过的库的文档站,然后给我总结核心 API。Claude 调用了 Firecrawl 的批量抓取,把整个文档站爬下来,然后分段分析。最终给我的总结相当到位,省去了我手动翻文档的时间。

场景二:竞品调研

我需要对比三个同类产品的功能列表。给 Claude 三个产品页面的 URL,让它抓取后做横向对比。Firecrawl 的结构化提取在这里发挥了作用——我定义了 schema(功能名称、描述、是否支持),Claude 自动从页面里提取对应信息,整理成表格。

场景三:新闻摘要

让 Claude 搜某话题的最新新闻,抓取前三篇,给出摘要和要点。搜索 + 抓取 + 总结一条龙,全程不用离开对话界面。

优点很明显

官方出品,质量稳。不是社区随便搭的 MCP wrapper,Firecrawl 团队自己维护,接口稳定性和文档完整度都有保障。

抓取质量高。Firecrawl 的核心能力就是把混乱的网页转成干净的 Markdown,去掉导航、广告、footer 这些干扰。比直接用 curl + grep 靠谱多了。

和 LLM 工作流自然融合。不需要切换工具,在对话里一句话就能触发抓取,结果直接进上下文,Claude 接着分析。流程丝滑。

免费额度慷慨。500 credits/月对个人开发者够用,轻度使用基本不用花钱。

但问题也有

需要联网调用 API。每次抓取都要走 Firecrawl 的服务器,国内网络环境下有时候不太稳定。我遇到过几次 timeout,重试才成功。

复杂页面搞不定。SPA(单页应用)、重度 JavaScript 渲染的页面,抓取结果有时候是空的或者只有加载动画。Firecrawl 支持 JavaScript 渲染,但效果不如专门 headless 浏览器稳定。

API 调用有成本意识。虽然免费额度够用,但做大规模爬取时 credits 消耗很快。批量抓取一个大型文档站,一次可能烧掉几十 credits。

错误信息不够细。有时候抓取失败,返回的错误信息很笼统,不知道是网络问题、页面问题还是 API 问题,排查起来费劲。

适合谁用

如果你经常用 Claude Code 或 Cursor 做开发,且工作中经常需要查文档、读网页、做信息搜集,Firecrawl MCP Server 能明显提升效率。它把”打开浏览器→搜内容→复制粘贴→整理”这个流程压缩成一句自然语言指令。

但如果你主要是离线工作、或者对网络稳定性要求高(比如在公司内网),这个工具的实用性会打折扣。

总结

Firecrawl MCP Server 是 MCP 生态里比较实用的一个。它不是那种”有了更好没有也行”的花瓶,而是能实打实减少你切换工具、复制粘贴次数的生产力插件。6000 star 的成绩在 MCP Server 里算是头部了,质量和维护活跃度都有保障。对于已经习惯用 Claude Code/Cursor 的开发者,值得一装。

GitHub: https://github.com/firecrawl/firecrawl-mcp-server 官网: https://www.firecrawl.dev/


关于作者

柳钉鱼,全栈开发者,GitHub 重度用户。过去 3 年 Star 了 900+ 仓库,这里只写我真正用过或深度调研过的工具。

📧 发现好工具想推荐?发邮件到 [email protected]

广告

相关文章