基本能力
产品定位
Firecrawl MCP Server 是一个专注于网页抓取、内容搜索和站点爬取的工具,旨在帮助开发者高效地从网页中提取结构化数据。
核心功能
- 网页抓取(Web Scraping):支持从任何网页提取内容,包括移动设备模拟、广告拦截、内容过滤和结构化数据提取。
- 内容搜索(Content Search):提供智能搜索功能,支持多语言、基于位置的结果和自定义输出格式。
- 站点爬取(Site Crawling):支持深度控制、路径过滤、速率限制和进度跟踪。
- 站点地图生成(Site Mapping):生成站点结构地图,支持子域名、搜索过滤和链接分析。
- 数据提取(Data Extraction):从多个 URL 提取结构化数据,支持批量处理和自定义提取提示。
适用场景
- 需要从网页中提取结构化数据的开发者。
- 需要批量爬取网站内容的项目。
- 需要生成站点地图或分析网站结构的任务。
工具列表
- npm:用于安装和管理依赖。
- Firecrawl API:提供网页抓取和内容搜索的核心功能。
- dotenv:用于管理环境变量。
常见问题解答
- 如何获取 API 密钥?:从 Firecrawl 开发者门户(https://firecrawl.dev/dashboard)获取。
- 如何设置环境变量?:支持通过命令行或
.env
文件设置。 - 如何调试?:使用
npm run dev
启动开发模式,查看详细日志。
使用教程
使用依赖
- 确保已安装 Node.js 和 npm。
- 安装 dotenv(可选):
bash
npm install dotenv
安装教程
- 全局安装:
bash
npm install -g @modelcontextprotocol/mcp-server-firecrawl - 本地项目安装:
bash
npm install @modelcontextprotocol/mcp-server-firecrawl
调试方式
- 启动开发模式:
bash
npm run dev - 运行测试:
bash
npm test - 查看日志:
bash
mcp-server-firecrawl --debug