Documentation Crawler & MCP Server - MCP服务，MCP服务器，MCP教程

搜索工具
15小时前
编辑

GPT头条

基本能力

产品定位

MCPDocSearch 是一个专为开发者设计的文档爬取和搜索工具集，通过 MCP 服务器提供高效的文档搜索功能。

核心功能

Web Crawler (crawler_cli)：
从给定 URL 开始爬取网站内容。
可配置爬取深度、URL 模式（包含/排除）、内容类型等。
生成统一的 Markdown 文件并保存到 ./storage/ 目录。
MCP Server (mcp_server)：
加载并解析 ./storage/ 中的 Markdown 文件。
将文档分块并生成向量嵌入。
提供缓存机制以加速后续启动。
通过 fastmcp 提供以下工具：
- list_documents：列出可用的文档。
- get_document_headings：获取文档的标题结构。
- search_documentation：基于语义搜索文档内容。

适用场景

需要快速访问和搜索大量文档的开发团队。
需要将文档内容集成到开发工具（如 Cursor）中的场景。
需要自动化爬取和整理网站文档的场景。

工具列表

crawler_cli：爬取网站并生成 Markdown 文档。
mcp_server：提供文档搜索服务的 MCP 服务器。

常见问题解答

嵌入时间：首次启动或文档变更时，生成嵌入可能需要较长时间，具体取决于硬件和文档大小。
缓存机制：服务器会缓存处理后的文档分块和嵌入，后续启动会更快。

使用教程

使用依赖

安装 uv：
bash curl -LsSf https://astral.sh/uv/install.sh | sh

安装教程

克隆仓库：
bash git clone https://github.com/alizdavoodi/MCPDocSearch.git cd MCPDocSearch
安装依赖：
bash uv sync

调试方式

运行爬虫：
bash uv run python crawl.py https://docs.example.com
启动 MCP 服务器：
bash python -m mcp_server.main
配置 Cursor：
创建 .cursor/mcp.json 文件并配置服务器路径。
重启 Cursor 以启用搜索服务。

MCP Server for Bun and Elysia - MCP服务，MCP服务器，MCP教程

2025-4-29 16:31:47

Terraform Cloud MCP Server - MCP服务，MCP服务器，MCP教程

2025-4-29 16:31:55

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_￥_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部