基本能力
产品定位
Site Cloner MCP Server 是一个用于克隆网站的工具,帮助用户快速获取和分析网站内容。
核心功能
- 从任何 URL 获取 HTML 内容
- 从 HTML 内容中提取资源(CSS、JavaScript、图片、字体等)
- 下载单个资源到本地目录
- 解析 CSS 文件以提取链接资源(字体、图片)
- 创建网站的地图
- 分析页面结构和布局
适用场景
- 网站克隆和分析
- 网站内容备份
- 网站结构研究
工具列表
- fetch_page: 获取网页的 HTML 内容
- extract_assets: 从 HTML 内容中提取资源链接
- download_asset: 从 URL 下载资源并保存到指定目录
- parse_css_for_assets: 解析 CSS 内容以提取引用的资源(如字体和图片)
- create_site_map: 从给定 URL 开始创建网站的站点地图
- analyze_page_structure: 分析 HTML 页面的结构并提取关键组件
常见问题解答
- 服务器未在 Cursor 中显示: 重启 Cursor,检查配置文件语法,确保 Docker 已正确安装并运行。
- 模块未找到错误: 检查 pyproject.toml 中的包名是否正确,确保 Python 文件中的导入语句不包含 "src." 前缀。
- 检查 Docker 日志: 使用
docker logs
命令查看错误日志。
使用教程
使用依赖
- 需要安装 Docker
安装教程
- 构建 Docker 镜像:
bash
docker build -t site-cloner-mcp . - 运行容器:
bash
docker run -i --rm site-cloner-mcp - 如需持久存储下载的文件,可以挂载卷:
bash
docker run -i --rm -v $(pwd)/downloaded_sites:/app/downloaded_site site-cloner-mcp
调试方式
- 检查 Docker 日志:
bash
docker logs $(docker ps -q --filter ancestor=site-cloner-mcp) - 手动运行服务器以查看错误:
bash
docker run -i --rm site-cloner-mcp