基本能力
产品定位
mcp-web-search 是一个专注于提供高效、安全的网页搜索和内容查看服务的 MCP 服务器。
核心功能
- Google 自定义搜索:支持高级过滤功能。
- 网页内容查看:将网页内容转换为 markdown 格式。
- 速率限制和缓存:优化请求频率,提高性能。
- 浏览器实例池:管理浏览器实例,提高资源利用率。
- 防机器人检测:使用 rebrowser-puppeteer 技术避免被检测为机器人。
适用场景
- 需要高效、安全的网页搜索和内容提取的场景。
- 需要避免被网站检测为机器人的自动化任务。
- 需要将网页内容转换为 markdown 格式的应用。
工具列表
- 搜索工具:
- 功能:执行 Google 搜索,支持自定义查询参数和过滤条件。
-
参数:
query
(查询字符串)、trustedDomains
(信任的域名)、excludedDomains
(排除的域名)、resultCount
(结果数量)、safeSearch
(安全搜索)、dateRestrict
(日期限制)。 -
查看 URL 工具:
- 功能:查看指定 URL 的网页内容,支持转换为 markdown 格式。
- 参数:
url
(目标 URL)、includeImages
(包含图片)、includeVideos
(包含视频)、preserveLinks
(保留链接)、formatCode
(格式化代码)。
常见问题解答
- Claude Desktop 集成问题:
- 检查日志文件以获取错误信息。
- 确保配置文件语法和路径正确。
-
路径问题:使用绝对路径。
-
机器人检测:
- 虽然提供了防检测功能,但某些网站可能仍能通过其他方式检测到自动化工具。
- 建议使用适当的代理和用户代理设置以增强隐蔽性。
使用教程
使用依赖
- Bun 运行时:v1.0 或更高版本。
- Google API 凭证:API 密钥和搜索引擎 ID。
安装依赖命令:
bash
bun install
安装教程
-
安装依赖:
bash
bun install -
构建 TypeScript 文件:
bash
bun run build -
配置 Cookie:
- 安装 Chrome 扩展 Get cookies.txt LOCALLY。
- 登录目标网站并导出 cookies 为 JSON 格式。
-
设置环境变量
BROWSER_COOKIES_PATH
为 cookies 文件的绝对路径。 -
配置 MCP 服务器:
- 编辑配置文件(路径见上文),添加服务器配置。
- 替换
/ABSOLUTE/PATH/TO/web_search_mcp
为服务器目录的绝对路径。
调试方式
-
运行开发模式:
bash
bun --watch run dev -
运行测试:
bash
bun run test -
运行 linter:
bash
bun run lint -
查看日志:
- MacOS/Linux:
bash
tail -n 20 -f ~/Library/Logs/Claude/mcp*.log - Windows:
bash
type %APPDATA%\Claude\Logs\mcp*.log