基本能力
产品定位
search_mcp_server 是一个专注于网页搜索和内容相似性查找的 MCP 服务器,旨在为 Claude Desktop 提供强大的搜索功能支持。
核心功能
- 网页搜索:执行网页搜索并抓取结果。
- 相似性搜索:从之前的搜索中提取相关信息。
适用场景
- 需要网页搜索能力的应用程序
- 需要基于搜索查询查找相似内容的项目
工具列表
- Search Web:执行网页搜索并抓取结果
- 必需参数:
queries
(搜索查询列表) - 可选参数:
page_number
(搜索结果页码,默认为1) - Extract Info from Search:从之前的搜索中提取相关信息
- 必需参数:
queries
(要合并的搜索查询列表)
常见问题解答
- SSL 验证错误:确保
.env
文件中的 SSL 设置正确。 - 嵌入未生成:检查 Ollama 服务器是否运行且可访问,模型是否可用,输入 Parquet 文件中是否存在文本列。
- DuckDB 转换失败:检查输入 Parquet 文件是否存在且可读,输出目录是否有写入权限,文件是否损坏。
- PostgreSQL 转换失败:检查
.env
文件中的 PostgreSQL 连接设置是否正确,服务器是否运行且可访问,是否有创建/修改表的权限,pgvector 扩展是否安装。
使用教程
使用依赖
- 安装 Smithery CLI(如使用 Smithery 安装):
bash
npx -y @smithery/cli install @DeepSpringAI/parquet_mcp_server --client claude - 克隆仓库:
bash
git clone ...
cd parquet_mcp_server - 创建并激活虚拟环境:
bash
uv venv
.venv\Scripts\activate # Windows
source .venv/bin/activate # macOS/Linux
安装教程
- 安装包:
bash
uv pip install -e . - 创建
.env
文件并配置环境变量:
bash
EMBEDDING_URL=http://sample-url.com/api/embed
OLLAMA_URL=http://sample-url.com/
EMBEDDING_MODEL=sample-model
SEARCHAPI_API_KEY=your_searchapi_api_key
FIRECRAWL_API_KEY=your_firecrawl_api_key
VOYAGE_API_KEY=your_voyage_api_key
AZURE_OPENAI_ENDPOINT=http://sample-url.com/azure_openai
AZURE_OPENAI_API_KEY=your_azure_openai_api_key
调试方式
- 运行测试套件:
bash
python src/tests/run_tests.py - 运行单个测试:
bash
python src/tests/test_search_web.py
python src/tests/test_extract_info_from_search.py - 使用客户端直接测试:
python
from parquet_mcp_server.client import perform_search_and_scrape, find_similar_chunks
perform_search_and_scrape(["macbook", "laptop"], page_number=1)
find_similar_chunks(["macbook"])