基本能力
产品定位
mcp-aoai-web-browsing 是一个用于现代 Web 应用程序自动化测试和交互的工具,结合了 Azure OpenAI 的能力,提供高效的浏览器自动化解决方案。
核心功能
- MCP 服务器实现:基于 FastMCP 构建,支持与 Azure OpenAI 的集成。
- 浏览器自动化:使用 Playwright 框架进行端到端测试和 Web 应用程序交互。
- MCP-LLM Bridge:将 MCP 服务器响应转换为 OpenAI 函数调用格式,实现与 LLMs 的通信。
- 工具描述:支持工具描述机制,类似于 LLMs 中的函数调用。
适用场景
- Web 应用程序自动化测试:通过 Playwright 进行端到端测试。
- 浏览器自动化:自动化导航、点击、表单填写等操作。
- 与 LLMs 集成:通过 MCP-LLM Bridge 实现与 OpenAI 兼容的 LLMs 的交互。
工具列表
- playwright_navigate:导航到指定 URL,支持超时和等待条件设置。
常见问题解答
- 依赖管理:推荐使用
uv
进行 Python 库管理,其他工具如pip
和poetry
尚未完全支持。 - 调试:可以使用 Visual Code 的 Python 调试器进行调试。
使用教程
使用依赖
-
安装
uv
:bash
pip install uv
uv sync
安装教程
-
重命名
.env.template
为.env
,并填写 Azure OpenAI 的相关配置:bash
AZURE_OPEN_AI_ENDPOINT=
AZURE_OPEN_AI_API_KEY=
AZURE_OPEN_AI_DEPLOYMENT_MODEL=
AZURE_OPEN_AI_API_VERSION= -
执行
python chatgui.py
启动客户端。
调试方式
- 使用 Visual Code 的 Python 调试器:
- 配置
.vscode/launch.json
文件以启动调试器。 -
终止 Python 进程:
cmd
taskkill /IM python.exe /F