基本能力
产品定位
txtai 是一个全功能的嵌入数据库,专注于语义搜索、大型语言模型(LLM)编排和语言模型工作流。
核心功能
- 向量搜索:支持 SQL、对象存储、主题建模、图分析和多模态索引。
- 嵌入创建:为文本、文档、音频、图像和视频创建嵌入。
- 管道:由语言模型驱动的管道,可运行 LLM 提示、问答、标签、转录、翻译、摘要等。
- 工作流:将管道连接在一起并聚合业务逻辑。
- 代理:智能连接嵌入、管道、工作流和其他代理,以自主解决复杂问题。
- API:提供 Web 和模型上下文协议(MCP)API,支持 JavaScript、Java、Rust 和 Go 的绑定。
- 本地或云端运行:可在本地运行,也可通过容器编排扩展。
适用场景
- 语义搜索:构建语义/相似性/向量/神经搜索应用。
- LLM 编排:自主代理、检索增强生成(RAG)、与数据聊天、管道和工作流。
- 语言模型工作流:连接语言模型以构建智能应用。
工具列表
- rag:检索增强生成(RAG)应用。
- ragdata:为 RAG 构建知识库。
- paperai:医学/科学论文的语义搜索和工作流。
- annotateai:使用 LLM 自动注释论文。
常见问题解答
- 如何安装:通过 pip 安装
pip install txtai
。 - 依赖:Python 3.10+、Hugging Face Transformers、Sentence Transformers 和 FastAPI。
- 模型推荐:提供了嵌入、图像标题、标签、LLM、摘要、文本到语音、转录和翻译的推荐模型。
使用教程
使用依赖
确保已安装 Python 3.10+,并建议使用虚拟环境。
bash
python -m venv txtai-env
source txtai-env/bin/activate
安装教程
通过 pip 安装 txtai:
bash
pip install txtai
调试方式
启动 API 服务:
bash
CONFIG=app.yml uvicorn "txtai.api:app"
测试搜索功能:
bash
curl -X GET "http://localhost:8000/search?query=positive"