DeepSeek API如何配合向量数据库使用_将文本向量化后存入Milvus再进行检索

P粉602998670

发布时间：2026-01-14 13:36:02

755人浏览过

来源于php中文网

原创

需完成向量获取、维度对齐、集合创建、数据写入与查询调用：一、配置DeepSeek API获取文本嵌入向量；二、启动Milvus并验证连接；三、创建匹配维度的集合；四、批量插入向量及元数据；五、执行相似性搜索。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

deepseek api如何配合向量数据库使用_将文本向量化后存入milvus再进行检索

如果您使用DeepSeek API生成文本向量，并希望将这些向量持久化存储至Milvus以支持高效相似性检索，则需完成向量获取、维度对齐、集合创建、数据写入与查询调用等关键环节。以下是实现该流程的具体操作路径：

一、配置DeepSeek API并获取文本嵌入向量

该步骤旨在通过DeepSeek提供的嵌入接口，将原始文本转换为固定维度的稠密向量。需确保API服务可用、认证凭证正确，且返回向量格式符合Milvus字段定义要求。

1、在终端中设置环境变量：export OPENAI_API_KEY='your_deepseek_api_key'

2、调用本地或远程DeepSeek嵌入服务（如Ollama托管的deepseek-r1模型）：

3、向http://localhost:11434/api/embeddings发送POST请求，携带{"model":"deepseek-r1:1.5b","input":"待向量化的文本"}参数

4、解析响应体，提取embedding字段值，确认其为长度一致的浮点数列表（例如768维）

二、启动Milvus服务并验证连接可用性

此步骤确保Milvus实例处于运行状态，客户端可通过gRPC或HTTP协议与其通信。若使用Docker部署，需检查容器健康状态及端口映射是否生效。

1、执行docker ps | grep milvus，确认milvus-standalone容器正在运行

2、访问http://localhost:19530/healthz，返回{"status":"healthy"}表示服务就绪

3、在Python环境中安装Milvus SDK：pip install pymilvus==2.4.10

4、使用pymilvus connections.connect("default", host="localhost", port="19530")建立连接

三、创建匹配维度的Milvus集合

集合（Collection）是Milvus中向量数据的逻辑容器，其schema必须与DeepSeek输出向量维度严格一致；否则插入或查询将失败。

1、定义字段：包含主键id（int64）、向量字段vector（float_vector）、可选元数据字段如text（varchar）

2、设定向量维度参数：dim参数必须等于DeepSeek嵌入向量的实际长度（如768）

NeuralText

Neural Text是一个使用机器学习自动生成文本的平台

下载

3、执行Collection.create()方法创建集合，例如命名为deepseek_docs

4、为向量字段构建索引，推荐初始配置：{"index_type": "IVF_FLAT", "metric_type": "COSINE", "params": {"nlist": 128}}

四、批量插入DeepSeek生成的向量及关联元数据

该步骤将文本内容、唯一标识符与对应向量三元组封装为结构化记录，导入Milvus集合。需注意批次大小控制以避免内存溢出或超时。

1、组织数据列表：entities = [ids, vectors, texts]，其中vectors为二维列表，每行对应一个向量

2、调用collection.insert(entities)提交数据，返回插入结果对象

3、执行collection.flush()强制落盘，确保数据立即可查

4、验证插入数量：collection.num_entities应与预期条数一致

五、基于新查询文本执行向量相似性搜索

检索阶段复用相同DeepSeek嵌入流程，将用户输入转化为向量后，在Milvus中执行近似最近邻（ANN）查找，返回Top-K最相似记录。

1、对查询文本调用DeepSeek嵌入接口，获取单条向量query_vector

2、构造搜索参数：search_params = {"metric_type": "COSINE", "params": {"nprobe": 10}}

3、执行collection.search([query_vector], "vector", search_params, limit=5, output_fields=["text"])

4、遍历results[0]，提取每个命中项的entity.text与distance字段

使用Python和神经网络进行图像识别：完整指南

Python故事生成器：利用随机性创造独特叙事

TuriX-CUA— 开源AI桌面Agent，自动进行屏幕识别和操作

ArcGIS Python脚本：高效处理GPS数据，提升GIS分析

LiveKit与Python：免费打造 Jarvis AI 语音助手

AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型，支持联网搜索。

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：ChatGPT对话框输入文字非常卡顿_关闭浏览器硬件加速功能或清理历史记录下一篇：暂无

作者最新文章

Golang并发编程怎么入门_Go语言并发学习路线详解

2026-01-14 13:38

PPT交互式图表制作教程如何在PowerPoint中实现动态图表【技巧】

2026-01-14 13:39

Yandex俄罗斯搜索引擎官网入口 Yandex在线使用最新地址

2026-01-14 13:39

交管12123网页版登录入口交管12123网页版在线查成绩

2026-01-14 13:41

css 边框样式不同导致尺寸不统一怎么办_border 与 box-sizing 调整

2026-01-14 13:45

excel交互图表如何制作_excel交互图表设置步骤

2026-01-14 13:45

在Java中一个类可以实现多个接口吗_Java多接口机制解析

2026-01-14 13:46

电子税务局官方网站入口个人电子税务局网页版登录

2026-01-14 13:46

css网页多行文本在小屏幕溢出怎么办_使用word break和media query处理

2026-01-14 13:46

css 想在元素前后插入特殊符号怎么办_利用 ::before 和 ::after 设置内容

2026-01-14 13:47

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

751

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

636

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

618

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

706

2023.08.11