0

0

postgresql推荐系统如何建库_postgresql向量与特征存储

冷漠man

冷漠man

发布时间:2025-11-25 16:21:06

|

150人浏览过

|

来源于php中文网

原创

PostgreSQL通过pgvector扩展支持向量存储与相似性检索,结合用户、物品、行为及特征表设计,可高效实现推荐系统。核心包括:1. 建立users、items、interactions、user_features、item_features等表,合理组织结构化与向量数据;2. 使用pgvector存储embedding并创建IVF索引加速相似度查询;3. 利用JSONB支持稀疏特征更新,结合分区与TTL策略优化性能;4. 在线实时检索近似物品,离线更新特征向量,支撑协同过滤与混合推荐。该方案适用于中小规模场景,降低架构复杂度。

postgresql推荐系统如何建库_postgresql向量与特征存储

PostgreSQL 在构建推荐系统时,不仅能存储传统用户和物品信息,还能高效处理向量与特征数据,尤其在引入向量扩展后,具备了近实时相似性检索能力。合理建库结构和数据组织方式是实现高性能推荐的关键。

1. 数据库设计:核心表结构

推荐系统的数据库通常包含以下几类核心表:

用户表(users):存储用户基础信息和静态特征。

字段建议:user_id(主键)、age、gender、region、注册时间、活跃等级等。

物品表(items):存储推荐内容元数据。

字段建议:item_id(主键)、title、category、tags、发布时间、热度评分等。

行为表(interactions):记录用户与物品的交互行为。

字段建议:user_id、item_id、action_type(如点击、收藏、购买)、timestamp、score(隐式反馈权重)。建议按时间分区提升查询效率。

用户特征表(user_features):存储用户动态 Embedding 向量或特征向量。

字段建议:user_id(外键)、embedding(向量字段)、updated_at。用于协同过滤或深度模型的输入。

物品特征表(item_features):存储物品的 Embedding 或多模态特征。

字段建议:item_id(外键)、text_embedding、image_embedding、category_vector、updated_at。

2. 向量存储与相似性检索

PostgreSQL 通过 pgvector 扩展支持向量存储与余弦相似度、欧氏距离等计算,适合做基于内容或协同过滤的近似最近邻搜索。

● 安装 pgvector:

在支持的 PostgreSQL 版本中安装扩展:
CREATE EXTENSION IF NOT EXISTS vector;

● 定义向量字段:

例如在 item_features 表中添加文本嵌入:

ALTER TABLE item_features ADD COLUMN text_embedding vector(768);

其中 768 是常见 BERT 类模型输出维度。

● 创建索引加速向量查询:

使用 IVF(Inverted File Index)索引提升检索速度:

Lessie AI
Lessie AI

一款定位为「People Search AI Agent」的AI搜索智能体

下载
CREATE INDEX ON item_features USING ivfflat (text_embedding vector_cosine_ops) WITH (lists = 100); ● 查询最相似物品:

例如查找与某向量最相似的 10 个物品:

SELECT item_id FROM item_features ORDER BY text_embedding '[0.1, 0.5, ...]' LIMIT 10;

3. 特征数据组织建议

为支持灵活的推荐策略,特征存储需兼顾结构化与高维向量数据。

● 统一特征服务接口表:

可设计 feature_store 表,统一管理各类实体的特征:

entity_type('user'/'item')、entity_id、features_json、embedding_vector、version、updated_at

适合多场景复用,便于离线更新与在线读取。

● 支持部分更新:

使用 JSONB 字段存储稀疏特征,如用户兴趣标签权重:

{"interests": {"sports": 0.9, "tech": 0.6}, "last_login_days_ago": 3} ● 分区与 TTL 策略:

行为表按天或月分区,定期归档旧数据;特征表根据更新频率设置缓存过期机制。

4. 推荐流程中的应用示例

典型协同过滤流程:

● 离线阶段:

通过模型生成用户和物品的 Embedding,写入 user_features 和 item_features 表。

● 实时阶段:

当用户访问时,查出其最新 embedding,通过向量相似度检索 top-K 相似物品,结合热度或多样性重排后返回。

● 混合推荐:

结合 content-based(文本向量)与 collaborative filtering(用户行为向量),加权融合结果。

基本上就这些。PostgreSQL 配合 pgvector 能力已足够支撑中小规模推荐系统的向量存储与检索需求,无需立即引入复杂向量数据库,降低架构复杂度。

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

738

2023.08.22

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1018

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

63

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

407

2025.12.29

postgresql常用命令
postgresql常用命令

postgresql常用命令psql、createdb、dropdb、createuser、dropuser、l、c、dt、d table_name、du、i file_name、e和q等。本专题为大家提供postgresql相关的文章、下载、课程内容,供大家免费下载体验。

158

2023.10.10

常用的数据库软件
常用的数据库软件

常用的数据库软件有MySQL、Oracle、SQL Server、PostgreSQL、MongoDB、Redis、Cassandra、Hadoop、Spark和Amazon DynamoDB。更多关于数据库软件的内容详情请看本专题下面的文章。php中文网欢迎大家前来学习。

970

2023.11.02

postgresql常用命令有哪些
postgresql常用命令有哪些

postgresql常用命令psql、createdb、dropdb、createuser、dropuser、l、c、dt、d table_name、du、i file_name、e和q等。更详细的postgresql常用命令,大家可以访问下面的文章。

196

2023.11.16

postgresql常用命令介绍
postgresql常用命令介绍

postgresql常用命令有l、d、d5、di、ds、dv、df、dn、db、dg、dp、c、pset、show search_path、ALTER TABLE、INSERT INTO、UPDATE、DELETE FROM、SELECT等。想了解更多postgresql的相关内容,可以阅读本专题下面的文章。

267

2023.11.20

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.3万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号