智能推荐算法怎么实现_基于协同过滤的推荐系统构建

星夢妙者

发布时间：2025-09-05 21:37:02

761人浏览过

来源于php中文网

原创

协同过滤通过用户或物品的互动关系预测偏好，分为基于用户和物品的两种方法，利用相似度计算进行推荐，但面临冷启动、数据稀疏性和流行度偏见等问题，需结合矩阵分解、时间因素或混合算法优化，常用准确率、召回率和NDCG等指标评估效果。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

智能推荐算法怎么实现_基于协同过滤的推荐系统构建

智能推荐算法，尤其是基于协同过滤的，本质上是通过分析用户和物品之间的互动关系，来预测用户可能喜欢什么。核心在于“协同”，即利用群体智慧来做个性化推荐。

解决方案

协同过滤主要分为两种：基于用户的协同过滤（User-Based CF）和基于物品的协同过滤（Item-Based CF）。

基于用户的协同过滤：

寻找相似用户： 计算用户之间的相似度。常用的相似度计算方法包括余弦相似度、皮尔逊相关系数等。例如，用户A和用户B都喜欢电影《泰坦尼克号》和《阿凡达》，那么他们可能就是相似用户。

import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

def user_based_cf(user_item_matrix, user_id, top_n=10):
    """
    基于用户的协同过滤推荐
    user_item_matrix: 用户-物品矩阵，行代表用户，列代表物品
    user_id: 目标用户ID
    top_n: 推荐的物品数量
    """
    # 计算用户相似度
    user_similarity = cosine_similarity(user_item_matrix)
    # 找到与目标用户最相似的用户
    similar_users = np.argsort(user_similarity[user_id])[::-1][1:] # 排除自己
    # 目标用户未评分的物品
    unrated_items = np.where(user_item_matrix[user_id] == 0)[0]
    # 预测评分
    predicted_scores = {}
    for item_id in unrated_items:
        score = 0
        similarity_sum = 0
        for similar_user in similar_users:
            if user_item_matrix[similar_user, item_id] > 0:
                score += user_similarity[user_id, similar_user] * user_item_matrix[similar_user, item_id]
                similarity_sum += user_similarity[user_id, similar_user]
        if similarity_sum > 0:
            predicted_scores[item_id] = score / similarity_sum
        else:
            predicted_scores[item_id] = 0 # 如果没有相似用户评分，则预测为0

    # 按照预测评分排序，推荐前N个物品
    sorted_items = sorted(predicted_scores.items(), key=lambda x: x[1], reverse=True)
    recommended_items = [item[0] for item in sorted_items[:top_n]]
    return recommended_items

# 示例
user_item_matrix = np.array([
    [5, 3, 0, 1, 0],
    [4, 0, 0, 1, 1],
    [1, 1, 0, 5, 0],
    [1, 0, 0, 4, 4],
    [0, 1, 5, 4, 0],
])

user_id = 0 # 假设要为用户0推荐
recommended_items = user_based_cf(user_item_matrix, user_id)
print(f"为用户 {user_id} 推荐的物品：{recommended_items}")

预测评分： 找到与目标用户最相似的N个用户，然后根据这些用户对未评分物品的评分，加权平均预测目标用户对该物品的评分。权重就是用户之间的相似度。
推荐： 选择预测评分最高的N个物品推荐给用户。

基于物品的协同过滤：

寻找相似物品： 计算物品之间的相似度。例如，如果很多用户同时购买了商品A和商品B，那么它们可能就是相似物品。

import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

def item_based_cf(user_item_matrix, item_id, top_n=10):
    """
    基于物品的协同过滤推荐
    user_item_matrix: 用户-物品矩阵，行代表用户，列代表物品
    item_id: 目标物品ID
    top_n: 推荐的物品数量
    """
    # 计算物品相似度
    item_similarity = cosine_similarity(user_item_matrix.T)

    # 找到与目标物品最相似的物品
    similar_items = np.argsort(item_similarity[item_id])[::-1][1:] # 排除自己

    # 获取所有用户的评分数据
    user_ratings = user_item_matrix

    # 预测用户对其他物品的评分
    predicted_scores = {}
    for user_id in range(user_ratings.shape[0]):
        score = 0
        similarity_sum = 0
        for similar_item in similar_items:
            if user_ratings[user_id, similar_item] > 0:
                score += item_similarity[item_id, similar_item] * user_ratings[user_id, similar_item]
                similarity_sum += item_similarity[item_id, similar_item]

        if similarity_sum > 0:
            predicted_scores[user_id] = score / similarity_sum
        else:
            predicted_scores[user_id] = 0

    # 找到评分最高的用户
    sorted_users = sorted(predicted_scores.items(), key=lambda x: x[1], reverse=True)

    # 推荐前N个用户
    recommended_users = [user[0] for user in sorted_users[:top_n]]
    return recommended_users

# 示例
user_item_matrix = np.array([
    [5, 3, 0, 1, 0],
    [4, 0, 0, 1, 1],
    [1, 1, 0, 5, 0],
    [1, 0, 0, 4, 4],
    [0, 1, 5, 4, 0],
])

item_id = 0 # 假设要为物品0推荐
recommended_users = item_based_cf(user_item_matrix, item_id)
print(f"为物品 {item_id} 推荐的用户：{recommended_users}")

预测评分： 如果用户喜欢了物品A，而物品B与物品A很相似，那么预测用户也会喜欢物品B。
推荐： 选择与用户已喜欢物品最相似的N个物品推荐给用户。

ImgGood
免费在线AI照片编辑器

下载

如何解决冷启动问题？

冷启动问题指的是新用户或新物品缺乏历史数据，难以进行推荐。

对于新用户： 可以采用基于内容的推荐（Content-Based Filtering）或基于人口统计信息的推荐（Demographic Filtering）。例如，询问用户感兴趣的类别，或者根据用户的年龄、性别等信息进行推荐。
对于新物品： 可以利用物品的描述信息，例如标签、关键词等，找到与该物品相似的物品，然后推荐给喜欢这些相似物品的用户。也可以采取“探索与利用”策略，随机将新物品推荐给一部分用户，收集反馈后再进行个性化推荐。

如何评估推荐系统的效果？

常用的评估指标包括：

准确率（Precision）： 推荐的物品中，用户真正喜欢的比例。
召回率（Recall）： 用户真正喜欢的物品中，有多少被推荐了。
F1值： 准确率和召回率的调和平均值。
NDCG（Normalized Discounted Cumulative Gain）： 考虑推荐列表中物品的相关性以及位置的指标。

如何优化协同过滤算法？

矩阵分解： 将用户-物品矩阵分解为两个低维矩阵，可以减少数据稀疏性，提高推荐准确率。常用的矩阵分解方法包括SVD、ALS等。
引入时间因素： 用户的兴趣会随着时间变化，因此在计算相似度时，可以考虑时间因素。
结合多种推荐算法： 将协同过滤与其他推荐算法结合，例如基于内容的推荐、基于知识的推荐等，可以提高推荐效果。

协同过滤的局限性是什么？

数据稀疏性： 用户-物品矩阵通常非常稀疏，导致难以找到相似用户或物品。
冷启动问题： 对于新用户和新物品，难以进行推荐。
可扩展性： 当用户和物品数量非常大时，计算相似度的复杂度会很高。
流行度偏见： 协同过滤容易推荐热门物品，而忽略长尾物品。

总而言之，协同过滤是一种简单而有效的推荐算法，但需要根据实际情况进行优化和改进。理解其原理，并结合业务场景灵活运用，才能构建出优秀的推荐系统。

ChatGPT Canvas模式无法开启_点击左下角模型切换至支持Canvas的版本

DeepSeek生成的回答不完整被切断_在设置中增加回复的最大Token长度限制

豆包AI写代码建议不符合PEP8规范_在指令中要求AI按照特定语言规范格式化

豆包AI智能体无法读取外部网页_确保网页链接无防火墙限制并重新发送

ChatGPT生成的JS代码跨域报错_要求其提供CORS解决方法或后端代理方案

相关专题

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

400

2023.08.14

Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践，涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC（Unary/Server/Client/Bidirectional）、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例，帮助学习者掌握使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系，适用于微服务与内部系统通信场景。

2026.01.15

公务员递补名单公布时间公务员递补要求

公务员递补名单公布时间不固定，通常在面试前，由招录单位（如国家知识产权局、海关等）发布，依据是原入围考生放弃资格，会按笔试成绩从高到低递补，递补考生需按公告要求限时确认并提交材料，及时参加面试/体检等后续环节。要求核心是按招录单位公告及时响应、提交材料（确认书、资格复审材料）并准时参加面试。

2026.01.15

公务员调剂条件 2026调剂公告时间

(一)符合拟调剂职位所要求的资格条件。 (二)公共科目笔试成绩同时达到拟调剂职位和原报考职位的合格分数线，且考试类别相同。拟调剂职位设置了专业科目笔试条件的，专业科目笔试成绩还须同时达到合格分数线，且考试类别相同。 (三)未进入原报考职位面试人员名单。

2026.01.15

国考成绩查询入口国考分数公布时间2026

笔试成绩查询入口已开通，考生可登录国家公务员局中央机关及其直属机构2026年度考试录用公务员专题网站http://bm.scs.gov.cn/pp/gkweb/core/web/ui/business/examResult/written_result.html，查询笔试成绩和合格分数线，点击“笔试成绩查询”按钮，凭借身份证及准考证进行查询。

2026.01.15