onerec 是快手开发的全新端到端生成式推荐系统。该系统基于编码器-解码器结构,引入稀疏 mixture-of-experts(moe)机制,以增强模型容量并维持高效的计算效率。与传统级联式推荐系统不同,onerec 采用会话式生成策略,能够输出上下文一致的推荐内容,并通过迭代偏好对齐模块结合直接偏好优化(dpo)来进一步提升推荐质量。在训练流程中,onerec 将多模态信息量化为 token 序列输入模型,采用两阶段训练方式:首先进行基础 item 预测任务训练,随后利用 dpo 进行偏好对齐。
OneRec的核心功能
-
端到端生成式架构:OneRec 使用编码器-解码器结构,将推荐问题转化为序列生成任务。编码器整合用户的历史行为数据,解码器则借助稀疏混合专家(MoE)结构逐步生成可能感兴趣的视频内容。
-
会话式生成方法:区别于传统的单点预测方式,OneRec 创新性地提出会话式生成机制,可生成完整的推荐列表,从而更有效地捕捉上下文关系。
-
实验验证与性能提升:在快手平台进行的在线 A/B 测试显示,OneRec 带来了 1.6% 的观看时长增长,在多项指标上优于传统方法。
OneRec的技术机制
-
编码器-解码器结构:OneRec 采用 Encoder-Decoder 框架,把推荐任务建模为序列生成问题。编码器提取用户全生命周期行为特征,解码器使用稀疏 MoE 架构逐个生成候选视频。该方式能更好地追踪用户兴趣演变,并输出连贯的推荐结果。
-
多模态分词机制:OneRec 首创协同感知的多模态分词方案,融合视频标题、标签、语音识别、图像理解等多源信息,转换为分层语义 ID,实现更精细的兴趣建模。
-
强化学习偏好对齐:系统引入奖励驱动的偏好对齐机制,通过强化学习提升模型表现。模型综合运用偏好奖励、格式奖励和业务目标构建复合奖励体系,优化生成推荐序列。有助于更准确把握用户的深层偏好,提高推荐相关性。
-
性能优化设计:通过对架构的重构,大幅减少关键算子数量,并借助稀疏 MoE 扩展模型规模,显著提高了计算效率。经过训练与推理优化,系统实现了更高的浮点运算利用率(MFU),从而提升了整体算力效率。
OneRec的项目链接
OneRec的应用领域
-
短视频推荐:在快手短视频主场景中,OneRec 承担约 25% 的请求流量(QPS)。依托生成式结构与偏好对齐机制,在用户停留时间、点赞、评论、关注等互动指标方面均有明显提升。
-
本地生活服务:在本地生活场景中,OneRec 同样展现出卓越效果。AB 实验结果显示,推动交易总额(GMV)增长 21.01%,订单量提升 17.89%,购买用户数增加 18.58%,新增用户获取效率提升 23.02%。
-
直播内容匹配:系统被应用于直播推荐场景,通过动态生成推荐序列,精准匹配用户实时兴趣,显著提升用户参与度与互动频率。
-
广告投放:在广告推荐方面,OneRec 的生成式结构可根据用户行为动态生成广告推荐内容,有效提高广告点击率与转化效果。
以上就是OneRec— 快手推出的端到端生成式推荐系统的详细内容,更多请关注php中文网其它相关文章!