在 Laravel ORM 中基于多列删除重复项

心靈之曲
发布: 2025-10-30 11:43:13
原创
253人浏览过

在 laravel orm 中基于多列删除重复项

本文介绍如何在 Laravel ORM 中基于多个列的值来删除重复记录。通过使用 SQL 的窗口函数 `ROW_NUMBER()`,可以为具有相同 `username` 和 `discipline` 列值的记录分配一个序号,然后选择序号为 1 的记录,从而实现去重的目的。同时,本文还提供了 Laravel 中的具体实现代码,方便读者参考。

在处理需要记录历史版本的数据时,可能会出现基于某些字段的重复数据。例如,用户可以重复提交比赛结果,系统需要保存历史结果以供回溯,但同时需要保证在特定时间段内,基于某些关键字段的结果是唯一的。 Laravel 的 ORM 提供的 distinct() 方法在处理多列去重时可能无法满足需求。本文将介绍一种使用原生 SQL 查询配合窗口函数 ROW_NUMBER() 来实现多列去重的方案。

使用 SQL 窗口函数 ROW_NUMBER() 去重

核心思路是使用 ROW_NUMBER() 函数为每个分组(基于需要去重的列)内的记录分配一个序号,然后只选择序号为 1 的记录。 以下是一个 SQL 示例,用于从 results 表中删除基于 username 和 discipline_one 到 discipline_six 列的重复记录,并保留 id 值最大的记录:

WITH cte AS (
    SELECT *, ROW_NUMBER() OVER
    (PARTITION BY username, discipline_one, discipline_two, discipline_three,
     discipline_four, discipline_five, discipline_six ORDER BY id DESC) rn
    FROM results
)

SELECT id, username, discipline_one, discipline_two, discipline_three,
     discipline_four, discipline_five, discipline_six, created_at, updated_at
FROM cte
WHERE rn = 1
登录后复制

这段 SQL 代码的逻辑如下:

  1. CTE (Common Table Expression) cte: 定义一个名为 cte 的公共表表达式。
  2. ROW_NUMBER() OVER (...): 这是窗口函数的核心。
    • PARTITION BY username, discipline_one, ..., discipline_six: 指定分区规则。 ROW_NUMBER() 会为每个具有相同 username 和 discipline 列值的记录集合分配一个序号。
    • ORDER BY id DESC: 指定排序规则。 在每个分区内,记录会按照 id 降序排列。 这意味着 id 最大的记录会被分配到序号 1。
    • rn: 将 ROW_NUMBER() 函数的结果(即序号)赋值给名为 rn 的列。
  3. SELECT ... FROM cte WHERE rn = 1: 从 cte 中选择 rn 等于 1 的记录。 由于 rn 是按照 id 降序排列的,因此这会选择每个分组中 id 最大的记录,从而实现去重的目的。

在 Laravel 中实现多列去重

在 Laravel 中,可以使用 DB::select() 方法执行原生 SQL 查询。 以下是一个示例,展示如何在 Laravel 中实现上述 SQL 查询:

降重鸟
降重鸟

要想效果好,就用降重鸟。AI改写智能降低AIGC率和重复率。

降重鸟113
查看详情 降重鸟
public static function waybackWhen($result)
{
    $username = $result->username;

    config()->set('database.connections.mysql.strict', false);
    DB::reconnect(); // Important as the existing connection if any would be in strict mode.

    $resultSet = DB::select("
        WITH cte AS (
            SELECT *, ROW_NUMBER() OVER
            (PARTITION BY username, discipline_one, discipline_two, discipline_three,
             discipline_four, discipline_five, discipline_six ORDER BY id DESC) rn
            FROM results
        )

        SELECT id, username, discipline_one, discipline_two, discipline_three,
             discipline_four, discipline_five, discipline_six, created_at, updated_at
        FROM cte
        WHERE rn = 1 AND username = ?
   ", [ $username ]);

    // Now changing back the strict ON.
    config()->set('database.connections.mysql.strict', true);
    DB::reconnect();

    return $resultSet;
}
登录后复制

这段代码的逻辑如下:

  1. config()->set('database.connections.mysql.strict', false);: 关闭 MySQL 的严格模式。 在某些情况下,MySQL 的严格模式可能会导致 SQL 查询失败。
  2. DB::reconnect();: 重新连接数据库。 这是为了确保连接使用新的配置。
  3. DB::select(...): 执行原生 SQL 查询。 SQL 查询与前面介绍的 SQL 示例相同。
  4. [ $username ]: 将 $username 变量作为参数传递给 SQL 查询,以防止 SQL 注入。
  5. config()->set('database.connections.mysql.strict', true);: 重新启用 MySQL 的严格模式。
  6. DB::reconnect();: 再次重新连接数据库,使配置生效。
  7. return $resultSet;: 返回查询结果。

注意事项:

  • 关闭和重新启用 MySQL 的严格模式可能不是必需的,具体取决于你的 MySQL 配置和 SQL 查询。 建议在测试环境中进行验证。
  • 使用参数化查询(例如,[ $username ])来防止 SQL 注入。
  • 确保 results 表中存在 username 和 discipline_one 到 discipline_six 列。

总结

本文介绍了一种使用 SQL 窗口函数 ROW_NUMBER() 在 Laravel 中实现多列去重的方案。 通过使用原生 SQL 查询,可以灵活地处理复杂的去重需求。 在实际应用中,可以根据具体情况调整 SQL 查询和 Laravel 代码。 使用此方法能够有效地清理重复数据,并保证数据的唯一性和准确性。

以上就是在 Laravel ORM 中基于多列删除重复项的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号