PHP教程:高效合并与汇总对象数组中重复数据

聖光之護
发布: 2025-07-22 14:00:03
原创
703人浏览过

PHP教程:高效合并与汇总对象数组中重复数据

本教程将指导您如何在PHP中处理包含重复项的对象数组,特别是当您需要根据某个共同的键(如user_id)合并这些对象,并对其特定属性(如point)进行求和时。我们将通过逐步的代码示例,演示如何利用PHP的内置函数实现数据的分组、聚合和最终格式化,从而将原始的冗余数据转化为清晰、汇总的结果。

在数据处理和报表生成等场景中,我们经常会遇到包含重复条目的数据集。例如,一个用户可能在不同时间点产生了多条积分记录,而我们最终需要的是每个用户总的积分数。此时,就需要将这些重复的条目进行合并,并对相关的数值属性进行汇总。

问题描述与目标

假设我们有一个包含用户积分记录的JSON字符串,其结构如下:

[
  {
    "user_id": 2,
    "point": 2
  },
  {
    "user_id": 16,
    "point": 3
  },
  {
    "user_id": 2,
    "point": 10
  },
  {
    "user_id": 2,
    "point": 10
  }
]
登录后复制

我们的目标是根据user_id合并重复的记录,并将每个user_id对应的point值进行求和,最终得到如下结构的数据:

[
  {
    "user_id": 2,
    "point": 22
  },
  {
    "user_id": 16,
    "point": 3
  }
]
登录后复制

下面我们将分步骤实现这一目标。

立即学习PHP免费学习笔记(深入)”;

1. 数据准备:JSON字符串解码

首先,我们需要将输入的JSON格式数据转换为PHP可操作的关联数组。这可以通过json_decode()函数实现。

<?php

$jsonData = '[
  {
    "user_id": 2,
    "point": 2
  },
  {
    "user_id": 16,
    "point": 3
  },
  {
    "user_id": 2,
    "point": 10
  },
  {
    "user_id": 2,
    "point": 10
  }
]';

// 将JSON字符串解码为PHP关联数组
$users = json_decode($jsonData, true);

// 此时 $users 的结构为:
/*
Array
(
    [0] => Array ( [user_id] => 2 [point] => 2 )
    [1] => Array ( [user_id] => 16 [point] => 3 )
    [2] => Array ( [user_id] => 2 [point] => 10 )
    [3] => Array ( [user_id] => 2 [point] => 10 )
)
*/
?>
登录后复制

在json_decode()函数中,第二个参数设置为true表示将JSON对象解码为关联数组,而不是PHP对象。

2. 数据分组:根据指定键进行归类

接下来,我们需要根据user_id将所有记录进行分组。array_reduce()函数非常适合这种累积性操作,它可以遍历数组并将值累积到一个单一的结果中。

标书对比王
标书对比王

标书对比王是一款标书查重工具,支持多份投标文件两两相互比对,重复内容高亮标记,可快速定位重复内容原文所在位置,并可导出比对报告。

标书对比王 58
查看详情 标书对比王
<?php
// ... (接上一步的代码)

$groupedById = array_reduce($users, function ($accumulator, $user) {
  // 以 user_id 作为键,将对应的用户记录添加到累加器中
  $accumulator[$user['user_id']][] = $user;
  return $accumulator;
}, []); // 初始累加器为一个空数组

// 此时 $groupedById 的结构为:
/*
Array
(
    [2] => Array
        (
            [0] => Array ( [user_id] => 2 [point] => 2 )
            [1] => Array ( [user_id] => 2 [point] => 10 )
            [2] => Array ( [user_id] => 2 [point] => 10 )
        )
    [16] => Array
        (
            [0] => Array ( [user_id] => 16 [point] => 3 )
        )
)
*/
?>
登录后复制

array_reduce()的第一个参数是待处理的数组($users),第二个参数是一个回调函数,用于定义如何累积值。回调函数接收两个参数:$accumulator(累加器,存储中间结果)和$user(当前遍历到的数组元素)。第三个参数是累加器的初始值(这里是一个空数组[])。

3. 数据聚合:计算指定属性的总和

分组完成后,我们就可以遍历每个分组,并对其中所有记录的point属性进行求和。

<?php
// ... (接上一步的代码)

$result = [];
foreach ($groupedById as $userId => $userRecords) {
    // 使用 array_column 获取当前用户所有记录的 'point' 值,形成一个新数组
    $points = array_column($userRecords, 'point');
    // 使用 array_sum 对 'point' 值数组求和
    $sumPoints = array_sum($points);

    // 将汇总结果添加到最终结果数组中
    $result[] = ['user_id' => $userId, 'point' => $sumPoints];
}

// 此时 $result 的结构为:
/*
Array
(
    [0] => Array ( [user_id] => 2 [point] => 22 )
    [1] => Array ( [user_id] => 16 [point] => 3 )
)
*/
?>
登录后复制

这里,array_column($userRecords, 'point')是一个非常实用的函数,它可以从多维数组中提取指定键的所有值,形成一个一维数组。然后,array_sum()函数则可以方便地计算这个一维数组中所有数值的总和。

4. 格式化输出:编码为JSON字符串

最后,如果需要将结果以JSON格式输出,可以使用json_encode()函数。

<?php
// ... (接上一步的代码)

echo json_encode($result, JSON_PRETTY_PRINT); // JSON_PRETTY_PRINT 使输出更易读

// 输出结果:
/*
[
    {
        "user_id": 2,
        "point": 22
    },
    {
        "user_id": 16,
        "point": 3
    }
]
*/
?>
登录后复制

完整代码示例

将上述所有步骤整合起来,完整的PHP代码如下:

<?php

$jsonData = '[
  {
    "user_id": 2,
    "point": 2
  },
  {
    "user_id": 16,
    "point": 3
  },
  {
    "user_id": 2,
    "point": 10
  },
  {
    "user_id": 2,
    "point": 10
  }
]';

// 1. 将JSON字符串解码为PHP关联数组
$users = json_decode($jsonData, true);

// 2. 根据 user_id 进行分组
$groupedById = array_reduce($users, function ($accumulator, $user) {
  $accumulator[$user['user_id']][] = $user;
  return $accumulator;
}, []);

// 3. 计算每个分组的 point 总和并构建最终结果数组
$result = [];
foreach ($groupedById as $userId => $userRecords) {
    $sumPoints = array_sum(array_column($userRecords, 'point'));
    $result[] = ['user_id' => $userId, 'point' => $sumPoints];
}

// 4. 将最终结果编码为JSON字符串并输出
echo json_encode($result, JSON_PRETTY_PRINT);

?>
登录后复制

注意事项与总结

  • 数据类型一致性: 确保需要求和的属性(如point)在原始数据中是数值类型。如果它们是字符串,PHP的array_sum()函数会尝试将其转换为数字,但这可能导致意外结果或警告。
  • 灵活性: 这种分组和聚合的模式非常灵活。您可以轻松地修改回调函数,实现其他类型的聚合操作,例如计算平均值、计数、找出最大/最小值等。
  • 性能考量: 对于非常大的数据集,虽然上述方法使用了PHP的内置函数,这些函数通常经过优化,但在极端情况下,考虑使用更优化的数据结构或数据库查询来处理。对于一般的Web应用场景,这种方法是高效且易于理解的。
  • 错误处理: 在实际应用中,您应该添加错误处理机制,例如检查json_decode()是否成功解码,以防止因输入数据格式不正确而导致程序崩溃。

通过以上步骤,您可以有效地处理PHP中对象数组的合并与汇总需求,将分散的数据转化为有用的统计信息。

以上就是PHP教程:高效合并与汇总对象数组中重复数据的详细内容,更多请关注php中文网其它相关文章!

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号