
在数据处理中,我们经常会遇到这样的场景:多组相关数据以并行数组的形式存储,例如,一个数组存储状态($statuses),另一个数组存储交易数量($of_tranxs),再有其他数组存储收入($revs)和毛利润($mgps)。当需要根据某个分类数组(如$statuses)对其他数值型数组进行分组并求和时,如何高效且优雅地实现这一目标,是php开发者常面临的问题。
例如,给定以下数据:
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT']; $of_tranxs = [2, 1, 2]; $revs = [3, 1, 3]; $mgps = [4, 1, 4];
我们期望得到如下按状态分组并求和的结果:
array( 'status' => ['PROSPECT', 'BACKLOG'], 'of_tranx' => [4, 1], // PROSPECT: 2+2=4, BACKLOG: 1 'rev' => [6, 1], // PROSPECT: 3+3=6, BACKLOG: 1 'mgp' => [8, 1] // PROSPECT: 4+4=8, BACKLOG: 1 )
下面将介绍几种实现此目标的方法。
这种方法的核心思想是在遍历过程中,将重复项的数值累加到第一次出现的项中,然后移除重复项,最后对所有数组进行重新索引。
立即学习“PHP免费学习笔记(深入)”;
<?php
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT'];
$of_tranxs = [2, 1, 2];
$revs = [3, 1, 3];
$mgps = [4, 1, 4];
$found = []; // 存储状态第一次出现的索引
foreach ($statuses as $index => $status) {
if (!isset($found[$status])) {
// 第一次遇到该状态,记录其索引
$found[$status] = $index;
continue;
}
// 状态已存在,将当前值累加到第一次出现的位置
$of_tranxs[$found[$status]] += $of_tranxs[$index];
$revs[$found[$status]] += $revs[$index];
$mgps[$found[$status]] += $mgps[$index];
// 删除当前重复项
unset($statuses[$index], $of_tranxs[$index], $revs[$index], $mgps[$index]);
}
// 重新索引所有数组以获得连续的键
$result = [
'status' => array_values($statuses),
'of_tranx' => array_values($of_tranxs),
'rev' => array_values($revs),
'mgp' => array_values($mgps)
];
echo "<pre>";
var_export($result);
echo "</pre>";
?>此方法通过构建一个新的结果数组来存储聚合后的数据,同时使用一个映射来追踪每个状态在新数组中的对应索引。
<?php
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT'];
$of_tranxs = [2, 1, 2];
$revs = [3, 1, 3];
$mgps = [4, 1, 4];
$result = [];
$newIndex = []; // 映射状态到新结果数组的索引
$i = 0; // 新结果数组的当前索引
foreach ($statuses as $oldIndex => $status) {
if (!isset($newIndex[$status])) {
// 第一次遇到该状态,添加到新结果数组
$newIndex[$status] = $i++; // 记录索引并递增
$result['status'][] = $status;
$result['of_tranx'][] = $of_tranxs[$oldIndex];
$result['rev'][] = $revs[$oldIndex];
$result['mgp'][] = $mgps[$oldIndex];
} else {
// 状态已存在,累加到新结果数组的对应位置
$targetIndex = $newIndex[$status];
$result['of_tranx'][$targetIndex] += $of_tranxs[$oldIndex];
$result['rev'][$targetIndex] += $revs[$oldIndex];
$result['mgp'][$targetIndex] += $mgps[$oldIndex];
}
}
echo "<pre>";
var_export($result);
echo "</pre>";
?>这种方法旨在生成一个更结构化的结果,即一个包含多个关联数组(或对象)的数组,每个关联数组代表一个分组后的记录。通过使用引用,可以避免额外的查找和重新索引操作。
<?php
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT'];
$of_tranxs = [2, 1, 2];
$revs = [3, 1, 3];
$mgps = [4, 1, 4];
$result = [];
$ref = []; // 存储每个状态的聚合数据(关联数组),并作为引用源
foreach ($statuses as $i => $status) {
if (!isset($ref[$status])) {
// 第一次遇到该状态,创建新的聚合数据项
$ref[$status] = [
'status' => $status,
'of_tranx' => $of_tranxs[$i],
'rev' => $revs[$i],
'mgp' => $mgps[$i],
];
// 将该聚合数据项的引用添加到结果数组
$result[] = &$ref[$status];
} else {
// 状态已存在,直接通过引用累加值
$ref[$status]['of_tranx'] += $of_tranxs[$i];
$ref[$status]['rev'] += $revs[$i];
$ref[$status]['mgp'] += $mgps[$i];
}
}
echo "<pre>";
var_export($result);
echo "</pre>";
?>在PHP 7.4及更高版本中,这些方法都表现良好。对于非常大的数据集,虽然这些循环方法通常效率很高,但如果性能成为瓶颈,可能需要考虑使用数据库的GROUP BY操作或更底层的扩展。
对多列数组数据进行分组和求和是数据处理中的常见任务。本文介绍了三种在PHP中实现这一目标的有效策略:原地修改与重新索引、构建新数组并维护索引映射,以及利用引用聚合数据至结构化数组。每种方法都有其独特的优点和适用场景,开发者可以根据具体的需求和期望的输出格式,选择最适合的方案来高效地处理数据。理解这些技巧将有助于提升PHP应用程序的数据处理能力和代码的灵活性。
以上就是PHP中多列数组按指定键分组并聚合求和的实用技巧的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号