
在php开发中,我们经常会遇到需要处理多组相关联的列式数据的情况。例如,有多个数组分别存储了状态、交易数量、收入和毛利润,并且这些数组的索引是对应的。我们的目标是根据其中一个数组(例如状态数组)进行分组,并将其他相关联的数值型数组的数据进行求和聚合。
考虑以下场景中的数据结构:
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT']; $of_tranxs = [2, 1, 2]; $revs = [3, 1, 3]; $mgps = [4, 1, 4];
我们期望的输出是一个新的结构,其中每个状态只出现一次,并且对应的交易数量、收入和毛利润都已按状态聚合求和:
array( 'status' => ['PROSPECT', 'BACKLOG'], 'of_tranx' => [4, 1], // 2 + 2 = 4 'rev' => [6, 1], // 3 + 3 = 6 'mgp' => [8, 1] // 4 + 4 = 8 )
下面将介绍几种在PHP中实现这种分组求和的有效方法。
这种方法的核心思想是在遍历过程中,识别重复的状态。当发现重复状态时,将其对应的数值累加到第一次出现该状态的原始位置上,然后将重复项从所有原始数组中移除。最后,对所有数组进行重新索引以去除空洞。
立即学习“PHP免费学习笔记(深入)”;
实现步骤:
示例代码:
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT'];
$of_tranxs = [2, 1, 2];
$revs = [3, 1, 3];
$mgps = [4, 1, 4];
$found = [];
foreach ($statuses as $index => $status) {
if (!isset($found[$status])) {
// 第一次遇到该状态,记录其索引
$found[$status] = $index;
continue;
}
// 状态重复,累加到第一次出现的位置
$of_tranxs[$found[$status]] += $of_tranxs[$index];
$revs[$found[$status]] += $revs[$index];
$mgps[$found[$status]] += $mgps[$index];
// 移除当前重复项
unset($statuses[$index], $of_tranxs[$index], $revs[$index], $mgps[$index]);
}
$result = [
'status' => array_values($statuses),
'of_tranx' => array_values($of_tranxs),
'rev' => array_values($revs),
'mgp' => array_values($mgps)
];
var_export($result);优点:
缺点:
这种方法通过构建一个新的结果数组来存储聚合后的数据,同时使用一个辅助数组来映射每个状态在新结果数组中的索引位置。这避免了对原始数组的修改和复杂的重新索引。
实现步骤:
示例代码:
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT'];
$of_tranxs = [2, 1, 2];
$revs = [3, 1, 3];
$mgps = [4, 1, 4];
$result = [];
$newIndex = []; // 存储状态到新结果数组索引的映射
$i = 0; // 新结果数组的索引计数器
foreach ($statuses as $oldIndex => $status) {
if (!isset($newIndex[$status])) {
// 第一次遇到该状态,添加到结果数组并记录新索引
$newIndex[$status] = $i++;
$result['status'][] = $status;
$result['of_tranx'][] = $of_tranxs[$oldIndex];
$result['rev'][] = $revs[$oldIndex];
$result['mgp'][] = $mgps[$oldIndex];
} else {
// 状态重复,累加到结果数组的对应位置
$targetNewIndex = $newIndex[$status];
$result['of_tranx'][$targetNewIndex] += $of_tranxs[$oldIndex];
$result['rev'][$targetNewIndex] += $revs[$oldIndex];
$result['mgp'][$targetNewIndex] += $mgps[$oldIndex];
}
}
var_export($result);优点:
缺点:
此方法结合了前两种方法的优点,它通过构建一个包含引用变量的中间数组来直接操作最终结果,从而避免了 array_values() 的调用,并且在语义上更清晰地表示了聚合过程。
实现步骤:
示例代码:
$statuses = ['PROSPECT', 'BACKLOG', 'PROSPECT'];
$of_tranxs = [2, 1, 2];
$revs = [3, 1, 3];
$mgps = [4, 1, 4];
$result = [];
$ref = []; // 存储状态到聚合数据块的引用
foreach ($statuses as $i => $status) {
if (!isset($ref[$status])) {
// 第一次遇到该状态,创建数据块并存储引用
$ref[$status] = [
'status' => $status,
'of_tranx' => $of_tranxs[$i],
'rev' => $revs[$i],
'mgp' => $mgps[$i],
];
$result[] = &$ref[$status]; // 将引用添加到结果数组
} else {
// 状态重复,通过引用直接累加
$ref[$status]['of_tranx'] += $of_tranxs[$i];
$ref[$status]['rev'] += $revs[$i];
$ref[$status]['mgp'] += $mgps[$i];
}
}
// 注意:此方法输出的 $result 结构与前两种略有不同,
// 它是一个索引数组,每个元素是一个包含 'status', 'of_tranx', 'rev', 'mgp' 的关联数组。
// 如果需要前两种方法的列式输出,需要再做一次转换。
// 例如:
$final_result = [
'status' => array_column($result, 'status'),
'of_tranx' => array_column($result, 'of_tranx'),
'rev' => array_column($result, 'rev'),
'mgp' => array_column($result, 'mgp'),
];
var_export($final_result);优点:
缺点:
以上三种方法都能有效解决根据一个数组对多个列式数据进行分组求和的问题。在选择具体方法时,可以根据以下因素进行考量:
建议在实际开发中,根据项目的具体需求和团队的代码风格,选择最适合的实现方案。对于大多数情况,方法二(构建新结果数组与索引映射)或方法三(使用引用)都是既高效又易于维护的良好选择。
以上就是PHP:高效处理多数组列式数据分组聚合的教程的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号