
1. 问题描述
在处理来自某些系统(如 virsh domstats 命令输出)的数据时,我们常会遇到一种扁平化的数组结构。这种数组中的每个元素通常包含一个 name 字段和一个 value 字段,其中 name 字段采用点分隔的字符串形式来表示数据的层次结构。
原始数据示例:
$inputArray = [
[ 'name' => 'block.0.name', 'value' => 'vda' ],
[ 'name' => 'block.0.backingIndex', 'value' => 2 ],
[ 'name' => 'block.0.rd.reqs', 'value' => 248907 ],
// ... 更多 block.0 的数据
[ 'name' => 'block.1.name', 'value' => 'hda' ],
[ 'name' => 'block.1.backingIndex', 'value' => 30 ],
// ... 更多 block.1 的数据
[ 'name' => 'vcpu.0.state', 'value' => 1 ],
[ 'name' => 'vcpu.1.time', 'value' => 936409070000000 ],
// ... 更多 vcpu 的数据
[ 'name' => 'balloon.current', 'value' => 16777216 ],
[ 'name' => 'balloon.maximum', 'value' => 16777216 ],
// ... 更多 balloon 的数据
];我们希望将这种扁平的结构转换为一个更具可读性和逻辑性的多维数组,其结构能够反映 name 字段中隐含的层次关系。
期望输出结构示例:
$outputArray = [
'blocks' => [
'block0' => [
'backingIndex' => 2,
'rd.reqs' => 248907,
// ...
],
'block1' => [
'backingIndex' => 30,
'rd.reqs' => 2871,
// ...
],
],
'vcpus' => [
'vcpu0' => [
'state' => 1,
'time' => 963654400000000,
// ...
],
// ...
],
'balloons' => [
'balloon' => [ // 注意这里没有数字索引
'current' => 16777216,
'maximum' => 16777216,
// ...
],
],
];可以看到,转换的关键在于:
立即学习“PHP免费学习笔记(深入)”;
- 根据 name 的第一个部分(如 block, vcpu, balloon)创建顶层键,并通常在其后添加 's' 形成复数形式。
- 根据 name 的前一到两部分创建第二层键,例如 block.0 转换为 block0,而 balloon 则直接作为 balloon。
- name 字段中剩余的部分作为第三层键(或更深层次的键),并将其对应的值赋给该键。
- 需要特别处理 name 字段本身,在某些情况下它可能不应作为最终输出数组中的一个键。
2. 解决方案:动态构建多维数组
解决此问题的核心思想是遍历原始数组,对每个元素的 name 字符串进行解析,并根据解析结果动态地构建目标多维数组的层次结构。我们将使用 PHP 的字符串和数组处理函数来实现这一目标。
2.1 核心逻辑
- 初始化结果数组: 创建一个空的 $result 数组用于存储转换后的数据。
- 遍历输入数组: 逐一处理原始数组中的每个 name 和 value 对。
- 拆分 name 字符串: 使用 explode('.', $name) 将点分隔的 name 字符串拆分成多个部分。
- 确定父级键 (parentKey): 通常是 name 字符串的第一个部分加上 's'(例如 block -> blocks)。
-
确定子级键 (childKey): 这是最关键的一步,需要根据 name 的第二个部分是否为数字来决定。
- 如果第二个部分是数字(例如 block.0),则将第一个部分和数字部分拼接起来(例如 block0),并从 $parts 数组中移除这两部分。
- 如果第二个部分不是数字(例如 balloon.current),则只使用第一个部分(例如 balloon),并从 $parts 数组中移除这一部分。
- array_splice() 函数在这里非常有用,因为它不仅可以提取元素,还会修改原数组,方便后续处理。
- 确定孙子级键 (grandchildKey): array_splice() 操作后,$parts 数组中剩余的元素就是孙子级键的组成部分。将它们用点重新连接起来。
- 赋值到结果数组: 将原始 $value 赋给 $result[$parentKey][$childKey][$grandchildKey]。
- 排除特定键: 如果 grandchildKey 等于 name(例如 block.0.name 中的 name 部分),则通常不需要将其作为独立的键存储,因为其信息已经体现在 childKey 中(block0)。
2.2 示例代码
'block.0.name', 'value' => 'vda' ],
[ 'name' => 'block.0.backingIndex', 'value' => 2 ],
[ 'name' => 'block.0.rd.reqs', 'value' => 248907 ],
[ 'name' => 'block.0.rd.bytes', 'value' => 9842014208 ],
[ 'name' => 'block.0.rd.times', 'value' => 372870570891 ],
[ 'name' => 'block.0.wr.reqs', 'value' => 6869976 ],
[ 'name' => 'block.0.wr.bytes', 'value' => 50781960192 ],
[ 'name' => 'block.0.wr.times', 'value' => 32361608225142 ],
[ 'name' => 'block.0.fl.reqs', 'value' => 2471825 ],
[ 'name' => 'block.0.fl.times', 'value' => 936802992509 ],
[ 'name' => 'block.0.allocation', 'value' => 21107503104 ],
[ 'name' => 'block.0.capacity', 'value' => 21474836480 ],
[ 'name' => 'block.0.physical', 'value' => 21474836480 ],
[ 'name' => 'block.1.name', 'value' => 'hda' ],
[ 'name' => 'block.1.path', 'value' => '/var/datastores/disk.1' ],
[ 'name' => 'block.1.backingIndex', 'value' => 30 ],
[ 'name' => 'block.1.rd.reqs', 'value' => 2871 ],
[ 'name' => 'block.1.rd.bytes', 'value' => 9677156 ],
[ 'name' => 'block.1.rd.times', 'value' => 620637479 ],
[ 'name' => 'block.1.capacity', 'value' => 374784 ],
[ 'name' => 'block.1.physical', 'value' => 376832 ],
// 假设还有 block.2 的数据,为了演示输出
[ 'name' => 'block.2.backingIndex', 'value' => 30 ],
[ 'name' => 'block.2.rd.reqs', 'value' => 2871 ],
[ 'name' => 'block.2.rd.bytes', 'value' => 9677156 ],
[ 'name' => 'block.2.rd.times', 'value' => 620637479 ],
[ 'name' => 'vcpu.0.state', 'value' => 1 ],
[ 'name' => 'vcpu.0.time', 'value' => 963654400000000 ],
[ 'name' => 'vcpu.0.wait', 'value' => 0 ],
[ 'name' => 'vcpu.1.state', 'value' => 1 ],
[ 'name' => 'vcpu.1.time', 'value' => 936409070000000 ],
[ 'name' => 'vcpu.1.wait', 'value' => 0 ],
[ 'name' => 'vcpu.2.state', 'value' => 1 ],
[ 'name' => 'vcpu.2.time', 'value' => 943396180000000 ],
[ 'name' => 'vcpu.2.wait', 'value' => 0 ],
[ 'name' => 'vcpu.3.state', 'value' => 1 ],
[ 'name' => 'vcpu.3.time', 'value' => 959496330000000 ],
[ 'name' => 'vcpu.3.wait', 'value' => 0 ],
[ 'name' => 'balloon.current', 'value' => 16777216 ],
[ 'name' => 'balloon.maximum', 'value' => 34534530 ], // 示例值修改
[ 'name' => 'balloon.swap_in', 'value' => 0 ],
[ 'name' => 'balloon.swap_out', 'value' => 0 ],
[ 'name' => 'balloon.major_fault', 'value' => 262 ],
[ 'name' => 'balloon.minor_fault', 'value' => 132293 ],
[ 'name' => 'balloon.unused', 'value' => 16153712 ],
[ 'name' => 'balloon.available', 'value' => 16396312 ],
];
$result = [];
foreach ($inputArray as ['name' => $name, 'value' => $value]) {
// 1. 将点分隔的字符串拆分成数组
$parts = explode('.', $name);
// 2. 确定顶层键 (e.g., 'block' -> 'blocks')
$parentKey = $parts[0] . 's';
// 3. 确定子层键 (e.g., 'block.0' -> 'block0', 'balloon' -> 'balloon')
// ctype_digit($parts[1]) 检查第二个部分是否为数字
// 如果是数字,则从 $parts 中移除前两个元素并拼接成 childKey
// 如果不是数字,则只从 $parts 中移除第一个元素并作为 childKey
$childKeySegments = array_splice($parts, 0, ctype_digit($parts[1]) ? 2 : 1);
$childKey = implode('', $childKeySegments); // 例如 block0, vcpu0, balloon
// 4. 确定孙子层键 (剩余的部分用点连接)
// $parts 数组已经被 array_splice() 修改,只剩下孙子层键的组成部分
$grandchildKey = implode('.', $parts);
// 5. 排除不需要的键(如原始的 'name' 字段)
// 如果 grandchildKey 为空,说明原始 name 只有两部分且第二部分是数字,
// 或者原始 name 只有一部分,这两种情况都意味着没有更深层次的键。
// 在本例中,原始的 'block.0.name' 的 'name' 部分应该被排除,
// 因为 'block0' 已经代表了名称。
if ($grandchildKey !== 'name') {
$result[$parentKey][$childKey][$grandchildKey] = $value;
}
}
// 输出结果
echo '';
var_export($result);
echo '
';
?>2.3 代码解析
- foreach ($inputArray as ['name' => $name, 'value' => $value]): 这是 PHP 7.1+ 的数组解构语法,它允许我们直接从嵌套数组中提取 name 和 value 字段到局部变量中,使代码更简洁。
- $parts = explode('.', $name);: 将 name 字符串(如 block.0.name)拆分成一个数组 ['block', '0', 'name']。
- $parentKey = $parts[0] . 's';: 简单地将第一个部分加上 's',形成顶层容器键,如 blocks, vcpus, balloons。
-
$childKeySegments = array_splice($parts, 0, ctype_digit($parts[1]) ? 2 : 1);:
- ctype_digit($parts[1]): 检查 $parts 数组的第二个元素(索引为 1)是否全部由数字组成。例如,对于 block.0.name,$parts[1] 是 '0',ctype_digit 返回 true。对于 balloon.current,$parts[1] 是 'current',ctype_digit 返回 false。
- ? 2 : 1: 这是一个三元运算符。如果 ctype_digit($parts[1]) 为真,则 array_splice 移除 2 个元素(第一个和第二个),否则移除 1 个元素(第一个)。
- array_splice($parts, 0, count): 从 $parts 数组的开头移除指定数量的元素,并将这些被移除的元素作为一个新数组返回给 $childKeySegments。同时,$parts 数组本身会被修改,只保留未被移除的元素。
- $childKey = implode('', $childKeySegments);: 将 $childKeySegments 中的元素直接拼接起来,形成子级键,如 block0 或 balloon。
- $grandchildKey = implode('.', $parts);: 经过 array_splice 操作后,$parts 数组中只剩下最内层键的组成部分。将它们用点重新连接,形成孙子级键,如 backingIndex 或 rd.reqs 或 current。
- if ($grandchildKey !== 'name'): 这是一个重要的条件判断。在原始数据中,如 block.0.name,其 value 是 vda。但我们期望的输出中,block0 已经是这个块的标识,通常不需要一个名为 name 的子键来重复存储 vda。这个条件排除了这类冗余。如果你的需求是保留这个 name 字段,可以移除此条件。
- $result[$parentKey][$childKey][$grandchildKey] = $value;: 最终将 value 赋给动态构建的三层结构。如果中间层级不存在,PHP 会自动创建它们。
3. 注意事项与总结
- 性能: 这种基于字符串拆分和数组操作的方法通常比使用正则表达式或多层嵌套循环查找特定字符串更高效。它对每个 name 字符串只进行一次 explode 和几次简单的数组操作。
- 灵活性: 该方法能够灵活处理不同模式的键名,无论是带有数字索引(如 block.0)还是不带数字索引(如 balloon)的顶层分组,都能正确识别并构建相应的层次结构。
- 可扩展性: 如果你的数据有更深层次的结构(例如 block.0.rd.stats.total),此方法也能通过 grandchildKey 自动处理,因为它会 implode 所有剩余的 $parts。
- 键名转换规则: parentKey 的 + 's' 规则是根据示例输出定制的。如果你的需求是其他命名规则,需要相应修改。childKey 的拼接方式(implode('', $childKeySegments))也可能根据具体需求调整,例如,如果需要 block_0 而不是 block0,则应使用 implode('_', $childKeySegments)。
- 数据类型: value 的数据类型会保持不变,PHP 会自动处理数字、字符串等。
通过上述方法,我们可以将扁平化的、使用点分隔键名的数据集,高效且优雅地转换为易于理解和操作的多维数组结构,极大地提升了数据的可用性和代码的可维护性。











