
本文介绍在 php 中如何将字符串中的元音和辅音字符分别提取、转为小写、去除空格后,**按各字符在原字符串中首次出现的顺序进行分组,并按频次重复排列**(即“稳定频次排序”),而非简单保持遍历顺序或字母序。
要实现题目所要求的效果——例如输入 "Sample Case",期望输出元音 "aaee"(a 出现 2 次、e 出现 2 次,且 a 先于 e 首次出现)、辅音 "ssmplc"(s 首次出现在索引 1 和 7,共 2 次;m/p/l/c 各 1 次,按首次出现顺序排列)——关键在于:既要统计频次,又要保留字符首次出现的相对顺序。
原始代码的问题在于:它仅按遍历顺序收集字符($v 和 $c 是 FIFO 列表),因此输出 "aeae" 和 "smplcs",这反映的是出现顺序,而非去重后的首次出现顺序 + 频次展开。
正确解法需两步:
- 提取并归类:用正则过滤出元音([aeiou])和辅音([bcdfghjklmnpqrstvwxyz]),统一转小写、去空格;
- 频次统计 + 稳定排序:使用 array_count_values() 统计每个字符出现次数;再通过 str_split() 原始归类字符串,结合 array_keys() 获取唯一字符列表(PHP 7.4+ 中 array_keys(array_count_values($arr)) 会按首次出现顺序保留键),最后用 str_repeat() 按频次拼接。
以下是优化后的完整可运行函数:
function sortCharactersByFirstOccurrence($text) {
$text = strtolower(str_replace(' ', '', $text));
// 提取元音(仅 aeiou)和辅音(英文 21 字母,排除元音和空格)
$vowelStr = preg_replace('/[^aeiou]/', '', $text);
$consonantStr = preg_replace('/[^bcdfghjklmnpqrstvwxyz]/', '', $text);
// 统计频次(array_count_values 保持首次出现顺序作为键序)
$vowelFreq = array_count_values(str_split($vowelStr));
$consonantFreq = array_count_values(str_split($consonantStr));
// 按首次出现顺序拼接:array_keys() 返回唯一字符数组,顺序即首次出现顺序
$vowels = '';
foreach (array_keys($vowelFreq) as $char) {
$vowels .= str_repeat($char, $vowelFreq[$char]);
}
$consonants = '';
foreach (array_keys($consonantFreq) as $char) {
$consonants .= str_repeat($char, $consonantFreq[$char]);
}
echo "Vowels : {$vowels}\n";
echo "Consonants : {$consonants}\n";
}
// 测试
sortCharactersByFirstOccurrence("Sample Case");
// 输出:
// Vowels : aaee
// Consonants : ssmplc✅ 注意事项:
- array_count_values() 在 PHP 中对 str_split() 结果生成的索引数组,其键(字符)的遍历顺序自 PHP 7.4 起保证为首次出现顺序(底层使用有序哈希表),因此可安全依赖;
- 正则 /[^aeiou]/ 表示“非元音”,能精准剔除辅音与空格;同理 /[^bcdfghjklmnpqrstvwxyz]/ 仅保留辅音;
- 若需兼容更广字符集(如带重音元音),应扩展正则或改用 mb_ 系列函数;
- 该方案时间复杂度为 O(n),空间复杂度 O(k)(k 为不重复字符数),高效且可读性强。
总结:实现“按首次出现顺序的频次展开”,核心不是排序(sort() 会打乱顺序),而是利用 array_count_values() 的有序键特性 + array_keys() 提取稳定顺序,再逐个展开。这是处理“稳定频次分组”类问题的经典 PHP 模式。










