
在Web应用中,处理用户上传的CSV文件是一个常见需求。首先,我们需要一个HTML表单来允许用户选择并上传文件,然后使用PHP接收并解析这个文件。
创建一个简单的HTML表单,enctype="multipart/form-data" 是处理文件上传的关键属性。
<form enctype='multipart/form-data' action='' method='post'>
    <label>上传 CSV 文件</label><br>
    <input size='50' type='file' name='filename'><br>
    <input type='submit' name='submit' value='上传文件'>
</form>当表单提交后,PHP通过 $_FILES 全局变量访问上传的文件信息。我们将使用 fgetcsv 函数逐行读取CSV文件,并结合 array_combine 将每行数据转换为关联数组,其中键名取自CSV文件的标题行。
<?php
if (isset($_POST['submit'])) {
    // 检查文件上传是否成功
    if ($_FILES['filename']['error'] === UPLOAD_ERR_OK) {
        $filePath = $_FILES['filename']['tmp_name'];
        $file = fopen($filePath, "r");
        if ($file === false) {
            echo "错误:无法打开上传的文件。";
            exit;
        }
        $all_rows = array();
        // 读取CSV文件的第一行作为标题
        $header = fgetcsv($file);
        // 检查标题行是否有效
        if ($header === false) {
            echo "错误:CSV文件为空或无法读取标题行。";
            fclose($file);
            exit;
        }
        // 逐行读取CSV数据并组合成关联数组
        while (($row = fgetcsv($file)) !== false) {
            // 确保行数据与标题数量匹配,防止array_combine报错
            if (count($header) === count($row)) {
                $all_rows[] = array_combine($header, $row);
            } else {
                // 可选:记录或处理不匹配的行
                // error_log("CSV行数据与标题不匹配: " . implode(",", $row));
            }
        }
        fclose($file); // 关闭文件句柄
        // 此时 $all_rows 包含了CSV的所有数据,每个元素都是一个关联数组
        // 例如:
        // Array
        // (
        //     [0] => Array
        //         (
        //             [query] => https://www.example.com/search/output/person/?loc=%5B%22105490917%22%2C%22101452733%22%5D&keywords=Computational%20Biologist&origin=host
        //             [firstName] => John
        //             [lastName] => Smith
        //         )
        //     ...
        // )
        // 打印原始解析结果(用于调试)
        echo "<pre>";
        print_r($all_rows);
        echo "</pre>";
        // 接下来进行数据转换...
    } else {
        echo "文件上传失败,错误代码:" . $_FILES['filename']['error'];
    }
}
?>注意事项:
立即学习“PHP免费学习笔记(深入)”;
我们的目标是将 query 字段中复杂的URL字符串,例如 https://...&keywords=Computational%20Biologist&origin=host,简化为只包含 keywords 参数的值,即 Computational Biologist。这需要一系列字符串处理函数来完成。
我们将遍历 $all_rows 数组,对每个元素的 query 键值进行操作。
// 示例: "https://...&keywords=Computational%20Biologist&origin=host" // 变为: "keywords=Computational%20Biologist&origin=host" $all_rows[$key]['query'] = strstr($all_rows[$key]['query'], 'keywords=');
// 示例: "keywords=Computational%20Biologist&origin=host"
// 变为: "Computational%20Biologist&origin=host"
$all_rows[$key]['query'] = str_replace('keywords=', '', $all_rows[$key]['query']);// 示例: "Computational%20Biologist&origin=host"
// 变为: "Computational%20Biologist"
// 注意:如果字符串中没有 "&" (即keywords是最后一个参数),strpos会返回false,substr会处理整个字符串。
$ampersandPos = strpos($all_rows[$key]['query'], "&");
if ($ampersandPos !== false) {
    $all_rows[$key]['query'] = substr($all_rows[$key]['query'], 0, $ampersandPos);
}
// 如果没有 "&",则保持不变,因为它已经是我们想要的部分了。// 示例: "Computational%20Biologist" // 变为: "Computational Biologist" $all_rows[$key]['query'] = urldecode($all_rows[$key]['query']);
将上述逻辑整合到一个 foreach 循环中,应用于 $all_rows 数组中的每个元素。
<?php
// ... (之前的HTML表单和PHP文件上传与解析代码) ...
if (isset($_POST['submit'])) {
    // ... (文件上传和CSV解析代码) ...
    // 假设 $all_rows 已经填充了CSV数据
    // 对 $all_rows 数组中的每个元素进行数据转换
    foreach ($all_rows as $key => $value) {
        // 确保 'query' 键存在且为字符串
        if (isset($all_rows[$key]['query']) && is_string($all_rows[$key]['query'])) {
            $queryString = $all_rows[$key]['query'];
            // 1. 查找 'keywords=' 起始点
            $start = strstr($queryString, 'keywords=');
            if ($start === false) {
                // 如果没有找到 'keywords=',可以跳过或设置为默认值
                $all_rows[$key]['query'] = ''; // 或者保留原始值
                continue;
            }
            // 2. 移除 'keywords=' 前缀
            $keywordValue = str_replace('keywords=', '', $start);
            // 3. 截取到下一个 '&' 符号之前的部分
            $ampersandPos = strpos($keywordValue, "&");
            if ($ampersandPos !== false) {
                $keywordValue = substr($keywordValue, 0, $ampersandPos);
            }
            // 4. URL解码
            $all_rows[$key]['query'] = urldecode($keywordValue);
        }
    }
    // 打印转换后的数组
    echo "<h2>转换后的数据:</h2>";
    echo "<pre>";
    print_r($all_rows);
    echo "</pre>";
}
?>预期的输出结果:
Array
(
    [0] => Array
        (
            [query] => Computational Biologist
            [firstName] => John
            [lastName] => Smith
            [] => 
        )
    [1] => Array
        (
            [query] => Computational Biologist
            [firstName] => fred
            [lastName] => clause
            [] => 
        )
    [2] => Array
        (
            [query] => Computational Biologist
            [firstName] => brendan
            [lastName] => bobby
            [] => 
        )
)虽然上述方法对于特定格式的URL非常有效,但在实际应用中,URL的结构可能更复杂或多变。以下是一些进阶考虑:
更健壮的URL参数解析: 对于更通用的URL参数提取,PHP提供了 parse_url() 和 parse_str() 函数。
$url = "https://www.example.com/search/output/person/?loc=%5B%22105490917%22%2C%22101452733%22%5D&keywords=Computational%20Biologist&origin=host";
$parsedUrl = parse_url($url);
if (isset($parsedUrl['query'])) {
    parse_str($parsedUrl['query'], $queryParams);
    if (isset($queryParams['keywords'])) {
        $keyword = $queryParams['keywords']; // 已经自动解码
        echo $keyword; // Output: Computational Biologist
    }
}这种方法更推荐用于处理任意URL参数,因为它更具通用性和鲁棒性。
错误处理与验证:
性能优化: 对于非常大的CSV文件,一次性将所有数据加载到内存中可能会导致内存不足。可以考虑逐行处理数据,或者使用生成器(PHP 5.5+)来优化内存使用。
数据持久化: 处理完的数据通常需要存储到数据库或另一个文件中。根据需求选择合适的存储方式。
本教程详细展示了如何通过PHP实现CSV文件的上传、解析,以及对解析后的数据进行特定字段的清洗和转换。从基础的文件上传表单到复杂的字符串处理逻辑,我们逐步构建了一个实用的数据处理流程。通过采用 strstr、str_replace、substr 和 urldecode 等函数,我们成功地从URL中提取了目标关键词。同时,也介绍了更通用和健壮的URL解析方法,并强调了错误处理和性能优化的重要性,为开发人员在处理类似任务时提供了全面的指导。
以上就是PHP中CSV文件上传与URL参数提取技巧的详细内容,更多请关注php中文网其它相关文章!
                        
                        PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
                Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号