
首先,我们需要一个HTML表单来允许用户上传CSV文件,并编写PHP代码来接收这个文件并将其内容解析成一个可操作的数组。
创建一个简单的HTML表单,用于选择并上传CSV文件:
<form enctype='multipart/form-data' action='' method='post'>
<label>上传 CSV 文件</label><br>
<input size='50' type='file' name='filename'><br>
<input type='submit' name='submit' value='上传文件'>
</form>当表单提交后,PHP脚本会处理上传的文件。我们使用fgetcsv函数逐行读取CSV内容,并结合array_combine将每行数据与CSV头信息关联起来,形成一个易于访问的关联数组。
<?php
if (isset($_POST['submit'])) {
// 检查文件是否成功上传
if (isset($_FILES['filename']) && $_FILES['filename']['error'] == UPLOAD_ERR_OK) {
$file = fopen($_FILES['filename']['tmp_name'], "r");
if ($file === false) {
echo "错误:无法打开上传的文件。";
exit;
}
$all_rows = array();
// 读取CSV文件的第一行作为表头
$header = fgetcsv($file);
// 逐行读取CSV数据
while (($row = fgetcsv($file)) !== false) {
// 确保行数据与表头长度匹配,避免array_combine报错
if (count($header) == count($row)) {
$all_rows[] = array_combine($header, $row);
} else {
// 处理行数据与表头不匹配的情况,例如跳过或记录错误
echo "警告:CSV行数据与表头不匹配,已跳过一行。<br>";
}
}
fclose($file); // 关闭文件句柄
echo "<h2>原始解析数据:</h2>";
echo "<pre>";
print_r($all_rows);
echo "</pre>";
} else {
echo "错误:文件上传失败或未选择文件。";
// 根据$_FILES['filename']['error']的值提供更详细的错误信息
if (isset($_FILES['filename'])) {
switch ($_FILES['filename']['error']) {
case UPLOAD_ERR_INI_SIZE:
case UPLOAD_ERR_FORM_SIZE:
echo "文件过大。";
break;
case UPLOAD_ERR_PARTIAL:
echo "文件部分上传。";
break;
case UPLOAD_ERR_NO_FILE:
echo "未选择文件。";
break;
case UPLOAD_ERR_NO_TMP_DIR:
echo "缺少临时文件夹。";
break;
case UPLOAD_ERR_CANT_WRITE:
echo "写入磁盘失败。";
break;
case UPLOAD_ERR_EXTENSION:
echo "PHP扩展阻止了文件上传。";
break;
}
}
}
}
?>运行上述代码并上传一个CSV文件(例如,内容如问题描述中的示例),您将看到一个包含所有CSV数据的关联数组。
立即学习“PHP免费学习笔记(深入)”;
现在,$all_rows数组包含了CSV的所有数据,其中query键的值是一个URL字符串。我们的目标是从这个URL中提取keywords=后面的值,并替换掉原始的URL字符串。
例如,将: https://www.example.com/search/output/person/?loc=%5B%22105490917%22%2C%22101452733%22%5D&keywords=Computational%20Biologist&origin=host 转换为: Computational Biologist
由于数据存储在数组的每个元素中,我们需要遍历整个数组,并对每个元素的query字段进行独立处理。
我们将使用一系列PHP字符串函数来完成这个任务:
将上述逻辑应用于$all_rows数组的每个元素:
<?php
// ... (之前的HTML表单和PHP CSV解析代码) ...
if (isset($_POST['submit'])) {
// ... (CSV文件上传和解析代码) ...
if (!empty($all_rows)) {
foreach ($all_rows as $key => $value) {
// 1. 查找并截取从 'keywords=' 开始的字符串部分
// 例如:'keywords=Computational%20Biologist&origin=host'
$query_string_part = strstr($all_rows[$key]['query'], 'keywords=');
if ($query_string_part !== false) { // 确保找到了 'keywords='
// 2. 移除 'keywords=' 前缀
// 例如:'Computational%20Biologist&origin=host'
$keyword_segment = str_replace('keywords=', '', $query_string_part);
// 3. 查找 '&' 符号的位置,并截取其之前的部分
// 例如:'Computational%20Biologist'
$amp_pos = strpos($keyword_segment, "&");
if ($amp_pos !== false) {
$extracted_keyword = substr($keyword_segment, 0, $amp_pos);
} else {
// 如果没有找到 '&',说明 'keywords=' 是最后一个参数
$extracted_keyword = $keyword_segment;
}
// 4. 对提取出的关键词进行URL解码
$all_rows[$key]['query'] = urldecode($extracted_keyword);
} else {
// 如果没有找到 'keywords=',可以将 'query' 设置为默认值或空字符串
$all_rows[$key]['query'] = ''; // 或者保留原值,取决于业务需求
}
}
echo "<h2>处理后的数据:</h2>";
echo "<pre>";
print_r($all_rows);
echo "</pre>";
} else {
echo "数组为空,没有数据可处理。";
}
}
?>将HTML表单、CSV解析和关键词提取逻辑组合在一起,形成一个完整的PHP脚本:
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>PHP CSV文件处理与URL关键词提取</title>
<style>
body { font-family: Arial, sans-serif; margin: 20px; }
pre { background-color: #f4f4f4; padding: 15px; border: 1px solid #ddd; overflow-x: auto; }
h2 { color: #333; }
form { margin-bottom: 20px; padding: 15px; border: 1px solid #eee; background-color: #f9f9f9; }
label { font-weight: bold; margin-bottom: 5px; display: block; }
input[type="file"] { margin-bottom: 10px; }
input[type="submit"] { padding: 8px 15px; background-color: #007bff; color: white; border: none; cursor: pointer; border-radius: 4px; }
input[type="submit"]:hover { background-color: #0056b3; }
.error { color: red; font-weight: bold; }
.warning { color: orange; }
</style>
</head>
<body>
<form enctype='multipart/form-data' action='' method='post'>
<label>上传 CSV 文件</label><br>
<input size='50' type='file' name='filename'><br>
<input type='submit' name='submit' value='上传文件'>
</form>
<?php
if (isset($_POST['submit'])) {
// 检查文件是否成功上传
if (isset($_FILES['filename']) && $_FILES['filename']['error'] == UPLOAD_ERR_OK) {
$file = fopen($_FILES['filename']['tmp_name'], "r");
if ($file === false) {
echo "<p class='error'>错误:无法打开上传的文件。</p>";
exit;
}
$all_rows = array();
// 读取CSV文件的第一行作为表头
$header = fgetcsv($file);
// 逐行读取CSV数据
while (($row = fgetcsv($file)) !== false) {
// 确保行数据与表头长度匹配
if ($header && count($header) == count($row)) {
$all_rows[] = array_combine($header, $row);
} else {
echo "<p class='warning'>警告:CSV行数据与表头不匹配或表头缺失,已跳过一行。</p>";
}
}
fclose($file); // 关闭文件句柄
echo "<h2>原始解析数据:</h2>";
echo "<pre>";
print_r($all_rows);
echo "</pre>";
// --- 批量提取URL中的关键词 ---
if (!empty($all_rows)) {
foreach ($all_rows as $key => $value) {
$original_query = $all_rows[$key]['query'];
// 1. 查找从 'keywords=' 开始的字符串部分
$query_string_part = strstr($original_query, 'keywords=');
if ($query_string_part !== false) {
// 2. 移除 'keywords=' 前缀
$keyword_segment = str_replace('keywords=', '', $query_string_part);
// 3. 查找 '&' 符号的位置,并截取其之前的部分
$amp_pos = strpos($keyword_segment, "&");
if ($amp_pos !== false) {
$extracted_keyword = substr($keyword_segment, 0, $amp_pos);
} else {
// 如果没有找到 '&',说明 'keywords=' 是最后一个参数
$extracted_keyword = $keyword_segment;
}
// 4. 对提取出的关键词进行URL解码
$all_rows[$key]['query'] = urldecode($extracted_keyword);
} else {
// 如果没有找到 'keywords=',则将 'query' 设置为空字符串或根据需求保留原值
$all_rows[$key]['query'] = ''; // 或 $all_rows[$key]['query'] = $original_query;
}
}
echo "<h2>处理后的数据:</h2>";
echo "<pre>";
print_r($all_rows);
echo "</pre>";
} else {
echo "<p>数组为空,没有数据可处理。</p>";
}
} else {
echo "<p class='error'>错误:文件上传失败或未选择文件。</p>";
// 根据$_FILES['filename']['error']的值提供更详细的错误信息
if (isset($_FILES['filename'])) {
switch ($_FILES['filename']['error']) {
case UPLOAD_ERR_INI_SIZE: echo "<p class='error'>文件过大 (超过php.ini限制)。</p>"; break;
case UPLOAD_ERR_FORM_SIZE: echo "<p class='error'>文件过大 (超过HTML表单限制)。</p>"; break;
case UPLOAD_ERR_PARTIAL: echo "<p class='error'>文件部分上传。</p>"; break;
case UPLOAD_ERR_NO_FILE: echo "<p class='error'>未选择文件。</p>"; break;
case UPLOAD_ERR_NO_TMP_DIR: echo "<p class='error'>缺少临时文件夹。</p>"; break;
case UPLOAD_ERR_CANT_WRITE: echo "<p class='error'>写入磁盘失败。</p>"; break;
case UPLOAD_ERR_EXTENSION: echo "<p class='error'>PHP扩展阻止了文件上传。</p>"; break;
default: echo "<p class='error'>未知上传错误。</p>"; break;
}
}
}
}
?>
</body>
</html>$url_components = parse_url($original_query);
if (isset($url_components['query'])) {
parse_str($url_components['query'], $params);
if (isset($params['keywords'])) {
$all_rows[$key]['query'] = $params['keywords'];
} else {
$all_rows[$key]['query'] = '';
}
}这种方法通常更健壮,不易受URL结构变化的影响。然而,对于本教程中这种明确且固定的模式,直接的字符串操作也高效且易于理解。
通过本教程,您学会了如何使用PHP处理CSV文件上传、解析数据,并利用字符串函数从复杂URL中批量提取和格式化特定信息。掌握这些技巧,将有助于您在数据处理和清洗任务中更加高效。
以上就是PHP CSV数据处理:批量提取URL参数中的关键词的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号