PHP教程:解析包含中文的文本文件并生成JSON数据

心靈之曲
发布: 2025-07-22 16:40:11
原创
379人浏览过

php教程:解析包含中文的文本文件并生成json数据

本文将介绍如何使用PHP解析包含中文的文本文件,并将其转换为JSON格式的数据。重点在于解决中文在JSON编码时出现的Unicode转义问题,通过JSON_UNESCAPED_UNICODE选项,确保生成的JSON数据能够正确显示中文内容,同时提供美化输出的JSON_PRETTY_PRINT选项,使JSON数据更易于阅读和调试。

解析文本文件

首先,我们需要从文本文件中读取数据。假设我们有一个名为 Book.txt 的文件,其内容如下:

紐約建築藝術 陳偉銘 藝術 2016/02/15 在館內
人體百科全書 蘇煥文 科學 2017/09/30 已借出
塞納河畔 葉國威 文學 2017/09/25 已預約
性別與教育 陳文輝 社會學 2016/10/12 已借出
台灣當代社會變革 林東興 社會學 2014/04/17 已借出
登录后复制

以下PHP代码可以读取该文件,并将每行数据分割成不同的字段:

<?php
// 打开文件以读取数据
$fh = fopen('Book.txt', 'r');

// 定义一个空数组
$data = array();

// 逐行读取数据
while ($line = fgets($fh)) {
    // 移除行首尾的空白字符
    $line = trim($line);
    if (!empty($line)) {
        // 使用两个空格作为分隔符分割字符串
        $line_data = explode('  ', $line);

        // 确保分隔后的数组包含足够的元素
        if (count($line_data) >= 5) {
            // 将数据添加到数组中
            $data[] = array(
                'title' => trim($line_data[0]),
                'author' => trim($line_data[1]),
                'type' => trim($line_data[2]),
                'publishDate' => trim($line_data[3]),
                'status' => trim($line_data[4])
            );
        } else {
            // 处理分隔失败的情况,例如记录日志或抛出异常
            error_log("Failed to parse line: " . $line);
        }
    }
}

// 关闭文件
fclose($fh);

// 输出JSON数据
echo $json_data = json_encode($data, JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT);
?>
登录后复制

代码解释:

立即学习PHP免费学习笔记(深入)”;

  1. fopen('Book.txt', 'r'): 打开名为 Book.txt 的文件,以只读模式打开。
  2. $data = array(): 初始化一个空数组,用于存储从文件中读取的数据。
  3. while ($line = fgets($fh)): 循环读取文件的每一行。
  4. trim($line): 移除每行数据首尾的空白字符,避免干扰后续的数据处理。
  5. explode(' ', $line): 使用两个空格作为分隔符,将每行数据分割成不同的字段。注意,这里假设字段之间使用两个空格分隔。
  6. $data[] = array(...): 将分割后的字段存储到 $data 数组中,每个元素都是一个关联数组,包含 title、author、type、publishDate 和 status 字段。
  7. fclose($fh): 关闭文件,释放资源。
  8. json_encode($data, JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT): 使用 json_encode 函数将 $data 数组转换为 JSON 格式的字符串。JSON_UNESCAPED_UNICODE 选项用于防止中文被转义成 Unicode 编码,JSON_PRETTY_PRINT 选项用于格式化 JSON 字符串,使其更易于阅读。

解决中文Unicode转义问题

默认情况下,json_encode 函数会将 Unicode 字符转义为 \uXXXX 的形式。为了避免这种情况,我们需要使用 JSON_UNESCAPED_UNICODE 选项。

json_encode($data, JSON_UNESCAPED_UNICODE);
登录后复制

这样,生成的 JSON 数据中的中文将直接以中文形式显示,而不是 Unicode 编码。

巧文书
巧文书

巧文书是一款AI写标书、AI写方案的产品。通过自研的先进AI大模型,精准解析招标文件,智能生成投标内容。

巧文书 61
查看详情 巧文书

美化JSON输出

为了使 JSON 数据更易于阅读和调试,可以使用 JSON_PRETTY_PRINT 选项。

json_encode($data, JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT);
登录后复制

这将使生成的 JSON 数据具有缩进和换行,使其更易于阅读。

完整示例

将以上代码整合起来,可以得到以下完整示例:

<?php
// 打开文件以读取数据
$fh = fopen('Book.txt', 'r');

// 定义一个空数组
$data = array();

// 逐行读取数据
while ($line = fgets($fh)) {
    // 移除行首尾的空白字符
    $line = trim($line);
    if (!empty($line)) {
        // 使用两个空格作为分隔符分割字符串
        $line_data = explode('  ', $line);

        // 确保分隔后的数组包含足够的元素
        if (count($line_data) >= 5) {
            // 将数据添加到数组中
            $data[] = array(
                'title' => trim($line_data[0]),
                'author' => trim($line_data[1]),
                'type' => trim($line_data[2]),
                'publishDate' => trim($line_data[3]),
                'status' => trim($line_data[4])
            );
        } else {
            // 处理分隔失败的情况,例如记录日志或抛出异常
            error_log("Failed to parse line: " . $line);
        }
    }
}

// 关闭文件
fclose($fh);

// 输出JSON数据
echo $json_data = json_encode(array('books' => $data), JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT);
?>
登录后复制

注意事项:

  • 确保文本文件使用 UTF-8 编码,以避免中文乱码问题。
  • 根据实际情况调整分隔符,本例中使用的是两个空格。
  • 如果文本文件的格式不规则,需要进行更复杂的解析处理。
  • 增加了错误处理,当一行数据分割后的元素不足时,会记录错误日志。
  • 最终的JSON数据添加了books这个根节点。

总结:

通过使用 JSON_UNESCAPED_UNICODE 选项,可以轻松解决 PHP 中 JSON 编码中文时的 Unicode 转义问题。同时,使用 JSON_PRETTY_PRINT 选项可以使 JSON 数据更易于阅读和调试。在实际应用中,需要根据文本文件的格式和编码方式进行适当的调整。

以上就是PHP教程:解析包含中文的文本文件并生成JSON数据的详细内容,更多请关注php中文网其它相关文章!

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号