0

0

如何用 JavaScript 递归提取嵌套表格的所有行并导出为标准 CSV

心靈之曲

心靈之曲

发布时间:2026-01-07 15:21:39

|

806人浏览过

|

来源于php中文网

原创

如何用 JavaScript 递归提取嵌套表格的所有行并导出为标准 CSV

本文介绍一种健壮的 javascript 方法,用于遍历含嵌套子表(如 `colspan="3"` 内嵌 `

`)的 html 表格,递归提取所有**有效数据行**(即具有完整列数的 ``),过滤掉仅作容器用途的合并单元格行,最终生成结构清晰、无重复/错位的 csv 文件。

在实际前端开发中,动态渲染的层级化数据(如用户 Profile 及其关联的 Linked Users)常通过嵌套

实现。但传统遍历 tbody tr 会将包裹子表的 (如
)误判为数据行,导致 CSV 输出混乱——例如把整个嵌套块当作单行输出 "Tom Jack Sam Alex",而非独立的四行。

根本问题在于:需区分“容器行”与“数据行”。理想策略是——忽略所有包含 colspan 或嵌套

的 本身,只提取那些直接包含等量 ,并对其中嵌套的
单元格(数量匹配表头列数)的
递归执行相同逻辑。

以下是一个生产就绪的解决方案:

function exportTableToCsv() {
  const table = document.querySelector('table');
  if (!table) return;

  // 提取表头(严格按 th 顺序)
  const headers = Array.from(table.querySelectorAll('thead th'))
    .map(th => sanitizeCell(th.textContent));

  // 获取预期列数(用于过滤无效行)
  const expectedCols = headers.length;

  // 递归收集所有有效数据行(二维数组:[row1, row2, ...])
  function collectRows(rows) {
    const result = [];
    rows.forEach(row => {
      // 跳过含 colspan 的行(通常是容器行)或空行
      const hasColspan = row.querySelector('td[colspan], th[colspan]');
      if (hasColspan) {
        // 查找该行内所有嵌套 table,并递归处理其 tbody tr
        const nestedTables = row.querySelectorAll('table');
        nestedTables.forEach(nestedTable => {
          const nestedTbody = nestedTable.querySelector('tbody');
          if (nestedTbody) {
            result.push(...collectRows(nestedTbody.querySelectorAll('tr')));
          }
        });
        return;
      }

      // 提取当前行的 td/th 文本,跳过空单元格
      const cells = Array.from(row.querySelectorAll('td, th'))
        .map(cell => sanitizeCell(cell.textContent));

      // 仅保留列数匹配表头的有效数据行
      if (cells.length === expectedCols) {
        result.push(cells);
      }
    });
    return result;
  }

  // 开始递归收集(从主 tbody 出发)
  const tbody = table.querySelector('tbody');
  const allDataRows = tbody ? collectRows(tbody.querySelectorAll('tr')) : [];

  // 组装 CSV 字符串(含表头)
  const csvLines = [
    headers.join(','),
    ...allDataRows.map(row => row.join(','))
  ];

  const csvContent = csvLines.join('\n');

  // 触发下载
  downloadCsv(csvContent, 'export.csv');
}

// 辅助函数:清洗单元格内容(处理换行、逗号、引号,符合 RFC 4180)
function sanitizeCell(text) {
  const trimmed = text ? text.trim() : '';
  // 若含换行、逗号或双引号,需用双引号包裹,并转义内部双引号
  if (/[\n",]/.test(trimmed)) {
    return `"${trimmed.replace(/"/g, '""')}"`;
  }
  return trimmed;
}

function downloadCsv(content, filename) {
  const blob = new Blob([content], { type: 'text/csv;charset=utf-8;' });
  const url = URL.createObjectURL(blob);
  const a = document.createElement('a');
  a.href = url;
  a.download = filename;
  document.body.appendChild(a);
  a.click();
  document.body.removeChild(a);
  URL.revokeObjectURL(url);
}

关键设计亮点:

立即学习Java免费学习笔记(深入)”;

CreBee
CreBee

短视频矩阵运营工具,跨平台多账号一站式管理

下载
  • 精准过滤:通过 cells.length === expectedCols 确保每行数据列数与表头严格对齐,自动剔除 colspan 容器行;
  • 深度递归:对每个含嵌套
,定位其内部 tbody tr 并递归采集,不遗漏任意层级;
  • CSV 安全转义:sanitizeCell() 遵循 RFC 4180 标准,自动包裹含特殊字符的字段并转义双引号,避免 Excel 解析错误;
  • 健壮容错:支持缺失 thead/tbody、空单元格、混合 th/td 等边缘场景。
  • ⚠️ 注意事项:

    • 该方案假设所有嵌套子表结构与主表一致(列数相同)。若嵌套表列数不同,需扩展逻辑(如映射字段或填充空值);
    • 避免在大型表格(>1000 行)中使用同步递归,可考虑 requestIdleCallback 分片处理;
    • 如需支持中文导出,请确保 Blob 使用 utf-8 编码(已内置),并在 Excel 中用“数据 → 自文本”选择 UTF-8 编码打开。

    调用 exportTableToCsv() 即可一键导出符合预期的 CSV:
    Tom,20,London
    Jack,30,Glasgow
    Sam,40,Belfast
    Alex,50,Hull
    Josh,20,Cardiff

    结构清晰、语义准确、开箱即用。

    相关专题

    更多
    js获取数组长度的方法
    js获取数组长度的方法

    在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

    548

    2023.06.20

    js刷新当前页面
    js刷新当前页面

    js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

    373

    2023.07.04

    js四舍五入
    js四舍五入

    js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

    730

    2023.07.04

    js删除节点的方法
    js删除节点的方法

    js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

    475

    2023.09.01

    JavaScript转义字符
    JavaScript转义字符

    JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

    394

    2023.09.04

    js生成随机数的方法
    js生成随机数的方法

    js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

    990

    2023.09.04

    如何启用JavaScript
    如何启用JavaScript

    JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

    656

    2023.09.12

    Js中Symbol类详解
    Js中Symbol类详解

    javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

    551

    2023.09.20

    c++主流开发框架汇总
    c++主流开发框架汇总

    本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

    3

    2026.01.09

    热门下载

    更多
    网站特效
    /
    网站源码
    /
    网站素材
    /
    前端模板

    精品课程

    更多
    相关推荐
    /
    热门推荐
    /
    最新课程
    React 教程
    React 教程

    共58课时 | 3.5万人学习

    TypeScript 教程
    TypeScript 教程

    共19课时 | 2.1万人学习

    Bootstrap 5教程
    Bootstrap 5教程

    共46课时 | 2.8万人学习

    关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
    php中文网:公益在线php培训,帮助PHP学习者快速成长!
    关注服务号 技术交流群
    PHP中文网订阅号
    每天精选资源文章推送

    Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号