JavaScript中实现API分页：高效循环获取全部数据的教程

聖光之護

发布时间：2025-11-19 17:51:18

935人浏览过

来源于php中文网

原创

JavaScript中实现API分页：高效循环获取全部数据的教程

本教程详细介绍了如何在javascript中通过迭代循环机制高效地从支持分页的api中获取所有可用数据。我们将探讨如何利用`async/await`处理异步请求，并通过动态调整请求参数（如`start`和`limit`或`page`和`size`）来遍历所有数据页，直至所有数据被成功收集。

理解API分页机制

大多数RESTful API为了优化性能和管理数据传输量，都会对单个请求返回的数据量设置上限。这意味着如果数据集较大，API会通过分页（Pagination）机制将数据拆分成多个“页”或“批次”。开发者需要通过连续发送请求，并调整特定的查询参数来逐页获取所有数据。

常见的API分页参数包括：

start (或 offset): 指定从哪个位置开始返回数据，通常是基于0的索引。
limit (或 size): 指定每个请求返回的最大数据条数。
page: 指定要请求的页码，通常从1开始。

例如，Indeed搜索API可能使用start和limit参数来控制分页，如start=0&limit=50表示从第0条开始获取50条数据。

设计循环获取数据的策略

为了获取所有分页数据，我们需要一个迭代过程，它能够：

歌歌AI写歌

支持人声克隆的AI音乐创作平台，歌歌AI写歌 - 人人都是音乐家

下载

立即学习“Java免费学习笔记（深入）”；

发送初始请求：获取第一页数据和总数据量信息。
判断是否需要继续：根据已获取的数据量和API报告的总数据量来决定。
更新请求参数：为下一次请求准备正确的start或page值。
聚合数据：将每次请求获取的数据累积起来。
处理异步：由于API请求是异步操作，需要使用async/await确保请求按序执行并等待响应。

实现分页获取数据的JavaScript代码

下面是一个通用的JavaScript实现，它利用async/await和for循环来处理API分页。我们将以一个假想的API为例，该API在响应中包含当前页数据和总数据量。

async function fetchAllPaginatedData(baseUrl, itemsPerPage = 50) {
    let allData = []; // 用于存储所有获取到的数据
    let totalItems = 0; // API报告的总数据量
    let loopNeeded = true; // 控制循环是否继续的标志

    console.log(`开始从 ${baseUrl} 获取所有分页数据...`);

    // 使用 for 循环进行迭代，直到所有数据获取完毕
    // 变量 i 可以代表页码 (page) 或偏移量的倍数 (start/offset)
    for (let i = 0; loopNeeded; i++) {
        // 构建当前页的URL。
        // 如果API使用 'page' 和 'size' 参数，URL可能形如: `${baseUrl}?page=${i}&size=${itemsPerPage}`
        // 如果是 Indeed API 等使用 'start' 和 'limit' 参数，URL则形如:
        const url = `${baseUrl}?start=${i * itemsPerPage}&limit=${itemsPerPage}`;
        console.log(`正在请求: ${url}`);

        try {
            const response = await fetch(url);
            if (!response.ok) {
                throw new Error(`HTTP 错误! 状态: ${response.status}`);
            }
            const data = await response.json();

            // 假设API响应结构为 { data: [...], totalItems: N }
            // 请根据实际API响应调整这里的数据提取逻辑
            const currentBatch = data.data || []; // 当前页的数据
            // 首次请求或当API每次都返回总数时更新 totalItems
            totalItems = data.totalItems !== undefined ? data.totalItems : totalItems; 

            allData = allData.concat(currentBatch); // 将当前页数据添加到总数据列表中

            console.log(`已获取 ${allData.length} / ${totalItems} 条数据。`);

            // 判断是否已获取所有数据
            // 1. 已获取的数据量达到或超过API报告的总数据量
            // 2. 当前批次为空，意味着没有更多数据可获取了（即使totalItems不准确也能停止）
            if (allData.length >= totalItems || currentBatch.length === 0) {
                loopNeeded = false; // 停止循环
            }
        } catch (error) {
            console.error(`获取数据时发生错误: ${error}`);
            loopNeeded = false; // 发生错误时停止循环
        }
    }

    console.log(`所有数据获取完成。共获取 ${allData.length} 条数据。`);
    return allData;
}

// 示例调用 (使用一个公开的测试API，类似于问题答案中提供的)
// 注意：该示例API使用 'page' 和 'size'，因此在实际调用时需要调整 fetchAllPaginatedData 内部的URL构建逻辑
// 或者创建一个专门适配该API的包装函数。
// 为了演示，我们假设其行为与 Indeed 的 'start'/'limit' 类似，只是参数名不同。
const sampleApiBaseUrl = "https://api.instantwebtools.net/v1/passenger";
// 实际测试时，可能需要将 fetchAllPaginatedData 函数中的URL构建改为:
// const url = `${baseUrl}?page=${i}&size=${itemsPerPage}`;
fetchAllPaginatedData(sampleApiBaseUrl, 100).then(results => {
    console.log("最终获取到的乘客数据:", results);
}).catch(err => console.error("获取乘客数据失败:", err));

// Indeed API 示例 (注释掉，因为需要 Indeed API 的有效 token 和实际数据)
/*
const indeedBaseUrl = "https://resumes.indeed.com/rpc/search";
const indeedCsrfToken = "YOUR_INDEED_CSRF_TOKEN"; // 替换为你的实际 token
const indeedQuery = "sales";
const indeedLocation = "Orlando,FL";
const indeedLmd = "3day";
const indeedRadius = "25";

async function fetchIndeedData() {
    let allIndeedData = [];
    let currentStart = 0;
    const indeedLimit = 50; // Indeed API 每次请求的限制
    let totalIndeedResults = 0;
    let continueFetching = true;

    for (let i = 0; continueFetching; i++) {
        // Indeed API 使用 'start' 作为偏移量
        const indeedUrl = `${indeedBaseUrl}?q=${indeedQuery}&l=${indeedLocation}&start=${currentStart}&limit=${indeedLimit}&lmd=${indeedLmd}&radius=${indeedRadius}&indeedcsrftoken=${indeedCsrfToken}`;
        console.log(`正在请求 Indeed: ${indeedUrl}`);

        try {
            const response = await fetch(indeedUrl);
            if (!response.ok) {
                throw new Error(`Indeed API HTTP 错误! 状态: ${response.status}`);
            }
            const data = await response.json();

            // 假设 Indeed API 响应结构包含 'results' 数组和 'totalResults' 字段
            const currentIndeedBatch = data.results || [];
            totalIndeedResults = data.totalResults !== undefined ? data.totalResults : totalIndeedResults;

            allIndeedData = allIndeedData.concat(currentIndeedBatch);
            console.log(`已获取 Indeed ${allIndeedData.length} / ${totalIndeedResults} 条数据。`);

            // 更新下一个请求的起始偏移量
            currentStart += indeedLimit;

            // 终止条件：已获取的数据量达到或超过总结果数，或当前批次为空
            if (allIndeedData.length >= totalIndeedResults || currentIndeedBatch.length === 0) {
                continueFetching = false;
            }
        } catch (error) {
            console.error(`获取 Indeed 数据时发生错误: ${error}`);
            continueFetching = false;
        }
    }
    console.log(`Indeed 数据获取完成。共获取 ${allIndeedData.length} 条数据。`);
    return allIndeedData;
}

// fetchIndeedData().then(results => {
//     console.log("最终获取到的 Indeed 数据:", results);
// }).catch(err => console.error("获取 Indeed 数据失败:", err));
*/

代码解析：

fetchAllPaginatedData(baseUrl, itemsPerPage) 函数：这是一个异步函数，接受API的基础URL和每页数据量作为参数。
allData 数组：用于累积从所有页获取的数据。
totalItems：用于存储API响应中报告的总数据量。它在首次请求时或每次请求都提供总数时更新。
loopNeeded 标志：控制for循环的执行。当所有数据都已获取或发生错误时，此标志设为false，循环终止。
循环逻辑：
- 在每次迭代中，根据i（当前页码或偏移量）和itemsPerPage构建请求URL。对于使用start和limit的API，start参数应为i * itemsPerPage。
- 使用fetch发送异步请求，并用await等待响应。
- 错误处理：检查response.ok，如果状态码不是2xx，则抛出错误。try...catch块用于捕获网络错误或JSON解析错误。
- 数据提取：从API响应中提取当前页的数据 (data.data) 和总数据量 (data.totalItems)。请务必根据你实际使用的API响应结构调整这一部分。
- 数据聚合：使用concat方法将当前页数据添加到allData数组中。
- 终止条件：
  - 当allData.length >= totalItems时，表示已获取的数据量达到或超过API报告的总量，循环终止。
  - currentBatch.length === 0 是一个重要的备用终止条件，尤其是在API不提供`

javascript正则表达式是什么_如何进行模式匹配？

javascript Promise是什么_如何使用then和catch

javascript的Node_js是什么_如何用它构建后端应用

怎么使用javascript操作DOM_有哪些高效的方法可以避免重排？

javascript防抖和节流是什么_它们分别适用于什么场景？

相关专题

js获取数组长度的方法

在js中，可以利用array对象的length属性来获取数组长度，该属性可设置或返回数组中元素的数目，只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值，也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容，供大家免费下载使用。

552

2023.06.20

js刷新当前页面

js刷新当前页面的方法：1、reload方法，该方法强迫浏览器刷新当前页面，语法为“location.reload([bForceGet]) ”；2、replace方法，该方法通过指定URL替换当前缓存在历史里（客户端）的项目，因此当使用replace方法之后，不能通过“前进”和“后退”来访问已经被替换的URL，语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

374

2023.07.04

js四舍五入

js四舍五入的方法：1、tofixed方法，可把 Number 四舍五入为指定小数位数的数字；2、round() 方法，可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

730

2023.07.04

js删除节点的方法

js删除节点的方法有：1、removeChild()方法，用于从父节点中移除指定的子节点，它需要两个参数，第一个参数是要删除的子节点，第二个参数是父节点；2、parentNode.removeChild()方法，可以直接通过父节点调用来删除子节点；3、remove()方法，可以直接删除节点，而无需指定父节点；4、innerHTML属性，用于删除节点的内容。

475

2023.09.01

JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号，可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容，供大家免费下载体验。

394

2023.09.04

js生成随机数的方法

js生成随机数的方法有：1、使用random函数生成0-1之间的随机数；2、使用random函数和特定范围来生成随机整数；3、使用random函数和round函数生成0-99之间的随机整数；4、使用random函数和其他函数生成更复杂的随机数；5、使用random函数和其他函数生成范围内的随机小数；6、使用random函数和其他函数生成范围内的随机整数或小数。

990

2023.09.04

如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍：1、内联脚本是将JavaScript代码直接嵌入到HTML标签中；2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中；3、外部脚本是将JavaScript代码放置在一个独立的文件；4、外部脚本是将JavaScript代码放置在一个独立的文件。

656

2023.09.12

Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型，用于表示独一无二的值。Symbol的特点：1、独一无二，每个Symbol值都是唯一的，不会与其他任何值相等；2、不可变性，Symbol值一旦创建，就不能修改或者重新赋值；3、隐藏性，Symbol值不会被隐式转换为其他类型；4、无法枚举，Symbol值作为对象的属性名时，默认是不可枚举的。

551

2023.09.20