0

0

python怎么将一个列表拆分成多个小列表_python列表切分技巧

下次还敢

下次还敢

发布时间:2025-09-13 17:19:01

|

1112人浏览过

|

来源于php中文网

原创

按固定大小分割列表推荐使用生成器函数,通过切片和步长迭代实现内存高效;也可用列表推导式快速生成所有子列表。需分成N个子列表时,采用均匀分配策略,前余数个子列表多分一个元素。剩余元素处理方式包括:默认归入最后一组、均匀分配、丢弃不足块或填充至固定大小,具体策略依场景选择。

python怎么将一个列表拆分成多个小列表_python列表切分技巧

将Python列表拆分成多个小列表,核心思路无非就是通过迭代和切片操作,将一个大的序列数据切割成若干个更小的、可管理的部分。这在数据处理、并发编程、UI分页等场景中都非常常见,掌握这些技巧能让你的代码更优雅、高效。

解决方案

在Python中,拆分列表的方法多种多样,主要取决于你希望如何进行拆分:是按固定大小切块,还是分成指定数量的子列表,抑或是需要特殊处理剩余元素。最常见且实用的方法通常围绕着生成器函数、列表推导式以及一些巧妙的数学计算。

Python中如何按固定大小高效分割列表?

当我们谈到按固定大小分割列表时,通常指的是将一个长列表分解成一系列等长(或最后一个可能较短)的子列表。在我看来,处理这类需求,生成器函数无疑是最高效且Pythonic的选择,尤其是在处理大型数据集时,它能有效节省内存。

1. 使用生成器函数 (Generator Function)

立即学习Python免费学习笔记(深入)”;

这是我个人最推荐的方式。生成器不会一次性将所有子列表都创建并存储在内存中,而是根据需要逐个生成,这对于处理海量数据时尤其重要。

def chunk_list_fixed_size(data_list, chunk_size):
    """
    将列表按固定大小切分成多个子列表。
    例如: [1,2,3,4,5,6,7], chunk_size=3 -> [[1,2,3], [4,5,6], [7]]
    """
    if chunk_size <= 0:
        raise ValueError("切块大小必须是正整数。")
    if not data_list: # 处理空列表情况
        return

    for i in range(0, len(data_list), chunk_size):
        yield data_list[i:i + chunk_size]

# 示例:
my_long_list = list(range(1, 26)) # 包含1到25的列表
chunk_size = 5

print(f"原始列表: {my_long_list}")
# 使用生成器,然后转换为列表以便打印查看所有块
fixed_size_chunks = list(chunk_list_fixed_size(my_long_list, chunk_size))
print(f"按固定大小 {chunk_size} 切分后的结果: {fixed_size_chunks}")

# 如果列表长度不是切块大小的整数倍,最后一个子列表会包含剩余元素
my_uneven_list = list(range(1, 11))
chunk_size_uneven = 3
uneven_chunks = list(chunk_list_fixed_size(my_uneven_list, chunk_size_uneven))
print(f"不均分列表 {my_uneven_list} 按 {chunk_size_uneven} 切分: {uneven_chunks}")

为什么推荐生成器? 设想一下,如果你有一个包含数百万甚至数十亿条记录的列表,如果一次性将其全部切分并存储在内存中,很可能会导致内存溢出。生成器则避免了这个问题,它只在迭代时计算并返回下一个子列表,极大地优化了内存使用。在我自己的实践中,处理日志文件、数据库查询结果等场景时,生成器模式是我的首选。

2. 使用列表推导式 (List Comprehension)

对于列表较小,或者你确实需要一次性得到所有子列表的场景,列表推导式也是一个简洁明了的选择。

def chunk_list_comprehension(data_list, chunk_size):
    """
    使用列表推导式按固定大小切分列表。
    """
    if chunk_size <= 0:
        raise ValueError("切块大小必须是正整数。")
    if not data_list:
        return [] # 返回空列表

    return [data_list[i:i + chunk_size] for i in range(0, len(data_list), chunk_size)]

# 示例:
my_list_small = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
chunk_size_small = 2
comprehension_chunks = chunk_list_comprehension(my_list_small, chunk_size_small)
print(f"使用列表推导式切分 {my_list_small} 按 {chunk_size_small}: {comprehension_chunks}")

列表推导式的优点在于其简洁性,一行代码就能完成任务。但缺点也显而易见:它会立即创建并返回一个包含所有子列表的新列表,如果原始列表非常大,这可能会带来内存开销。所以,选择哪种方法,真的要看你的具体需求和数据规模。

如何将Python列表动态地分成N个子列表?

有时候,我们不是关心每个子列表的大小,而是希望将一个列表精确地分成指定数量(N)的子列表。在这种情况下,每个子列表的大小可能会略有不同,因为总元素数量不一定能被N整除。我的处理策略通常是尽可能地均匀分配,将剩余的元素从头开始逐一分给前面的子列表。

def split_into_n_sublists(data_list, n_sublists):
    """
    将列表动态地分成N个子列表。
    例如: [1..25], n=4 -> [[1..7], [8..14], [15..20], [21..25]] (近似均匀分配)
    """
    if n_sublists <= 0:
        raise ValueError("子列表数量N必须是正整数。")
    if not data_list:
        return [[] for _ in range(n_sublists)] # 如果原列表为空,返回N个空列表

    list_len = len(data_list)
    avg_chunk_size = list_len // n_sublists # 平均每个子列表的元素数量
    remainder = list_len % n_sublists     # 剩余的元素数量

    result = []
    current_index = 0
    for i in range(n_sublists):
        # 前 'remainder' 个子列表会多一个元素
        chunk_size = avg_chunk_size + (1 if i < remainder else 0)
        result.append(data_list[current_index : current_index + chunk_size])
        current_index += chunk_size
    return result

# 示例:
my_data = list(range(1, 26)) # 25个元素
num_parts = 4

print(f"原始列表: {my_data}")
n_split_chunks = split_into_n_sublists(my_data, num_parts)
print(f"分成 {num_parts} 个子列表的结果: {n_split_chunks}")

# 另一个例子:
my_data_small = ['a', 'b', 'c', 'd', 'e']
num_parts_small = 3
n_split_small = split_into_n_sublists(my_data_small, num_parts_small)
print(f"分成 {num_parts_small} 个子列表的结果: {n_split_small}")

这种方法在需要将任务分配给固定数量的工作者(例如,线程池或进程池)时非常有用。每个工作者可以处理一个子列表,从而实现负载均衡。在我看来,这种动态分配的逻辑比固定大小切分稍微复杂一点,但它解决了另一类非常实际的问题。

Python列表切分时,如何处理剩余元素或不均分情况?

处理列表切分中的剩余元素或不均分情况,其实是策略选择的问题。这没有绝对的“正确”答案,完全取决于你的业务逻辑和下游处理的需求。在我的经验里,主要有以下几种处理策略:

1. 默认处理:让最后一个子列表承担所有剩余元素

魔法映像企业网站管理系统
魔法映像企业网站管理系统

技术上面应用了三层结构,AJAX框架,URL重写等基础的开发。并用了动软的代码生成器及数据访问类,加进了一些自己用到的小功能,算是整理了一些自己的操作类。系统设计上面说不出用什么模式,大体设计是后台分两级分类,设置好一级之后,再设置二级并选择栏目类型,如内容,列表,上传文件,新窗口等。这样就可以生成无限多个二级分类,也就是网站栏目。对于扩展性来说,如果有新的需求可以直接加一个栏目类型并新加功能操作

下载

这是最常见也是最简单的处理方式,前面提到的固定大小切分(无论是生成器还是列表推导式)默认就是这种行为。

my_list_remainder = [10, 20, 30, 40, 50, 60, 70]
chunk_size_rem = 3
# 结果会是 [[10, 20, 30], [40, 50, 60], [70]]
# 最后一个子列表 [70] 包含了剩余的元素

何时使用? 当你对每个子列表的大小没有严格要求,或者最后一个子列表大小不一致不会影响后续处理时,这种方式最省心。比如,你只是想把一个大文件按行切分,每N行一个块,最后几行自然就成了最后一个块。

2. 尽可能均匀分配剩余元素

这正是前面“分成N个子列表”方法所采用的策略。它试图让所有子列表的大小尽可能接近,将剩余元素从列表的开头开始,逐一分配给前面的子列表。

# 参见上面 `split_into_n_sublists` 函数的例子

何时使用? 当你需要将任务或数据均匀地分配给固定数量的消费者时,例如在分布式系统中,你希望每个节点处理的数据量大致相同,以避免某个节点成为瓶颈。这种策略能够带来更好的负载均衡。

3. 丢弃不足一个完整块的剩余元素

在某些特定场景下,如果剩余的元素不足以构成一个完整的块,你可能希望直接丢弃它们。这在批量处理或要求严格固定批次大小的机器学习任务中可能会出现。

def chunk_and_discard_remainder(data_list, chunk_size):
    """
    将列表按固定大小切分,丢弃不足一个完整块的剩余元素。
    例如: [1..7], chunk_size=3 -> [[1,2,3], [4,5,6]] (7被丢弃)
    """
    if chunk_size <= 0:
        raise ValueError("切块大小必须是正整数。")
    if not data_list:
        return []

    num_full_chunks = len(data_list) // chunk_size
    for i in range(num_full_chunks):
        yield data_list[i * chunk_size : (i + 1) * chunk_size]

# 示例:
my_data_to_discard = list(range(1, 8)) # 7个元素
chunk_size_discard = 3
discarded_chunks = list(chunk_and_discard_remainder(my_data_to_discard, chunk_size_discard))
print(f"原始列表 {my_data_to_discard} 按 {chunk_size_discard} 切分并丢弃剩余: {discarded_chunks}")

何时使用? 当你的下游系统或算法对输入数据的批次大小有严格要求,不允许出现部分批次时。例如,一个模型训练的批次大小必须是32,那么不足32的最后几个样本可能就需要被丢弃,或者进行填充。

4. 填充剩余元素以达到固定大小

如果所有子列表都 必须 是相同的大小,即使这意味着需要添加一些占位符(填充值)。

from itertools import zip_longest

def chunk_and_pad(data_list, chunk_size, fillvalue=None):
    """
    将列表按固定大小切分,并用指定值填充最后一个子列表,使其达到固定大小。
    例如: [1,2,3,4,5,6,7], chunk_size=3, fillvalue=0 -> [[1,2,3], [4,5,6], [7,0,0]]
    """
    if chunk_size <= 0:
        raise ValueError("切块大小必须是正整数。")
    if not data_list:
        return [[fillvalue] * chunk_size for _ in range(0)] # 考虑如何处理空列表

    # 计算需要填充多少个元素
    remainder = len(data_list) % chunk_size
    padding_needed = 0 if remainder == 0 else chunk_size - remainder

    padded_data = data_list + [fillvalue] * padding_needed

    return [padded_data[i:i + chunk_size] for i in range(0, len(padded_data), chunk_size)]

# 示例:
my_data_to_pad = list(range(1, 8)) # 7个元素
chunk_size_pad = 3
padded_chunks = chunk_and_pad(my_data_to_pad, chunk_size_pad, fillvalue=0)
print(f"原始列表 {my_data_to_pad} 按 {chunk_size_pad} 切分并用0填充: {padded_chunks}")

何时使用? 同样是在机器学习或信号处理等领域,当输入张量或数组必须具有固定维度时。填充可以确保所有批次都符合模型的输入要求。

在我看来,选择哪种处理剩余元素的策略,最终还是归结于你对数据完整性、处理效率和下游系统兼容性的权衡。没有银弹,只有最适合你当前场景的方案。在实际开发中,我通常会先明确这些需求,再选择对应的切分函数。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

708

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

625

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

736

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

616

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1235

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

573

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

695

2023.08.11

ip地址修改教程大全
ip地址修改教程大全

本专题整合了ip地址修改教程大全,阅读下面的文章自行寻找合适的解决教程。

27

2025.12.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.5万人学习

SciPy 教程
SciPy 教程

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号