SLURM教程：并行运行Python脚本处理多个文件

霞舞

发布时间：2025-09-23 17:53:01

960人浏览过

来源于php中文网

原创

slurm教程：并行运行python脚本处理多个文件

本文档旨在指导用户如何在SLURM环境下，并行运行同一个Python脚本处理多个输入文件。我们将详细解释如何配置SLURM脚本，以及如何使用srun命令有效地分配任务到多个节点，从而实现高效的并行处理。此外，我们还会简要介绍SLURM作业数组，作为另一种可选的解决方案。

理解SLURM任务分配

在使用SLURM时，理解任务分配至关重要。以下是几个关键参数的解释：

--nodes: 指定请求的节点数量。每个节点拥有的CPU数量取决于集群配置。
--ntasks: 指定请求的总任务数量。
--ntasks-per-node: 指定每个节点上运行的最大任务数量。如果指定了--ntasks，则此参数表示每个节点的最大任务数；否则，表示每个节点的精确任务数。

如果已知每个节点的CPU数量，建议使用--ntasks和--cpus-per-task，避免过度订阅节点，从而影响性能。

使用srun进行并行执行

srun命令用于在SLURM分配的资源上立即运行任务。在sbatch脚本中，srun允许用户利用已分配的资源执行并行任务。

立即学习“Python免费学习笔记（深入）”；

以下是一个示例SLURM脚本，展示了如何使用srun并行处理多个文件：

#!/bin/bash
#SBATCH --nodes=8
#SBATCH --ntasks-per-node=128

INPUT_DIR='path/to/input/dir'
OUTPUT_DIR='/path/to/output/dir'

# 读取文件名到数组
INPUT_STEMS_FILE='/some/path/to/list/of/inputs.txt'
INPUT_STEMS=()
while IFS= read -r line; do
  INPUT_STEMS+=("$line")
done < <(tr -d '\r' < INPUT_STEMS_FILE)

for j in `seq 0 $(( ${#INPUT_STEMS[@]} - 1 ))`; do
  # 循环处理每个文件

  # 轮询分配节点 (0, 1, ..., 7, 0, 1, ...)
  NODE_NUMBER=$((j % SLURM_NNODES))

  # 动态生成文件名
  INPUT_FILE_NAME="$INPUT_DIR/${INPUT_STEMS[$j]}.txt"
  OUTPUT_FILE_NAME="$OUTPUT_DIR/${INPUT_STEMS[$j]}.txt"

  # 在指定节点上运行任务
  srun -N1 -n1 -w ${SLURM_NODELIST} --nodelist=$(hostname -s)$NODE_NUMBER python_script.py --input "$INPUT_FILE_NAME" > "$OUTPUT_FILE_NAME" &
done

wait

代码解释：

Python概述中文WORD版

本文档主要讲述的是Python概述；Python 对操作系统服务的内置接口，使其成为编写可移植的维护操作系统的管理工具和部件（有时也被称为Shell 工具）的理想工具。Python 程序可以搜索文件和目录树，可以运行其他程序，用进程或线程进行并行处理等等。希望本文档会给有需要的朋友带来帮助；感兴趣的朋友可以过来看看

下载

#SBATCH 指令: 设置SLURM作业的资源需求，包括节点数量和每个节点的任务数。
文件名读取: 从文件中读取输入文件名，存储到数组INPUT_STEMS中。
循环处理: 使用for循环遍历每个输入文件。
轮询节点分配: 使用取模运算(%)将任务轮询分配到各个节点。SLURM_NNODES是SLURM提供的环境变量，表示分配的节点总数。
动态文件名生成: 根据循环索引和输入目录，动态生成输入和输出文件名。
srun 命令:
- -N1 -n1: 指定每个任务使用1个节点和1个核心。
- -w ${SLURM_NODELIST}: 确保任务仅在分配的节点上运行。
- --nodelist=$(hostname -s)$NODE_NUMBER: 指定任务运行的具体节点。hostname -s 获取当前节点的主机名，然后添加轮询分配的节点编号。
- python_script.py --input "$INPUT_FILE_NAME" > "$OUTPUT_FILE_NAME": 运行Python脚本，并将输出重定向到输出文件。
- &: 将任务放入后台运行，实现并行执行。
wait 命令: 等待所有后台任务完成。

注意事项：

确保INPUT_DIR、OUTPUT_DIR和INPUT_STEMS_FILE变量设置为正确的值。
根据实际情况调整--nodes和--ntasks-per-node参数。
python_script.py 脚本需要能够处理单个输入文件，并生成相应的输出文件。
--nodelist参数可能需要根据集群的具体配置进行调整。

SLURM作业数组

SLURM作业数组是另一种并行执行任务的方法。它允许用户提交一个作业，该作业会被分解成多个独立的子作业，每个子作业处理不同的输入。

示例：

#!/bin/bash
#SBATCH --array=0-999

INPUT_DIR='path/to/input/dir'
OUTPUT_DIR='/path/to/output/dir'

INPUT_STEMS_FILE='/some/path/to/list/of/inputs.txt'

# Read the file names into an array
INPUT_STEMS=()
while IFS= read -r line; do
  INPUT_STEMS+=("$line")
done < <(tr -d '\r' < INPUT_STEMS_FILE)

TASK_ID=$SLURM_ARRAY_TASK_ID

INPUT_FILE_NAME="$INPUT_DIR/${INPUT_STEMS[$TASK_ID]}.txt"
OUTPUT_FILE_NAME="$OUTPUT_DIR/${INPUT_STEMS[$TASK_ID]}.txt"

python_script.py --input "$INPUT_FILE_NAME" > "$OUTPUT_FILE_NAME"

代码解释：

#SBATCH --array=0-999: 创建一个包含1000个子作业的作业数组，索引从0到999。
$SLURM_ARRAY_TASK_ID: SLURM提供的环境变量，表示当前子作业的索引。
动态文件名生成: 根据$SLURM_ARRAY_TASK_ID动态生成输入和输出文件名。
运行Python脚本: 运行Python脚本，处理对应的输入文件。

选择哪种方法？

如果需要更精细地控制任务分配到哪些节点，或者需要在任务之间进行通信，则使用srun方法。
如果任务是完全独立的，并且不需要复杂的任务分配，则使用作业数组。

总结

本文档介绍了两种在SLURM环境下并行运行Python脚本处理多个文件的方法：使用srun和使用作业数组。选择哪种方法取决于具体的应用场景和需求。理解SLURM的任务分配机制，并根据实际情况调整脚本参数，可以有效地提高并行处理的效率。记住根据你的集群配置调整节点和任务数量，并仔细检查文件路径，以确保脚本正确运行。

Python类型注解教程_提升代码可读性与规范性

PythonAI学习路线教程_普通程序员转型AI完整路径

Python如何调用rar命令

PythonAI实战导向教程_不学理论也能做项目

Python推导式高效使用_列表集合解析【指导】

相关专题

python开发工具

php中文网为大家提供各种python开发工具，好的开发工具，可帮助开发者攻克编程学习中的基础障碍，理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容，供大家免费下载使用。

744

2023.06.15

python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章，大家可以免费的下载体验。

634

2023.07.20

python能做什么

python能做的有：可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

757

2023.07.25

format在python中的用法

Python中的format是一种字符串格式化方法，用于将变量或值插入到字符串中的占位符位置。通过format方法，我们可以动态地构建字符串，使其包含不同值。php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

617

2023.07.31

python教程

Python已成为一门网红语言，即使是在非编程开发者当中，也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章，大家可以免费体验学习。

1259

2023.08.03

python环境变量的配置

Python是一种流行的编程语言，被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后，我们需要配置环境变量，以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

547

2023.08.04

python eval

eval函数是Python中一个非常强大的函数，它可以将字符串作为Python代码进行执行，实现动态编程的效果。然而，由于其潜在的安全风险和性能问题，需要谨慎使用。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别

scratch和python的区别：1、scratch是一种专为初学者设计的图形化编程语言，python是一种文本编程语言；2、scratch使用的是基于积木的编程语法，python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容，供大家免费下载体验。

705

2023.08.11