如何使用Python处理日志？logging模块配置-Python教程-PHP中文网

python处理日志的核心工具是其内置的logging模块，它提供了一套全面且高度可配置的日志管理框架。logging模块包含四个核心组件：logger负责产生日志；handler决定日志输出位置；formatter定义日志格式；filter控制日志内容过滤。相比print语句，logging支持多级日志分类（debug、info、warning、error、critical），具备线程安全机制，适用于多线程和异步环境。此外，logging模块提供了多种内置handler，如streamhandler（输出到控制台）、filehandler（写入文件）、rotatingfilehandler（按大小轮转）和timedrotatingfilehandler（按时间轮转），甚至支持发送日志至邮件或http服务器。为适应不同场景，开发者可通过getlogger(__name__)实现模块化日志记录，并利用父子logger继承关系进行统一管理。在复杂项目中推荐使用dictconfig方式，通过字典结构从配置文件加载日志设置，实现配置与代码分离。实际使用时需避免过度日志记录、防止敏感信息泄露、合理使用logger.exception()获取堆栈信息，并考虑采用结构化日志（如json格式）提升日志分析效率。高并发环境下还可引入异步日志机制以优化性能。

如何使用Python处理日志？logging模块配置

Python处理日志的核心利器无疑是其内置的logging模块。它提供了一套全面且高度可配置的框架，让你能够精细地控制日志的输出目的地、格式和级别，远比简单的print语句强大和灵活。

解决方案

使用Python的logging模块来处理日志，通常涉及几个核心概念：Logger（记录器）、Handler（处理器）、Formatter（格式化器）和Filter（过滤器）。最简单的入门方式是使用logging.basicConfig()进行快速配置，但这在实际项目中往往不够用。

import logging
import os

# 1. 基础配置：快速启动，但全局生效，不推荐在复杂应用中使用
# logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
# logging.info("这是一个通过basicConfig记录的信息。")

# 2. 更推荐的方式：获取Logger实例，并配置Handler和Formatter

# 创建一个Logger实例
# 通常推荐使用 __name__ 作为logger的名字，这样可以根据模块名区分日志来源
logger = logging.getLogger(__name__) 
logger.setLevel(logging.DEBUG) # 设置Logger的最低处理级别，低于此级别的日志不会被处理

# 创建一个FileHandler，用于将日志写入文件
log_file_path = 'my_application.log'
# 确保日志文件目录存在，这是个小细节，但实际开发中经常被忽略
os.makedirs(os.path.dirname(log_file_path) or '.', exist_ok=True) 
file_handler = logging.FileHandler(log_file_path, encoding='utf-8')
file_handler.setLevel(logging.INFO) # 设置FileHandler的最低处理级别

# 创建一个StreamHandler，用于将日志输出到控制台
console_handler = logging.StreamHandler()
console_handler.setLevel(logging.DEBUG) # 设置StreamHandler的最低处理级别

# 创建一个Formatter，定义日志的输出格式
# %(asctime)s: 日志时间
# %(name)s: Logger的名称
# %(levelname)s: 日志级别
# %(message)s: 日志内容
# %(filename)s: 产生日志的文件名
# %(lineno)d: 产生日志的代码行号
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(filename)s:%(lineno)d - %(message)s')

# 为Handler设置Formatter
file_handler.setFormatter(formatter)
console_handler.setFormatter(formatter)

# 将Handler添加到Logger
# 避免重复添加Handler，这在多次调用getLogger时可能发生
if not logger.handlers:
    logger.addHandler(file_handler)
    logger.addHandler(console_handler)

# 记录不同级别的日志
logger.debug("这是一条调试信息。")
logger.info("这是一条普通信息。")
logger.warning("这是一条警告信息。")
logger.error("这是一条错误信息。")
logger.critical("这是一条严重错误信息。")

try:
    result = 1 / 0
except ZeroDivisionError:
    logger.exception("发生了一个除零错误！") # exception() 会自动记录堆栈信息

登录后复制

这段代码展示了如何手动配置一个Logger，使其同时将日志输出到文件和控制台，并对不同输出目标设置不同的日志级别。这种模块化的方式让日志管理变得非常灵活。

立即学习“Python免费学习笔记（深入）”；

为什么Python的logging模块是日志处理的明智之选？

我个人觉得，logging模块之所以成为Python日志处理的“不二之选”，绝不仅仅是因为它是内置的。它提供的那种结构化、分层的日志记录能力，是print语句永远无法比拟的。想象一下，如果你的应用部署上线了，你还靠print来调试，那简直是噩梦。logging模块最吸引人的地方在于它的高度可配置性，以及对生产环境的友好度。

首先，级别管理。从DEBUG到CRITICAL，它定义了明确的日志优先级，这让开发者可以根据部署环境（开发、测试、生产）动态调整日志输出的粒度。开发时我可能需要DEBUG级别的详细信息，但生产环境只需要INFO或更高级别的关键事件，避免日志文件爆炸。

其次，是输出目标的多样性。它不只是能打到控制台或文件。logging模块内置了多种Handler，比如StreamHandler（控制台）、FileHandler（文件）、RotatingFileHandler（按大小或时间轮转文件）、TimedRotatingFileHandler（按时间轮转文件），甚至还有SMTPHandler（邮件通知）、HTTPHandler（发送到HTTP服务器）等等。这意味着你的日志可以根据需求被发送到任何地方，而无需改动业务代码。这简直是架构师的福音，让日志收集和监控变得异常简单。

再者，模块化和可扩展性。logging模块的设计理念是组件化。Logger负责发出日志，Handler负责处理日志，Formatter负责格式化日志，Filter负责过滤日志。这种解耦让你可以根据需要组合这些组件，甚至可以自定义Handler或Formatter来满足特殊需求。比如，我想把日志格式化成JSON，或者想把日志发送到Kafka，这些都可以通过自定义Handler或Formatter来实现，而不需要修改核心的业务逻辑。

最后，不得不提的是它的线程安全。在多线程或异步应用中，日志记录的并发访问是个大问题。logging模块内部已经考虑了这些，大部分Handler都是线程安全的，这省去了开发者自己处理锁的麻烦，让你可以放心地在并发环境中记录日志。这些特性加起来，让logging模块不仅仅是一个日志工具，更是一个强大的日志管理系统。

如何根据应用场景灵活配置Python日志系统？

实际应用中，日志的需求远比“打个Log”复杂。灵活配置logging模块，就是为了应对这些多变的需求。我发现，最常见的场景就是：生产环境日志需要轮转、需要分模块记录，或者需要同时输出到多个地方。

1. 日志文件轮转（Log Rotation）

生产环境日志文件如果一直写下去，很快就会撑爆磁盘。logging模块提供了RotatingFileHandler和TimedRotatingFileHandler来解决这个问题。

按大小轮转：RotatingFileHandler 当日志文件达到指定大小时，它会自动关闭当前文件，并重命名，然后创建新的日志文件。
```
from logging.handlers import RotatingFileHandler

# ... (前面的logger和formatter定义不变)

# 每天最大5MB，保留3个备份文件
rotate_handler = RotatingFileHandler(
    'app_size_rotated.log', maxBytes=5 * 1024 * 1024, backupCount=3, encoding='utf-8'
)
rotate_handler.setLevel(logging.INFO)
rotate_handler.setFormatter(formatter)
logger.addHandler(rotate_handler)
```
登录后复制
这样，当app_size_rotated.log达到5MB时，它会被重命名为app_size_rotated.log.1，如果app_size_rotated.log.1已经存在，则会变成app_size_rotated.log.2，以此类推，直到达到backupCount。

按时间轮转：TimedRotatingFileHandler 这种更常用，特别是对于需要按天或按小时归档日志的场景。

from logging.handlers import TimedRotatingFileHandler

# ... (前面的logger和formatter定义不变)

# 每天凌晨轮转，保留7天日志
time_rotate_handler = TimedRotatingFileHandler(
    'app_time_rotated.log', when='midnight', interval=1, backupCount=7, encoding='utf-8'
)
time_rotate_handler.setLevel(logging.INFO)
time_rotate_handler.setFormatter(formatter)
logger.addHandler(time_rotate_handler)

登录后复制

when参数可以设置为'S'（秒）、'M'（分钟）、'H'（小时）、'D'（天）、'midnight'（每天午夜）、'W0'-'W6'（每周特定一天）。

2. 分模块记录日志

在大型项目中，你可能希望不同模块的日志输出到不同的文件，或者有不同的处理方式。这正是logging.getLogger(__name__)的威力所在。

# module_a.py
import logging
logger_a = logging.getLogger('my_app.module_a') # 获取特定名称的logger
logger_a.setLevel(logging.DEBUG)
# ... 为logger_a添加其专属的handler和formatter

# module_b.py
import logging
logger_b = logging.getLogger('my_app.module_b')
logger_b.setLevel(logging.INFO)
# ... 为logger_b添加其专属的handler和formatter

登录后复制

通过这种方式，你可以为my_app.module_a和my_app.module_b配置独立的Handler，甚至可以设置父子Logger的继承关系，让子Logger的日志也能被父Logger的Handler处理。这种分层管理，让日志追踪和问题定位变得异常清晰。

3. 配置字典（DictConfig）

当配置变得复杂时，直接在代码中写Handler和Formatter会显得臃肿且难以维护。logging.config.dictConfig允许你通过一个Python字典来配置整个日志系统，这通常是从配置文件（如YAML或JSON）加载而来。

import logging.config

LOGGING_CONFIG = {
    'version': 1,
    'disable_existing_loggers': False, # 关键：不禁用已存在的logger，允许在代码中获取并使用
    'formatters': {
        'standard': {
            'format': '%(asctime)s - %(name)s - %(levelname)s - %(filename)s:%(lineno)d - %(message)s'
        },
        'json_formatter': {
            'format': '{"time": "%(asctime)s", "name": "%(name)s", "level": "%(levelname)s", "message": "%(message)s"}',
            # 实际生产中会用更专业的json formatter库
        }
    },
    'handlers': {
        'console': {
            'level': 'DEBUG',
            'class': 'logging.StreamHandler',
            'formatter': 'standard'
        },
        'file_info': {
            'level': 'INFO',
            'class': 'logging.handlers.TimedRotatingFileHandler',
            'filename': 'logs/app_info.log',
            'when': 'midnight',
            'interval': 1,
            'backupCount': 7,
            'encoding': 'utf-8',
            'formatter': 'standard'
        },
        'file_error': {
            'level': 'ERROR',
            'class': 'logging.handlers.RotatingFileHandler',
            'filename': 'logs/app_error.log',
            'maxBytes': 10 * 1024 * 1024,
            'backupCount': 5,
            'encoding': 'utf-8',
            'formatter': 'json_formatter' # 错误日志可能希望是JSON格式
        }
    },
    'loggers': {
        '': {  # 根logger
            'handlers': ['console', 'file_info'],
            'level': 'INFO',
            'propagate': False # 阻止日志向上级logger传递
        },
        'my_app.module_a': {
            'handlers': ['console', 'file_info', 'file_error'],
            'level': 'DEBUG',
            'propagate': False
        },
        'my_app.module_b': {
            'handlers': ['file_info'],
            'level': 'WARNING',
            'propagate': False
        }
    },
    'root': { # 根logger的另一种配置方式，与''等价
        'handlers': ['console', 'file_info'],
        'level': 'INFO'
    }
}

try:
    os.makedirs('logs', exist_ok=True) # 确保日志目录存在
    logging.config.dictConfig(LOGGING_CONFIG)
except Exception as e:
    print(f"Error loading logging configuration: {e}") # 紧急打印错误

logger_main = logging.getLogger(__name__)
logger_module_a = logging.getLogger('my_app.module_a')
logger_module_b = logging.getLogger('my_app.module_b')

logger_main.info("主应用启动信息")
logger_module_a.debug("模块A的调试信息")
logger_module_a.error("模块A的错误信息")
logger_module_b.warning("模块B的警告信息")

登录后复制

这种字典配置方式让日志配置与代码分离，更易于管理和部署。在大型项目中，我几乎都会采用这种方式。

Python日志处理：避开常见陷阱与提升效率的实战经验

即便logging模块功能强大，但在实际使用中，还是有一些“坑”和一些可以提升效率的“小技巧”，这些都是我踩过坑后总结出来的。

1. 避免过度日志记录，尤其在生产环境

这是最常见也最容易犯的错误。开发阶段为了调试，可能把所有日志都设为DEBUG。但部署到生产环境后，如果忘记调整，海量的DEBUG日志不仅会迅速填满磁盘，还会严重拖慢应用性能。日志记录本身是有开销的，特别是I/O操作。我的建议是，生产环境通常只开启INFO、WARNING、ERROR和CRITICAL级别。DEBUG日志只在必要时，通过配置动态开启。

2. 警惕敏感信息泄露

日志中常常会不经意间记录下用户的密码、API密钥、个人身份信息等敏感数据。这在数据安全和合规性方面是绝对不允许的。务必在记录日志前对这些信息进行脱敏或加密处理。比如，记录用户注册信息时，只记录用户名和注册时间，密码等敏感字段一律不记录。这需要开发者在编写日志语句时有很强的安全意识。

3. 合理使用logger.exception()

当捕获到异常时，使用logger.exception()而不是logger.error()或logger.critical()，因为它会自动包含完整的堆栈跟踪信息。这对于快速定位问题至关重要。

try:
    value = int("abc")
except ValueError:
    logger.exception("类型转换错误发生！") # 会自动打印完整的调用栈

登录后复制

而如果只用logger.error("类型转换错误！")，你就得不到关键的堆栈信息了。

4. 异步日志记录的考量

在高并发或对性能要求极高的应用中，同步的日志写入可能会成为瓶颈。虽然logging模块内部的Handler大部分是线程安全的，但I/O操作仍然是阻塞的。这时，可以考虑使用异步日志记录，比如将日志事件放入队列，然后由独立的线程或进程从队列中取出并写入。Python标准库没有内置的异步Handler，但你可以自己实现，或者使用一些第三方库（如loguru或structlog，它们通常提供了更高级的特性）。不过，对于大多数应用来说，内置的Handler已经足够。

5. 结构化日志的重要性

传统的日志格式（如%(asctime)s - %(name)s - %(levelname)s - %(message)s）虽然人类可读，但对于机器解析和集中式日志管理系统（如ELK Stack、Splunk）来说，效率低下。现在主流的做法是使用结构化日志，最常见的就是JSON格式。

import json

class JsonFormatter(logging.Formatter):
    def format(self, record):
        log_record = {
            "timestamp": self.formatTime(record, self.datefmt),
            "level": record.levelname,
            "logger_name": record.name,
            "message": record.getMessage(),
            "file": record.filename,
            "line": record.lineno
        }
        if record.exc_info:
            log_record["exception"] = self.formatException(record.exc_info)
        return json.dumps(log_record, ensure_ascii=False)

# ... (在logging.config.dictConfig或手动配置时，使用这个JsonFormatter)
# formatter = JsonFormatter()

登录后复制

将日志输出为JSON，可以极大地方便日志的搜索、过滤、聚合和分析，是现代微服务架构中非常推荐的做法。虽然需要一些额外配置，但长期来看，收益巨大。

总的来说，logging模块是Python开发者处理日志的基石。掌握它的配置和使用，并结合一些最佳实践，能够让你的应用在可观测性上迈上一个大台阶。

以上就是如何使用Python处理日志？logging模块配置的详细内容，更多请关注php中文网其它相关文章！