0

0

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

碧海醫心

碧海醫心

发布时间:2025-01-07 11:35:54

|

904人浏览过

|

来源于php中文网

原创

处理 aws lambda 持续增长的错误率需要对错误进行分类并定义升级路径。本指南介绍如何利用 aws systems manager 事件管理器有效地自动化事件处理和升级。此工作流程包含使用 runbook 收集错误详细信息,并通过 amazon sns 通知相关人员。

为何选择 AWS Systems Manager 事件管理器?

AWS Systems Manager 事件管理器为 AWS 环境中的事件响应提供集中管理。主要优势包括:

  1. 原生 AWS 集成: 与 Amazon CloudWatch、AWS Lambda 和 Amazon EventBridge 等服务无缝集成。
  2. Runbook 自动化: 支持自动化或半自动化工作流程来排查问题和解决事件。
  3. 多渠道通知: 支持通过 Amazon SNS、Slack 和 Amazon Chime 发送通知。
  4. 成本效益: 对于中小型环境而言,是商业解决方案的理想替代方案。

局限性

对于需要详细报告、复杂团队层级和多级升级流程的大型组织,PagerDuty 或 ServiceNow 等专用工具可能更适合。

架构概述

该架构使用 CloudWatch 警报监控 AWS Lambda 函数的错误。事件管理器自动创建事件并执行 Runbook 以处理错误和发送通知。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

错误场景

  • 错误 A: 标准事件,带有电子邮件通知。
  • 错误 B: 严重事件,需要短信通知和升级。

CloudWatch 警报配置区分这些错误类型,从而触发相应的事件响应。

分步配置

步骤 1:为 Lambda 错误创建 CloudWatch 警报

Lambda 函数示例:

import logging

logger = logging.getLogger()
logger.setLevel(logging.INFO)

def lambda_handler(event, context):
    error_type = event.get("errortype")

    try:
        if error_type == "a":
            logger.error("错误 A:发生标准异常。")
            raise Exception("发生错误 A")
        elif error_type == "b":
            logger.error("错误 B:发生严重运行时错误。")
            raise RuntimeError("发生严重错误 B")
        else:
            logger.info("未触发错误。")
            return {"statusCode": 200, "body": "成功"}
    except Exception as e:
        logger.exception("发生错误:%s", e)
        raise

配置 CloudWatch 指标和警报:

  1. 指标过滤器: 为错误 A 和错误 B 创建过滤器。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

  1. 警报: 将这些过滤器与具有适当阈值和周期的警报关联。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

  1. 警报操作: 设置触发器以启动事件管理器工作流程。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

步骤 2:设置事件管理器

  1. 启用事件管理器: 在 AWS 管理控制台中导航到事件管理器设置并加入您的账户。

步骤 3:配置通知联系人

BlackBox AI
BlackBox AI

AI编程助手,智能对话问答助手

下载
  • 电子邮件: 通知管理员错误 A。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

  • 短信: 通知相关人员错误 B 升级。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

步骤 4:定义升级计划

  • 错误 A: 如果未解决,首先发送电子邮件通知,然后发送短信。
  • 错误 B: 立即发送短信通知。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

步骤 5:创建操作手册

运行手册模板:

{
  "schemaVersion": "0.3",
  "description": "Lambda 错误处理的运行手册。",
  "parameters": {
    "AlarmName": {
      "type": "String",
      "description": "CloudWatch 警报的名称"
    },
    "snsTopicArn": {
      "type": "String",
      "description": "用于通知的 SNS 主题 ARN"
    }
  },
  "mainSteps": [
    {
      "name": "GatherErrorLogs",
      "action": "aws:executeScript",
      "inputs": {
        "Runtime": "python3.8",
        "Script": `
          def script_handler(events, context):
              return {"status": "已收集日志"}
        `
      }
    },
    {
      "name": "SendNotification",
      "action": "aws:executeAwsApi",
      "inputs": {
        "Service": "sns",
        "Api": "Publish",
        "TopicArn": "{{ snsTopicArn }}",
        "Message": "已检测到 Lambda 错误。警报名称:{{ AlarmName }}"
      }
    }
  ]
}

步骤 6:制定响应计划

  • 为错误 A 和错误 B 定义单独的响应计划。
  • 将运行手册和通知渠道链接到每个响应计划。

步骤 7:将 CloudWatch 警报链接到事件管理器

  • 编辑警报操作以触发相应的事件管理器响应计划。

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

演示

掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应掌握 AWS 事件管理:使用 Systems Manager 事件管理器自动响应

商业工具比较

功能 AWS 事件管理器 PagerDuty ServiceNow
成本效益
AWS 集成 无缝 有限 有限
升级灵活性 中等
报告和分析 基础 高级 高级

AWS 事件管理器的理想用例:

  • 具有以 AWS 为中心的架构的中小型环境。
  • 简单的升级和通知需求。
  • 成本敏感的部署。

结论

AWS Systems Manager 事件管理器是经济高效的工具,用于在以 AWS 为中心的 环境中进行事件响应。虽然它缺少一些商业解决方案的高级功能,但它提供了与 AWS 服务的强大集成以及许多用例都足够的功能。它易于设置且成本低廉,使其成为中小型运营的有吸引力的选择。

参考

  • AWS Systems Manager 事件管理器
  • AWS Lambda 监控
  • Amazon CloudWatch 警报
  • PagerDuty
  • ServiceNow

所有图片链接保持不变。 对文本进行了同义词替换、句子结构调整等伪原创处理,确保文章大意不变。

相关专题

更多
lambda表达式
lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式,它可以在需要函数作为参数的地方使用,并提供了一种更简洁、更灵活的编码方式,其语法为“lambda 参数列表: 表达式”,参数列表是函数的参数,可以包含一个或多个参数,用逗号分隔,表达式是函数的执行体,用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容,供大家免费下载体验。

204

2023.09.15

python lambda函数
python lambda函数

本专题整合了python lambda函数用法详解,阅读专题下面的文章了解更多详细内容。

190

2025.11.08

Python lambda详解
Python lambda详解

本专题整合了Python lambda函数相关教程,阅读下面的文章了解更多详细内容。

47

2026.01.05

PHP 命令行脚本与自动化任务开发
PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境(CLI)下的开发与应用,内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理,以及与 Linux 定时任务(Cron)的结合使用。通过实战示例,帮助开发者掌握使用 PHP 构建 自动化脚本、批处理工具与后台任务程序 的能力。

28

2025.12.13

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

8

2026.01.15

公务员递补名单公布时间 公务员递补要求
公务员递补名单公布时间 公务员递补要求

公务员递补名单公布时间不固定,通常在面试前,由招录单位(如国家知识产权局、海关等)发布,依据是原入围考生放弃资格,会按笔试成绩从高到低递补,递补考生需按公告要求限时确认并提交材料,及时参加面试/体检等后续环节。要求核心是按招录单位公告及时响应、提交材料(确认书、资格复审材料)并准时参加面试。

40

2026.01.15

公务员调剂条件 2026调剂公告时间
公务员调剂条件 2026调剂公告时间

(一)符合拟调剂职位所要求的资格条件。 (二)公共科目笔试成绩同时达到拟调剂职位和原报考职位的合格分数线,且考试类别相同。 拟调剂职位设置了专业科目笔试条件的,专业科目笔试成绩还须同时达到合格分数线,且考试类别相同。 (三)未进入原报考职位面试人员名单。

54

2026.01.15

国考成绩查询入口 国考分数公布时间2026
国考成绩查询入口 国考分数公布时间2026

笔试成绩查询入口已开通,考生可登录国家公务员局中央机关及其直属机构2026年度考试录用公务员专题网站http://bm.scs.gov.cn/pp/gkweb/core/web/ui/business/examResult/written_result.html,查询笔试成绩和合格分数线,点击“笔试成绩查询”按钮,凭借身份证及准考证进行查询。

11

2026.01.15

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

65

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.7万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号