0

0

ASP.NET Core中的健康检查是什么?如何配置?

小老鼠

小老鼠

发布时间:2025-09-13 08:44:01

|

1024人浏览过

|

来源于php中文网

原创

ASP.NET Core健康检查用于判断应用及依赖服务是否可正常处理请求,而不仅仅是进程是否运行。通过AddHealthChecks()注册服务,可添加数据库、URL等检查项,并支持自定义检查逻辑。利用MapHealthChecks()将终结点映射到HTTP管道,实现Liveness和Readiness探针区分。通过标签和自定义ResponseWriter可为不同环境定制报告,避免暴露敏感信息。需注意避免检查本身成为性能瓶颈、设置合理超时与缓存、防止假阳性/阴性、限制访问权限,并聚焦关键依赖,确保系统稳定可靠。

asp.net core中的健康检查是什么?如何配置?

ASP.NET Core中的健康检查,简单来说,就是一套内置的机制,用于报告你的应用程序及其所依赖服务的运行状态。它不仅仅是判断你的进程是否还活着,更重要的是,它能告诉你你的应用是否“健康到足以处理请求”,比如数据库连接是否正常、外部API是否可达、磁盘空间是否充足等。这对于部署在容器编排系统(如Kubernetes)或负载均衡器后的微服务架构来说至关重要,因为它们需要根据这些健康报告来决定是否将流量路由到某个实例,或者是否需要重启一个不健康的实例。

在ASP.NET Core中配置健康检查,其实比你想象的要直接。首先,你需要引入必要的NuGet包,主要是

Microsoft.Extensions.Diagnostics.HealthChecks
,如果需要UI,还有
AspNetCore.HealthChecks.UI
及其相关存储包。

基本配置流程:

  1. Program.cs
    中注册健康检查服务:
    builder.Services
    中调用
    AddHealthChecks()

    // Program.cs (Minimal API) 或 Startup.cs (旧版)
    var builder = WebApplication.CreateBuilder(args);
    
    // 注册健康检查服务
    builder.Services.AddHealthChecks();
    
    // ... 其他服务注册
  2. 添加具体的健康检查项:

    AddHealthChecks()
    方法返回一个
    IHealthChecksBuilder
    ,你可以在其上链式调用各种
    Add
    方法来添加具体的检查项。

    • 检查数据库连接 (例如 SQL Server): 你需要安装

      AspNetCore.HealthChecks.SqlServer
      或其他数据库对应的包。

      builder.Services.AddHealthChecks()
          .AddSqlServer(builder.Configuration.GetConnectionString("DefaultConnection"), 
                        name: "SQL Server数据库", 
                        failureStatus: HealthStatus.Degraded, 
                        tags: new[] { "db", "critical" });
    • 检查外部URL的可达性: 你需要安装

      AspNetCore.HealthChecks.Uris

      builder.Services.AddHealthChecks()
          .AddUrlGroup(new Uri("https://api.example.com/status"), 
                       name: "外部API", 
                       failureStatus: HealthStatus.Unhealthy, 
                       tags: new[] { "external", "api" });
    • 自定义健康检查: 如果你需要检查一些非常规的东西,比如一个自定义的缓存状态,你可以实现

      IHealthCheck
      接口。

      // MyCustomHealthCheck.cs
      public class MyCustomHealthCheck : IHealthCheck
      {
          public Task CheckHealthAsync(
              HealthCheckContext context,
              CancellationToken cancellationToken = default)
          {
              // 模拟检查逻辑
              var isHealthy = DateTime.UtcNow.Second % 10 != 0; // 每10秒中有一秒不健康
      
              if (isHealthy)
              {
                  return Task.FromResult(HealthCheckResult.Healthy("自定义服务运行正常。"));
              }
      
              return Task.FromResult(HealthCheckResult.Unhealthy("自定义服务出现问题。"));
          }
      }
      
      // Program.cs
      builder.Services.AddHealthChecks()
          .AddCheck("我的自定义检查", 
                                        failureStatus: HealthStatus.Degraded, 
                                        tags: new[] { "custom" });
  3. 将健康检查终结点映射到HTTP请求管道:

    app
    对象上调用
    MapHealthChecks()

    var app = builder.Build();
    
    // ... 其他中间件配置
    
    // 映射健康检查终结点
    app.MapHealthChecks("/health"); 
    // 你也可以为Liveness和Readiness创建不同的终结点
    app.MapHealthChecks("/health/ready", new HealthCheckOptions { 
        Predicate = healthCheck => healthCheck.Tags.Contains("ready") 
    });
    app.MapHealthChecks("/health/live", new HealthCheckOptions { 
        Predicate = healthCheck => healthCheck.Tags.Contains("live") 
    });
    
    app.Run();

现在,访问

/health
路径,你就能看到一个简单的健康报告。默认情况下,它会返回一个JSON,包含所有注册的检查项的状态。

为什么健康检查不仅仅是“服务还在跑”那么简单?

健康检查远不止是简单地确认你的应用程序进程是否在运行。如果仅仅是这样,那我们直接用操作系统的进程监控工具就好了。ASP.NET Core的健康检查机制,更侧重于深层健康服务可用性

想象一下,你的ASP.NET Core应用进程明明活着,CPU和内存看起来也正常,但它就是无法连接到数据库,或者它所依赖的某个关键第三方API突然抽风了。在这种情况下,虽然你的服务“还在跑”,但它根本无法正常处理用户的请求,对用户来说,它就是“挂了”。如果你的负载均衡器或Kubernetes只知道进程还活着就继续把流量导过来,那只会导致用户看到一堆错误,甚至可能加剧系统压力,造成雪崩效应。

这就是为什么我们需要区分“Liveness”(存活)和“Readiness”(就绪)。

播记
播记

播客shownotes生成器 | 为播客创作者而生

下载
  • Liveness Probe(存活探针)通常只检查应用进程是否还在响应,比如一个简单的HTTP 200。如果失败,Kubernetes可能会重启这个Pod。
  • Readiness Probe(就绪探针)则更进一步,它会检查应用的所有关键依赖是否都已准备就绪,比如数据库连接、消息队列连接、必要的配置是否加载完成等等。只有当所有依赖都OK时,应用才被认为是“就绪”的,负载均衡器或Kubernetes才会开始向它发送流量。

所以,一个好的健康检查策略,是需要深入到应用内部,去探查那些真正影响服务功能的关键组件。它能帮助我们更智能地进行流量管理、故障恢复,避免将用户请求导向一个虽然活着但“病入膏肓”的服务实例。我个人在实践中,就遇到过很多次服务进程活着但功能完全失效的情况,深层健康检查就是那个救星,它能及时发现问题并让编排系统介入处理。

如何为不同环境定制健康检查报告?

为不同的环境(开发、测试、生产)定制健康检查报告,是一个非常实用的需求。你可能不希望在生产环境暴露过多的内部细节,或者在开发环境需要更详细的调试信息。ASP.NET Core的健康检查机制通过标签(Tags)自定义响应写入器(ResponseWriter)提供了很好的灵活性。

  1. 利用标签进行过滤: 在注册健康检查时,你可以给每个检查项添加一个或多个标签。

    builder.Services.AddHealthChecks()
        .AddSqlServer(builder.Configuration.GetConnectionString("DefaultConnection"), 
                      name: "主数据库", 
                      tags: new[] { "db", "production", "critical" }) // 生产环境和关键标签
        .AddUrlGroup(new Uri("http://localhost:5000/test-api"), 
                     name: "本地测试API", 
                     tags: new[] { "dev", "local" }); // 开发环境和本地标签

    然后,在映射健康检查终结点时,你可以通过

    Predicate
    属性来过滤哪些检查项应该包含在这个报告中。

    // 生产环境的健康检查,只包含标记为 "production" 和 "critical" 的项
    app.MapHealthChecks("/health/prod", new HealthCheckOptions
    {
        Predicate = check => check.Tags.Contains("production") && check.Tags.Contains("critical"),
        ResponseWriter = UIResponseWriter.WriteHealthCheckUIResponse // 可以使用UI的响应格式
    });
    
    // 开发环境的健康检查,包含所有项或特定的开发标签项
    app.MapHealthChecks("/health/dev", new HealthCheckOptions
    {
        Predicate = check => true, // 包含所有项
        ResponseWriter = WriteDetailedDevResponse // 自定义一个更详细的开发响应
    });
  2. 自定义响应写入器 (ResponseWriter): 默认的JSON输出可能不符合你的所有需求。你可以提供一个自定义的

    ResponseWriter
    来控制健康检查报告的输出格式和内容。

    // 示例:一个更详细的开发环境响应写入器
    private static Task WriteDetailedDevResponse(HttpContext httpContext, HealthReport report)
    {
        httpContext.Response.ContentType = "application/json";
    
        var result = new
        {
            status = report.Status.ToString(),
            totalDuration = report.TotalDuration,
            checks = report.Entries.Select(e => new
            {
                name = e.Key,
                status = e.Value.Status.ToString(),
                duration = e.Value.Duration,
                description = e.Value.Description,
                exception = e.Value.Exception?.Message, // 在开发环境暴露异常信息
                tags = e.Value.Tags
            })
        };
    
        return httpContext.Response.WriteAsync(JsonSerializer.Serialize(result, new JsonSerializerOptions { WriteIndented = true }));
    }

    通过这种方式,你可以在开发环境显示详细的错误信息甚至堆栈跟踪(当然,生产环境绝对要避免),而在生产环境只显示简洁的状态码和有限的信息,甚至只显示一个简单的“OK”或“FAIL”,以保护敏感信息和减少攻击面。这种定制化能力让健康检查真正适应了不同部署场景的需求。

面对健康检查的常见陷阱与优化策略有哪些?

健康检查虽然强大,但在实际应用中也容易踩坑。理解这些陷阱并掌握优化策略,能让你的系统更稳定、更可靠。

  1. 陷阱:健康检查本身成为性能瓶颈。 如果你的健康检查逻辑过于复杂、耗时,或者过于频繁地查询高负载资源,它本身就可能给系统带来额外的压力,甚至导致假性不健康。比如,一个每秒都对数据库执行复杂查询的健康检查,可能会让数据库不堪重负。

    • 优化策略:异步化和超时。 确保你的健康检查方法是异步的(
      async/await
      ),这样不会阻塞线程池。同时,为每个检查项设置合理的超时时间 (
      WithTimeout
      ),避免某个依赖响应慢导致整个健康检查卡住。对于某些不需要实时更新的检查,可以考虑在检查逻辑内部加入简单的缓存机制,比如每隔5秒才真正执行一次检查,其他时候返回缓存结果。
      builder.Services.AddHealthChecks()
          .AddSqlServer(builder.Configuration.GetConnectionString("DefaultConnection"))
          .WithTimeout(TimeSpan.FromSeconds(5)); // 设置5秒超时
  2. 陷阱:假阳性或假阴性报告。 健康检查报告“健康”但服务实际不可用(假阳性),或者报告“不健康”但服务实际正常(假阴性)。这通常是因为检查逻辑不够精确,或者阈值设置不当。

    • 优化策略:精确检查和阈值。 不要只检查“数据库连接成功”,而是尝试执行一个简单的读写操作,确认数据库确实可用。对于磁盘空间,不要等到完全满了才报告不健康,可以设置一个警告阈值(例如,剩余空间低于10%就报告
      Degraded
      状态)。结合多个检查项来判断一个服务的整体健康状况,避免单一故障点导致误报。
  3. 陷阱:安全漏洞。 默认的健康检查终结点可能会暴露一些内部信息(如依赖名称、异常消息),如果未经保护地暴露给公共网络,可能成为潜在的安全风险。

    • 优化策略:限制访问和信息过滤。 最好的做法是将健康检查终结点限制在内部网络或通过API网关进行访问。如果必须暴露,确保使用身份验证和授权。同时,使用自定义
      ResponseWriter
      在生产环境中过滤掉所有敏感信息,只返回最简单的状态码。
  4. 陷阱:过度检查或检查不足。 检查项过多会增加维护成本和性能开销;检查项过少则可能无法发现真正的服务问题。

    • 优化策略:平衡与关键性评估。 识别你应用最核心、最容易出问题的依赖,优先对它们进行健康检查。对于一些不那么关键的组件,可以考虑降低检查频率或只在
      Degraded
      状态下才触发更深层次的检查。我的经验是,专注于那些一旦出问题就会导致服务完全不可用的依赖,比如主数据库、核心消息队列、身份认证服务等。

总的来说,设计一个有效的健康检查策略,需要你对自己的应用架构和依赖有深入的理解,并根据实际部署环境和业务需求进行权衡。它是一个持续优化和调整的过程,而不是一劳永逸的配置。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

676

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

320

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

346

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1094

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

357

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

675

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

571

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

414

2024.04.29

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

25

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号