spring cloud sleuth整合zipkin的步骤包括添加依赖、配置zipkin地址、启动zipkin服务器。1. 在pom.xml中添加spring-cloud-starter-sleuth和spring-cloud-starter-zipkin依赖;2. 在application.yml中配置spring.zipkin.base-url指向zipkin服务器地址;3. 使用docker运行zipkin服务;4. 启动应用后,sleuth自动注入trace id和span id并上报至zipkin;5. 通过访问zipkin ui验证追踪数据。常见问题排查包括检查zipkin是否启动、网络是否通畅、依赖是否完整、采样率设置是否合理、服务名是否正确以及异步调用上下文丢失等。

Spring Cloud Sleuth整合Zipkin,这事儿说白了,就是给你的微服务系统装上“千里眼”和“顺风耳”,让你能清晰地看到请求在各个服务间是怎么流转的,谁调用了谁,耗时多少,哪儿出了问题。它通过在服务间传递统一的追踪ID,再把这些追踪数据发送给Zipkin这个可视化工具,从而实现分布式链路追踪。

要让你的Spring Cloud应用能和Zipkin愉快地玩耍,你需要做几件事。
首先,在你的Spring Boot应用(比如一个服务提供者或消费者)的pom.xml里,得加上这两个核心依赖:

<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-zipkin</artifactId>
</dependency>接着,在你的application.yml或application.properties里,配置一下Zipkin服务器的地址。这就像告诉Sleuth,你收集到的这些追踪数据,该往哪儿送:
spring:
application:
name: your-service-name # 这个名字很重要,Zipkin里会显示
zipkin:
base-url: http://localhost:9411 # Zipkin服务器的地址,根据你的实际部署调整
sleuth:
sampler:
probability: 1.0 # 采样率,1.0表示100%采样,生产环境可能需要调低通常,Zipkin服务器本身可以独立部署,最简单的方式就是用Docker跑起来:

docker run -d -p 9411:9411 openzipkin/zipkin
这样,当你的Spring Boot服务启动并处理请求时,Sleuth就会自动在请求头里注入追踪信息(Trace ID和Span ID),并把这些信息连同服务调用耗时等数据,发送到你配置的Zipkin服务器上。你就可以打开浏览器访问http://localhost:9411,看到这些漂亮的链路图了。
说实话,刚开始接触微服务的时候,我个人觉得它带来的好处显而易见:模块化、独立部署、弹性伸缩。但很快,一个让人头疼的问题就浮现了:当一个请求跨越十几个甚至几十个服务时,如果某个环节出了问题,或者只是想知道整个链路上哪里耗时最长,那简直是灾难。传统的单体应用调试方式,比如看日志,在这里根本行不通。你不可能把所有服务的日志都拉过来,然后人工去匹配哪个请求对应哪条日志,这不现实。
分布式链路追踪,它解决的就是这个“盲人摸象”的问题。它给每一个进入系统的请求生成一个全局唯一的ID(Trace ID),然后这个ID会贯穿整个请求的所有服务调用。每个服务在处理请求时,会记录自己的操作(Span),包括开始时间、结束时间、服务名、方法名、父Span ID等,并把这些带有Trace ID和Span ID的信息上报给一个中心化的系统(比如Zipkin)。
这样一来,我们就能得到一个完整的请求调用链视图。它能帮我们:
没有它,在复杂的微服务环境里,调试和排查问题就像在大海捞针,效率低下得让人抓狂。这玩意儿,真不是什么锦上添花的功能,而是现代微服务架构的“刚需”。
除了前面提到的base-url和probability,Sleuth和Zipkin的整合还有一些其他配置项,它们能让你更精细地控制追踪行为。了解这些,能帮助你更好地适应不同的环境和需求。
spring.zipkin.base-url: 这个最重要,它指明了Zipkin Collector的HTTP地址。Sleuth会把收集到的Span数据POST到这个地址。如果Zipkin是部署在Eureka注册中心,你也可以配置spring.zipkin.service.name来通过服务名发现Zipkin,不过直接用URL是最常见的。spring.sleuth.sampler.probability: 采样率,取值0.0到1.0。默认是0.1(即10%)。这意味着Sleuth只会追踪10%的请求。在生产环境,如果流量很大,100%采样可能会对系统性能造成压力,所以通常会调低。但在开发或测试环境,为了看到所有请求的追踪信息,我个人会把它设为1.0。spring.sleuth.trace-id128: 默认情况下,Trace ID是64位的。如果设为true,Sleuth会生成128位的Trace ID。这个在某些兼容性场景下可能会用到,比如和OpenTracing等其他追踪系统集成时。通常保持默认即可。spring.sleuth.propagation.type: 用于指定追踪上下文的传播类型。常见的有B3(默认,Zipkin原生)、W3C(W3C Trace Context标准)等。如果你需要和不同的追踪系统互操作,可能需要调整。spring.sleuth.web.client.enabled: 默认为true。控制Sleuth是否对WebClient(包括RestTemplate)的调用进行追踪。spring.sleuth.rpc.grpc.enabled: 如果你的服务使用了gRPC,这个配置可以控制Sleuth是否对gRPC调用进行追踪。spring.sleuth.async.enabled: 默认为true。控制Sleuth是否对异步操作(如@Async方法、CompletableFuture)进行追踪。这很重要,因为异步操作往往会打破传统的线程上下文,Sleuth需要特殊处理才能正确传播Trace ID。spring.sleuth.log.slf4j.whitelisted-mdc-keys: Sleuth默认会将Trace ID和Span ID放入SLF4J的MDC中,方便日志打印。你也可以配置其他需要添加到MDC的键。这些配置项给了我们很大的灵活性。在实际应用中,根据服务的调用量、对追踪粒度的要求以及性能考量,灵活调整这些参数是很有必要的。
配置好了,服务也跑起来了,那怎么知道它是不是真的在工作呢?验证和排查问题,是任何技术方案落地后都绕不开的话题。
验证追踪是否生效:
[your-service-name,a1b2c3d4e5f6g7h8,i9j0k1l2m3n4o5p6,true]这样的格式。其中,第二段是Trace ID,第三段是Span ID。如果日志里有这些ID,说明Sleuth已经在工作了。http://localhost:9411)。常见问题排查:
docker ps查看容器状态)。检查spring.zipkin.base-url配置是否正确,IP地址和端口是否匹配。尝试从你的应用服务器ping或telnet Zipkin的IP和端口,看网络是否通畅。防火墙也可能是个拦路虎。pom.xml中的spring-cloud-starter-sleuth和spring-cloud-starter-zipkin依赖是否都已添加,并且和你的Spring Cloud版本兼容。有时版本不匹配会导致一些奇怪的问题。spring.sleuth.sampler.probability配置。如果它被设得很低(比如0.01),那么只有极少数的请求会被追踪并发送到Zipkin。在开发测试阶段,建议将其设置为1.0。spring.application.name,并且名称是唯一的且具有描述性。这个名字在Zipkin中是识别服务的重要依据。ThreadPoolTaskExecutor并确保Sleuth能够自动包装它。如果自定义了线程池,可能需要手动包装Runnable或Callable以传播上下文。logging.level.org.springframework.cloud.sleuth设置为DEBUG或TRACE,这有助于看到Sleuth内部的工作细节,从而定位问题。总的来说,分布式链路追踪是个强大的工具,但它也不是万能的。在实际使用中,结合日志、监控和追踪,才能更全面地了解系统的运行状态。遇到问题,保持耐心,一步步排查,往往就能找到答案。
以上就是Spring Cloud Sleuth整合Zipkin的配置指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号