0

0

Go 分布式追踪 jaeger/opentelemetry 全流程搭建

冷炫風刃

冷炫風刃

发布时间:2026-01-27 11:19:58

|

209人浏览过

|

来源于php中文网

原创

Jaeger Agent 启动失败因未配Collector或端口不匹配,应直连Collector或用all-in-one镜像;Go SDK需显式设非空service name;OTLP需配支持OTLP的Collector;跨goroutine须手动传递span context。

go 分布式追踪 jaeger/opentelemetry 全流程搭建

Jaeger Agent 启动失败,提示 connection refused

常见于本地开发环境直接启动 jaeger-agent 但没配对后端(Collector),或 Collector 未监听 UDP 端口。Jaeger Agent 默认通过 UDP 向 localhost:6831(compact protocol)或 localhost:6832(binary protocol)上报 span,而 Collector 默认不监听这些端口——它只暴露 gRPC/HTTP 接口(如 1425014268)。

解决办法:跳过 Agent,让 Go 应用直连 Collector;或改用 jaeger-all-in-one 一键镜像(它自动打通 Agent → Collector → UI):

docker run -d --name jaeger \
  -e COLLECTOR_ZIPKIN_HOST_PORT=:9411 \
  -p 5775:5775/udp \
  -p 6831:6831/udp \
  -p 6832:6832/udp \
  -p 5778:5778 \
  -p 16686:16686 \
  -p 14250:14250 \
  -p 14268:14268 \
  -p 14269:14269 \
  -p 9411:9411 \
  jaegertracing/all-in-one:1.49

注意:6831/udp 必须暴露,否则 Go SDK 的默认 reporter 会静默丢 span。

Go 用 jaeger-client-go 上报 span,但 UI 里看不到服务名

根本原因是 tracer 初始化时没传 service name,或传了空字符串。Jaeger UI 按 service name 分组展示,空名会被归到 unknown_service,极难定位。

初始化必须显式指定非空 service name,且建议与你的二进制名或部署单元一致:

tracer, closer := jaeger.NewTracer(
  "my-api-service", // ← 必须非空
  jaeger.NewConstSampler(true),
  jaeger.NewRemoteReporter(jaeger.RemoteReporterParams{
    LocalAgentHostPort: "localhost:6831",
  }),
)

其他易错点:

  • LocalAgentHostPort 写成 localhost:6832(binary 协议)但 Agent 实际监听的是 6831(compact),导致无报错但无数据
  • 应用启停太快,closer.Close() 没调用,最后几个 span 被丢弃
  • 没设 TracerOptions.EnableZipkin,但想兼容 Zipkin 格式(其实一般不需要)

迁移到 OpenTelemetry Go SDK 后 span 丢失,日志显示 failed to export trace: rpc error: code = Unavailable desc = connection closed

这是 OTLP exporter 连不上 Collector 的典型表现。OpenTelemetry Go 默认走 gRPC 协议(端口 4317),不是 Jaeger 的 683114250。你不能把旧的 Jaeger Collector 配置直接塞进 otlphttp.NewClientotlpgrpc.NewClient

正确做法分两步:

阿里妈妈·创意中心
阿里妈妈·创意中心

阿里妈妈营销创意中心

下载
  • 启动支持 OTLP 的 Collector:用官方 otel/opentelemetry-collector-contrib 镜像,并启用 otlp receiver 和 jaeger exporter(复用原有 Jaeger 后端)
  • Go 代码中配置 OTLP gRPC exporter,指向 Collector 的 4317 端口

Collector 配置示例(config.yaml):

receivers:
  otlp:
    protocols:
      grpc:
        endpoint: 0.0.0.0:4317

exporters:
  jaeger:
    endpoint: "jaeger:14250"
    tls:
      insecure: true

service:
  pipelines:
    traces:
      receivers: [otlp]
      exporters: [jaeger]

Go 初始化片段:

exp, err := otlpgrpc.NewClient(otlpgrpc.WithInsecure(), otlpgrpc.WithEndpoint("localhost:4317"))
if err != nil {
  log.Fatal(err)
}
tp := sdktrace.NewTracerProvider(
  sdktrace.WithBatcher(exp),
  sdktrace.WithResource(resource.MustNewSchemaless(
    semconv.ServiceNameKey.String("my-api-service"),
  )),
)

注意:semconv.ServiceNameKey 是 OpenTelemetry v1.20+ 的写法,老版本用 attribute.String("service.name", ...)

Span 上下文跨 goroutine 丢失,HTTP handler 里能打点,但异步任务里全是 nil span

Go 的 context 本身不跨 goroutine 自动传播,trace.SpanFromContext(ctx) 在新 goroutine 里拿不到父 span,除非你手动把 context 传进去。

最简方案:用 trace.ContextWithSpan 包一层再传给 goroutine:

parentCtx := r.Context()
span := trace.SpanFromContext(parentCtx)
go func(ctx context.Context) {
  // ctx 已携带 span,后续 StartSpan 会自动作为 child
  _, span := tracer.Start(ctx, "async-task")
  defer span.End()
}(trace.ContextWithSpan(parentCtx, span))

更稳妥的做法是统一用 trace.SpanContextFromContext + trace.SpanContextToContext,尤其在 channel、worker pool 等复杂调度场景下;否则看似打了点,实际链路断裂,parent_id 全是 0000000000000000

另一个隐藏坑:http.ServerHandler 默认不注入 tracing context,得靠中间件(如 otelhttp.NewMiddleware)或手动 wrap r.WithContext,否则 r.Context() 从一开始就没 span。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

327

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

234

2023.10.07

什么是中间件
什么是中间件

中间件是一种软件组件,充当不兼容组件之间的桥梁,提供额外服务,例如集成异构系统、提供常用服务、提高应用程序性能,以及简化应用程序开发。想了解更多中间件的相关内容,可以阅读本专题下面的文章。

178

2024.05.11

Golang 中间件开发与微服务架构
Golang 中间件开发与微服务架构

本专题系统讲解 Golang 在微服务架构中的中间件开发,包括日志处理、限流与熔断、认证与授权、服务监控、API 网关设计等常见中间件功能的实现。通过实战项目,帮助开发者理解如何使用 Go 编写高效、可扩展的中间件组件,并在微服务环境中进行灵活部署与管理。

214

2025.12.18

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

421

2023.08.02

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

208

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

292

2023.10.25

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

1

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 4.2万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号