微服务中直接用 net/http 路由不够用,因 http.ServeMux 仅支持前缀匹配,无法实现服务发现、负载均衡、灰度分流;需基于 gin/gorilla 构建代理层,对接 Consul 等注册中心,缓存健康实例并监听变更,结合请求头实现标签路由,同时配置 transport 超时与错误重试机制。

微服务中直接用 net/http 做路由不够用
Go 标准库的 http.ServeMux 只支持前缀匹配和静态路径,没法做服务发现、负载均衡、权重路由或灰度分流。你在微服务里如果还靠 http.HandleFunc 手写路由逻辑,等于把注册中心、健康检查、重试策略全自己实现一遍——不现实。
真正可用的路由必须依赖服务网格层或专用网关。Go 生态里最轻量又可控的选择是基于 gorilla/mux 或 gin-gonic/gin 构建代理层,再对接 Consul/Etcd/Nacos 做服务发现。
用 gin + consul 实现动态服务路由
核心思路:不把路由硬编码进代码,而是启动时从 Consul 拉取健康实例列表,请求进来时按策略选一个节点转发。关键点在于避免每次请求都查 Consul —— 要缓存+监听变更。
-
consul-api客户端用consul.NewClient初始化,配置Address和Token - 用
client.Health().Service查服务,加PassingOnly: true过滤掉不健康节点 - 缓存结果到内存 map,用 goroutine 轮询
WaitIndex监听服务变更 - 路由 handler 里调用自定义
selectInstance()函数,支持轮询 / 随机 / 权重(需额外字段)
func proxyHandler(c *gin.Context) {
instances := getHealthyInstances("user-service")
if len(instances) == 0 {
c.AbortWithStatus(http.StatusServiceUnavailable)
return
}
target := selectInstance(instances) // 轮询或随机
url := fmt.Sprintf("http://%s:%d%s", target.Address, target.Port, c.Request.URL.Path)
proxy := httputil.NewSingleHostReverseProxy(&url.URL{Scheme: "http", Host: url})
proxy.ServeHTTP(c.Writer, c.Request)
}灰度路由必须靠请求头或 Cookie 做分流
Consul 本身不支持标签路由,得在代理层解析 X-Env 或 Cookie,再过滤实例列表。比如只把带 X-Env: staging 的请求发给打标 env=staging 的实例。
立即学习“go语言免费学习笔记(深入)”;
注意:Consul 的 Tag 是字符串切片,不是键值对,所以建议用 env=staging 这种格式,然后用 strings.Contains 匹配。
- 从
c.Request.Header.Get("X-Env")提取环境标识 - 拉取所有实例后,用
filterByTag(instances, "env="+env)筛选 - 如果筛选为空,fallback 到默认池(比如
env=prod) - 别在每次请求里重复调用 Consul API,缓存带 tag 的实例映射表
别忽略超时和重试导致的路由失效
反向代理默认没有超时控制,上游服务卡住会拖垮整个网关。gin 的 httputil.NewSingleHostReverseProxy 必须包装 transport:
transport := &http.Transport{
DialContext: (&net.Dialer{
Timeout: 30 * time.Second,
KeepAlive: 30 * time.Second,
}).DialContext,
TLSHandshakeTimeout: 10 * time.Second,
ResponseHeaderTimeout: 30 * time.Second,
}
proxy := httputil.NewSingleHostReverseProxy(&url.URL{Scheme: "http", Host: url})
proxy.Transport = transport重试要谨慎:HTTP GET 可重试,POST/PUT 不行;Consul 实例下线有延迟,健康检查间隔默认 10s,意味着最多 10s 内可能把请求发给已宕机节点——得靠 transport 层的连接错误自动触发重选实例逻辑,而不是简单 retry 3 次。
真实场景里,路由策略的复杂度不在 Go 代码怎么写,而在服务注册信息是否及时、标签是否统一、下游服务是否真能响应健康检查。这些比写个 selectInstance 函数难得多。











