Headless 类型解析，一个容易被忽略的 Kubernetes Service 类型

站长

2023年07月07日 19:41 · 阅读数 151

我是 LEE，老李，一个在 IT 行业摸爬滚打 17 年的技术老兵。

事件背景

最近我们的 Serverless 项目第一期上线使用一段时间后，发现 Service IP 被大量消耗，导致系统 IP 地址压力剧增，为了测底解决这个问题，我们尝试修改了 Serverless 的 Controller 代码，让创建的的 Service 时候使用 Headless 模式。

但是在使用 Headless 的模式时候，我们发现后端的 Pod 流量转发不均衡，导致后端的 Pod “局部过热”，所以我们又将 Service 的模式改回了 ClusterIP 模式。

经过一段时间的排查，确认这个问题由于使用 Headless 模式的 Service，底层跳过了 Kube-proxy，没有使用 IPVS 进行负载均衡，导致后端的 Pod 流量转发不均衡。流量均衡负载的能力却是由 CoreDNS 的 RR 轮询算法来实现的。

在使用 Headless 服务时遇到了一些问题，就想借此机会讲清楚 Headless 服务的工作原理，以及 Headless 与 ClusterIP 服务的区别。帮助小伙伴们及时避坑。

专题科普

当 Kubernetes 集群部署应用程序时，有多种不同的服务类型可以供选择，其中有两种：ClusterIP 和 Headless，这两种服务类型之间有一些显著的区别，绝对不是简单的在 Yaml 文件中 spec.clusterIP 设置为 "None"。

Headless 简介

Headless 服务是一种特殊的服务类型，它不会分配虚拟 IP，而是直接暴露所有 Pod 的 IP 和 DNS 记录。这使得我们可以直接访问 Pod IP 地址，并使用这些 IP 地址进行负载均衡。

Headless 类型解析，一个容易被忽略的 Kubernetes Service 类型

例如，我们可以创建一个 Headless Service 如下：

apiVersion: v1
kind: Service
metadata:
    name: statefulset-service
spec:
    clusterIP: None
    selector:
        app: statefulset-app
    ports:
        - name: http
          port: 80

这样就创建了一个名为 statefulset-service 的 Headless Service，并且选择了标签为 app: statefulset-app 的所有 Pod 作为其后端。

当我们查询该 Service 的 DNS 记录时，就会得到如下结果：

$ nslookup statefulset-service.default.svc.cluster.local
Server: 10.96.0.10
Address: 10.96.0.10#53

Name: statefulset-service.default.svc.cluster.local
Address: 10.244.0.5
Name: statefulset-service.default.svc.cluster.local
Address: 10.244.0.6
Name: statefulset-service.default.svc.cluster.local
Address: 10.244.0.7

可以看到，返回了三个 IP 地址，分别对应于三个 Pod 的 IP 地址。

如果我们想要访问其中一个 Pod，比如 pod-1，我们可以使用 pod-1.statefulset-service.default.svc.cluster.local 这样的域名来访问。

Headless 工作原理

当我们创建一个名为 statefulset-service 的 Headless 服务时，Kubernetes 将为每个 Pod 创建一个 DNS 记录。这个 DNS 实体的名称采用形式：“{podname}.{headless-name}.{namespace}.svc.cluster.local”。

{podname}是 Pod 名称，{headless-name}是 Headless 服务名称，{namespace}是命名空间名称。

当我们查询"pod-1.statefulset-service.default.svc.cluster.local"时，将以 DNS 方式返回一个 A 记录，其中包含所有匹配的 Pod IP 地址。这意味着可以通过 Pod IP 地址直接访问 Headless 服务，并使用 CoreDNS 返回 A 记录中的 IP 地址进行负载均衡。（当然你可以使用自己的 LoadBalancer，而不是 Kubernetes 提供的）

Headless 优缺点

优点

高度动态和可扩展：由于没有虚拟 VIP，Headless 服务对 Pod 的数量没有限制，具有高度动态和可扩展的特性。
直接访问 Pod IP 地址：与 ClusterIP 相比，在 Headless 服务中没有默认负载均衡器，因此可以直接访问 Pod 的实际 IP 地址。
API 选择器的支持：在 Headless 服务中，支持 API 选择器。这使得我们可以根据标签选择特定的 Pod。

缺点

没有默认负载均衡器：由于没有默认负载均衡器，所以我们需要手动进行负载均衡。

Headless 与 ClusterIP 区别

ClusterIP 是 Kubernetes 默认的服务类型。它为 Pod 组提供了一个虚拟 IP，并通过代理模式进行负载均衡。当在编写 Service 配置文件时，我们通常会指定 ClusterIP 类型。这样，我们就可以使用 Virtual IP 在 Kubernetes 中跨节点访问 Pod 组。

另一方面，Headless 服务类型并不分配虚拟 IP，而是直接暴露所有 Pod 的 DNS 记录。没有默认负载均衡器，可直接访问 Pod IP 地址。因此，当我们需要与集群内真实的 Pod IP 地址进行直接交互时，Headless 服务就很有用了，但也不是 100% 的绝对。

Headless 使用场景

Headless 服务类型通常适用于需要直接访问 Pod IP 地址的分布式应用程序，尤其是以下几种场景：

数据库集群：数据库集群需要高可用性和可扩展性，并且要求能够在任何时候访问每个节点。Headless 服务可以为每个节点分配一个唯一的 DNS 实体名称，从而支持直接访问 Pod IP 地址，实现负载均衡和故障转移。
消息队列：消息队列需要高吞吐量和低延迟，以支持实时数据处理和流式计算。Headless 服务可以为每个节点分配一个唯一的 DNS 实体名称，从而支持与节点的直接交互和负载均衡，实现数据传输的高效性。
分布式缓存：分布式缓存需要支持多个节点之间的数据同步和复制，并且要求能够在任何时候访问每个节点。Headless 服务可以为每个节点分配一个唯一的 DNS 实体名称，从而支持直接访问 Pod IP 地址，实现数据的高可用性和可靠性。
超高性能应用程序：超高性能应用程序需要支持动态扩展和负载均衡，并且要求能够在任何时候被每个节点，同时对延迟敏感。Headless 服务可以为每个节点分配一个唯一的 DNS 实体名称，从而支持直接访问 Pod IP 地址，实现高可用性和可靠性。在这些情况下，每个节点都有自己的身份和状态，需要使用持久化存储进行数据共享。

在调用某个节点时，单个服务和端点并不太重要，而是要保证在数据共享期间追踪正确的节点。这种情况下，使用 Headless 服务就非常有用了。

Headless 对 Kube-proxy 的影响

Headless 服务对 Kube-proxy 的影响主要体现在其负载均衡的实现方式上。在 Kubernetes 中，Kube-proxy 负责为 Service 提供负载均衡功能，以便客户端能够直接连接到任意一个 Pod。对于 ClusterIP 类型的 Service，Kube-proxy 会创建一个虚拟 IP 地址，并将请求发送到该地址所绑定的一个或多个 Pod 上。

而对于 Headless Service，Kube-proxy 创建的是一组 DNS 记录，用于解析到每个 Pod 的 IP 地址。这样，客户端就可以通过 DNS 解析来得到 Pod 的 IP 地址，并与它直接建立连接，完全绕过了 Kube-proxy 组件。

对于 Kube-proxy + IPVS 方式（即使用 IPVS 实现 Kube-proxy 的负载均衡），Headless 服务同样不会受到 IPVS 的影响，因为它们都是通过直接访问 Pod IP 地址来实现负载均衡的。在这种情况下，IPVS 只会提供网络层转发的功能，并没有更深层次的介入。

因此，当使用 Headless 服务时，我们需要手动进行负载均衡。

CoreDNS 如何与 Headless 协作的

CoreDNS 是 Kubernetes 中的默认 DNS 服务器，它管理着整个集群的服务发现。CoreDNS 是一种单独的容器，可以在每个节点上运行。当 CoreDNS 启动时，它会检索 kube-apiserver 中的整个服务定义，并将其转换为 DNS 记录。

当我们创建一个 Headless 服务时，CoreDNS 将为每个 Pod 创建一个 DNS 记录，该记录直接指向 Pod 的实际 IP 地址。这将有助于在 Headless 服务类型中对 Pod 进行直接访问。

Headless 和 Endpoint 之间的关系

Headless 服务类型下所有 Pod 将作为独立的 Endpoint 发布到 Kubernetes API 服务器中。这使得其他适用于 ClusterIP 服务类型的 Kubernetes 组件可以对其进行发现和路由。

在 Headless 服务中，可以使用 Endpoints 对象来访问所有 Pod IP 地址。这是一个由 Kubernetes 自动生成的对象，其中包含了相应 Service 的全部 Endpoint 信息。

在 Endpoint 对象方面，它的主要作用是管理具体的 Pod IP 地址，并与 Headless 服务保持同步。当 Pod 发生故障或需要进行扩容时，Endpoint 对象会及时更新，并确保 Headless 服务始终具有最新的 Pod IP 地址。这样可以确保开发者能够始终访问到可用的 Pod，并保证应用程序的稳定性和可靠性。

Selector 是如何影响 Headless 和 CoreDNS

使用了 CoreDNS 的集群默认会配置自动服务发现，它能够根据 Service 和 Endpoint 对象自动生成 DNS 解析记录。对于普通的 Service 对象，CoreDNS 会将其 ClusterIP 映射到一个域名下，这个域名为 {service-name}.{namespace}.svc.cluster.local。而对于 Headless Service，由于没有 Selector 对象，CoreDNS 将不会生成对应的 A 记录，只会生成 SRV 记录。

具体来说，在使用了 CoreDNS 的 Kubernetes 集群中，对于 Headless Service，CoreDNS 会在域名 .{service-name}.{namespace}.svc.cluster.local 下生成一个 SRV 记录，这个记录包含了每个 Pod 的 IP 地址和端口号。客户端可以通过查询这个 SRV 记录来获取所有 Pod 的地址和端口号，并进行连接。换句话说，使用了 CoreDNS 的 Kubernetes 集群，Headless Service 可以正常工作，并且提供了更加灵活的负载均衡方式，客户端可以通过查询 SRV 记录，灵活选择需要连接的 Pod。

需要注意的是，在使用了 CoreDNS + Headless Service 的场景中，如果想要实现服务发现和负载均衡功能，客户端必须支持 SRV 记录类型。因此，在开发应用时，需要确保客户端能够正确地解析并使用 SRV 记录。

使用 Headless 的风险

直接暴露所有 Pod 的 DNS 记录可能导致安全漏洞。恶意用户可能会利用 Headless 服务类型攻击系统。
由于没有默认负载均衡器，因此需要手动进行负载均衡。这可能导致一些人员工作量过大，管理变得复杂。
使用 Headless 服务可能会增加 DNS 服务器的工作量。在具有大量 Pod 和 Headless 服务的较大集群中，DNS 服务器可能会成为瓶颈。

总结

Kubernetes Headless 服务类型提供了直接访问 Pod IP 地址的方式，对于各种数据共享的分布式应用程序非常有用。与 ClusterIP 相比，它具有更高的动态扩展性和可扩展性。所以在 Kubernetes Serivce 类型中 Headless 服务类型是一种非常有用的服务类型，但是他并不是最常用的类型，虽然有时候有一些特殊的场景需要使用 Headless 服务类型，但也需要考虑风险，由于 Headless 服务不提供任何负载均衡控制，因此需要开发者自己管理和维护应用程序的可用性和可靠性。CoreDNS 也可能会成为 Headless 服务的瓶颈，如果出现故障或配置不当，就可能导致无法进行名称解析或出现不稳定的问题。

转载自:https://juejin.cn/post/7222862599851589689