如何监控Linux网络接口状态变化使用netlink实时监听技术-linux运维-PHP中文网

是，可以使用netlink技术监控linux网络接口状态变化，具体步骤：1. 包含必要头文件并创建af_netlink协议族的sock_raw类型socket，指定netlink_route协议；2. 设置sockaddr_nl结构体，绑定socket并订阅rtmgrp_link组播组以接收链路事件；3. 循环调用recv接收内核通知，解析nlmsghdr消息头，判断rtm_newlink或rtm_dellink类型获知接口增删；4. 通过nlmsg_data获取ifinfomsg结构体，利用if_indextoname等函数获取接口名，并遍历rtattr属性获取mac等信息；5. 如需ip地址，可另建socket发送rtm_getaddr请求并解析响应消息；6. 注意处理bind失败、recv错误、nlmsg_error及权限等问题，可借助strace、tcpdump等工具排查，最终实现高效、实时的网络状态监听。

如何监控Linux网络接口状态变化使用netlink实时监听技术

监控Linux网络接口状态变化，可以使用netlink技术实现实时监听，无需轮询，高效且及时。

解决方案：

Netlink是Linux内核提供的一种用户空间与内核空间通信的机制，特别适合用于网络相关的事件通知。我们可以编写一个用户态程序，通过netlink socket订阅网络接口状态变化事件，一旦有接口状态改变（例如接口UP/DOWN，IP地址变更等），内核就会主动通知我们的程序。

首先，你需要包含必要的头文件：

#include <asm/types.h>
#include <sys/socket.h>
#include <linux/netlink.h>
#include <linux/rtnetlink.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>

登录后复制

接着，创建一个netlink socket：

int sock = socket(AF_NETLINK, SOCK_RAW, NETLINK_ROUTE);
if (sock < 0) {
    perror("socket");
    exit(EXIT_FAILURE);
}

登录后复制

然后，设置socket地址，绑定到

NETLINK_ROUTE

登录后复制

协议族，并订阅

RTMGRP_LINK

登录后复制

组，以便接收链路状态相关的消息：

struct sockaddr_nl addr;
memset(&addr, 0, sizeof(addr));
addr.nl_family = AF_NETLINK;
addr.nl_groups = RTMGRP_LINK;

if (bind(sock, (struct sockaddr *)&addr, sizeof(addr)) < 0) {
    perror("bind");
    close(sock);
    exit(EXIT_FAILURE);
}

登录后复制

现在，你可以进入一个循环，接收来自netlink socket的消息。收到消息后，解析

rtnetlink

登录后复制

消息头，判断消息类型，如果是

RTM_NEWLINK

登录后复制

或

RTM_DELLINK

登录后复制

，则表示有网络接口创建或删除。

char buf[8192];
struct nlmsghdr *nlh;
struct ifinfomsg *ifi;

while (1) {
    ssize_t len = recv(sock, buf, sizeof(buf), 0);
    if (len < 0) {
        perror("recv");
        break;
    }

    for (nlh = (struct nlmsghdr *)buf; NLMSG_OK(nlh, len); nlh = NLMSG_NEXT(nlh, len)) {
        if (nlh->nlmsg_type == NLMSG_DONE)
            break;

        if (nlh->nlmsg_type == NLMSG_ERROR) {
            fprintf(stderr, "netlink error\n");
            break;
        }

        if (nlh->nlmsg_type == RTM_NEWLINK || nlh->nlmsg_type == RTM_DELLINK) {
            ifi = (struct ifinfomsg *)NLMSG_DATA(nlh);
            char ifname[IF_NAMESIZE];
            if_indextoname(ifi->ifi_index, ifname);

            if (nlh->nlmsg_type == RTM_NEWLINK) {
                printf("Interface %s created, index: %d, flags: 0x%x\n", ifname, ifi->ifi_index, ifi->ifi_flags);
            } else {
                printf("Interface %s deleted, index: %d, flags: 0x%x\n", ifname, ifi->ifi_index, ifi->ifi_flags);
            }

            // 进一步解析属性，获取更多信息，例如接口名称、MAC地址等
            struct rtattr *rta = IFLA_RTA(ifi);
            int rtl = IFLA_PAYLOAD(nlh);
            for (; RTA_OK(rta, rtl); rta = RTA_NEXT(rta, rtl)) {
                if (rta->rta_type == IFLA_IFNAME) {
                    printf("Interface name: %s\n", (char *)RTA_DATA(rta));
                } //可以添加其他属性的解析，例如IFLA_ADDRESS (MAC地址)
            }
        }
    }
}

close(sock);

登录后复制

这个程序会打印出新创建或删除的网络接口的名称、索引和标志。当然，你还可以解析

rtattr

登录后复制

结构，获取更多信息，例如接口的MAC地址、IP地址等。

如何处理大量网络接口状态变化事件？

当网络接口数量众多，或者网络状态变化频繁时，单个netlink socket可能会成为瓶颈。可以考虑以下策略：

多线程/多进程处理: 将接收和处理netlink消息的任务分配给多个线程或进程。主进程/线程负责接收消息，然后将消息放入队列，由工作线程/进程从队列中取出消息进行处理。这样可以提高并发处理能力。
使用
```
libnl
```
登录后复制
库:
```
libnl
```
登录后复制
是一个专门用于处理netlink消息的库，它提供了更高级的API和更方便的数据结构，可以简化netlink编程，并提供一些优化，例如缓冲管理和错误处理。
过滤不需要的事件: 如果你只关心特定类型的网络接口（例如，只关心以
```
eth
```
登录后复制
开头的接口），可以在程序中添加过滤逻辑，忽略其他类型的接口的事件，减少需要处理的消息数量。
批量处理: 尝试一次性接收多个netlink消息，而不是每次只接收一个消息。
```
recv
```
登录后复制
函数可以一次性接收多个消息，然后你可以循环处理这些消息。
避免频繁的内存分配: 在处理netlink消息时，尽量避免频繁的动态内存分配和释放，因为这会影响性能。可以预先分配一块足够大的缓冲区，然后重复使用它。

如何解析

rtattr

登录后复制

并获取IP地址？

除了接口名称，我们通常还需要获取接口的IP地址。这需要解析

rtattr

登录后复制

结构，找到

IFLA_ADDRESS

登录后复制

和

IFLA_INET

登录后复制

属性。

JoinMC智能客服

JoinMC智能客服，帮您熬夜加班，7X24小时全天候智能回复用户消息，自动维护媒体主页，全平台渠道集成管理，电商物流平台一键绑定，让您出海轻松无忧！

193

查看详情

// 在RTM_NEWLINK分支中添加
            struct rtattr *rta = IFLA_RTA(ifi);
            int rtl = IFLA_PAYLOAD(nlh);
            char mac_addr[18];
            char ip_addr[INET_ADDRSTRLEN];
            memset(mac_addr, 0, sizeof(mac_addr));
            memset(ip_addr, 0, sizeof(ip_addr));

            for (; RTA_OK(rta, rtl); rta = RTA_NEXT(rta, rtl)) {
                if (rta->rta_type == IFLA_IFNAME) {
                    printf("Interface name: %s\n", (char *)RTA_DATA(rta));
                } else if (rta->rta_type == IFLA_ADDRESS) {
                    // 获取MAC地址
                    unsigned char *mac = (unsigned char *)RTA_DATA(rta);
                    snprintf(mac_addr, sizeof(mac_addr), "%02x:%02x:%02x:%02x:%02x:%02x",
                             mac[0], mac[1], mac[2], mac[3], mac[4], mac[5]);
                    printf("MAC address: %s\n", mac_addr);

                }
            }

            // 创建一个新的netlink socket来获取IP地址 (获取IP地址需要使用RTM_GETADDR)
            int addr_sock = socket(AF_NETLINK, SOCK_RAW, NETLINK_ROUTE);
            if (addr_sock < 0) {
                perror("socket for address");
            } else {
                struct {
                    struct nlmsghdr nlh;
                    struct ifaddrmsg ifa;
                } req;

                memset(&req, 0, sizeof(req));
                req.nlh.nlmsg_len = NLMSG_LENGTH(sizeof(struct ifaddrmsg));
                req.nlh.nlmsg_type = RTM_GETADDR;
                req.nlh.nlmsg_flags = NLM_F_REQUEST;
                req.nlh.nlmsg_seq = 1;
                req.nlh.nlmsg_pid = getpid();
                req.ifa.ifa_family = AF_INET; // 只获取IPv4地址
                req.ifa.ifa_index = ifi->ifi_index;

                struct sockaddr_nl addr_nl;
                memset(&addr_nl, 0, sizeof(addr_nl));
                addr_nl.nl_family = AF_NETLINK;

                if (sendto(addr_sock, &req, req.nlh.nlmsg_len, 0, (struct sockaddr *)&addr_nl, sizeof(addr_nl)) < 0) {
                    perror("sendto for address");
                } else {
                    char addr_buf[8192];
                    ssize_t addr_len = recv(addr_sock, addr_buf, sizeof(addr_buf), 0);
                    if (addr_len < 0) {
                        perror("recv for address");
                    } else {
                        struct nlmsghdr *addr_nlh;
                        for (addr_nlh = (struct nlmsghdr *)addr_buf; NLMSG_OK(addr_nlh, addr_len); addr_nlh = NLMSG_NEXT(addr_nlh, addr_len)) {
                            if (addr_nlh->nlmsg_type == NLMSG_DONE)
                                break;

                            if (addr_nlh->nlmsg_type == NLMSG_ERROR) {
                                fprintf(stderr, "netlink error for address\n");
                                break;
                            }

                            if (addr_nlh->nlmsg_type == RTM_NEWADDR) {
                                struct ifaddrmsg *ifa = (struct ifaddrmsg *)NLMSG_DATA(addr_nlh);
                                struct rtattr *addr_rta = IFA_RTA(ifa);
                                int addr_rtl = IFA_PAYLOAD(addr_nlh);
                                for (; RTA_OK(addr_rta, addr_rtl); addr_rta = RTA_NEXT(addr_rta, addr_rtl)) {
                                    if (addr_rta->rta_type == IFA_LOCAL) {
                                        struct in_addr ip_address = *(struct in_addr *)RTA_DATA(addr_rta);
                                        inet_ntop(AF_INET, &ip_address, ip_addr, INET_ADDRSTRLEN);
                                        printf("IP address: %s\n", ip_addr);
                                    }
                                }
                            }
                        }
                    }
                }
                close(addr_sock);
            }

登录后复制

注意：获取IP地址需要发送

RTM_GETADDR

登录后复制

消息，并且需要创建另一个netlink socket。上面的代码只获取了IPv4地址，如果需要获取IPv6地址，需要修改

ifa_family

登录后复制

为

AF_INET6

登录后复制

，并使用

inet_ntop

登录后复制

和

struct in6_addr

登录后复制

。

Netlink消息处理中的常见错误及排查方法

在实际应用中，netlink消息处理可能会遇到各种错误。以下是一些常见的错误以及排查方法：

```
bind
```
登录后复制
失败: 确保你的程序有足够的权限绑定到
```
NETLINK_ROUTE
```
登录后复制
协议族。通常需要root权限。另外，检查是否有其他程序已经绑定了相同的协议族和组。
```
recv
```
登录后复制
返回错误:
```
recv
```
登录后复制
函数可能会因为各种原因返回错误，例如中断、连接断开等。检查
```
errno
```
登录后复制
的值，根据错误码采取相应的处理措施。例如，如果
```
errno
```
登录后复制
是
```
EINTR
```
登录后复制
，则表示被信号中断，可以重新调用
```
recv
```
登录后复制
。
```
NLMSG_ERROR
```
登录后复制
: 如果接收到
```
NLMSG_ERROR
```
登录后复制
类型的消息，表示内核在处理你的请求时发生了错误。错误码包含在
```
nlmsgerr
```
登录后复制
结构中。检查错误码，根据错误码采取相应的处理措施。常见的错误码包括
```
ENOBUFS
```
登录后复制
(缓冲区溢出)、
```
EPERM
```
登录后复制
(权限不足)等。
消息解析错误: 如果你的程序无法正确解析netlink消息，可能是因为消息格式不正确，或者你的程序没有正确处理消息长度。使用
```
NLMSG_OK
```
登录后复制
宏来确保消息长度有效。仔细检查你的代码，确保你正确解析了
```
nlmsghdr
```
登录后复制
、
```
ifinfomsg
```
登录后复制
和
```
rtattr
```
登录后复制
结构。
缓冲区溢出: 在处理
```
rtattr
```
登录后复制
时，一定要确保你没有读取超出缓冲区边界的数据。使用
```
RTA_OK
```
登录后复制
宏来确保
```
rtattr
```
登录后复制
结构有效。仔细检查你的代码，确保你正确计算了
```
rtattr
```
登录后复制
的长度。
权限问题: 某些netlink消息可能需要root权限才能接收。确保你的程序以root权限运行，或者使用
```
CAP_NET_ADMIN
```
登录后复制
capability。
内核版本不兼容: 某些netlink消息或属性可能只在特定的内核版本中可用。确保你的程序与目标内核版本兼容。可以使用
```
uname
```
登录后复制
命令来获取内核版本。

排查netlink问题的常用工具包括：

```
tcpdump
```
登录后复制
: 可以使用
```
tcpdump -i any -w netlink.pcap netlink
```
登录后复制
命令抓取netlink消息，然后使用Wireshark分析消息内容。
```
strace
```
登录后复制
: 可以使用
```
strace
```
登录后复制
命令跟踪程序的系统调用，查看程序与内核之间的交互。
```
ip
```
登录后复制
命令: 可以使用
```
ip link show
```
登录后复制
命令查看网络接口的状态。
```
ss
```
登录后复制
命令: 可以使用
```
ss -n -x
```
登录后复制
命令查看netlink socket的状态。