0

0

Linux网络协议栈工作流程_数据收发机制解析【教程】

冰川箭仙

冰川箭仙

发布时间:2026-01-03 18:41:02

|

187人浏览过

|

来源于php中文网

原创

数据包从网卡到用户进程的关键路径是:网卡驱动 → NAPI poll → __netif_receive_skb_core → ip_rcv → tcp_v4_rcv/udp_rcv → socket接收队列;该路径决定抓包失败时的排查层级。

linux网络协议栈工作流程_数据收发机制解析【教程】

数据包从网卡到用户进程的路径在哪

Linux内核协议不是黑盒,关键路径是:网卡驱动 → NAPI poll → __netif_receive_skb_core → ip_rcv → tcp_v4_rcv/udp_rcv → socket 接收队列。这个链路决定了你抓不到包时该查哪一层。

常见现象:tcpdump 能抓到包但应用 recv() 阻塞——大概率卡在 socket 接收队列 溢出或 sk_filter 丢包;若 tcpdump 也看不到,问题在网卡驱动或硬件中断没触发。

  • ethtool -S eth0 查看 rx_droppedrx_missed_errors,确认是否网卡已丢包
  • cat /proc/net/snmp | grep -A1 TcpEstabResetsOutSegs 异常飙升,反映内核已处理但连接异常
  • 接收队列长度由 net.core.rmem_default 和 socket 的 SO_RCVBUF 共同限制,ss -i 可见 rcv_space 和实际 rcv_ssthresh

send() 系统调用到底把数据交给了谁

send() 返回成功 ≠ 数据已发到对端,它只表示数据进入内核 sk_write_queue 或直接走 tcp_push_pending_frames() 进入发送队列。真正控制发包节奏的是 TCP 的拥塞窗口(cwnd)、接收窗口(rwnd)和 sk->sk_wmem_queued 剩余空间。

典型误判:应用层 send() 返回快,就认为“发出去了”。其实可能卡在:

  • 路由查找失败 → ip_route_output_flow 返回错误,send() 直接 -ENETUNREACH
  • 本地端口耗尽 → net.ipv4.ip_local_port_range 被占满,connect() 失败但 sendto() UDP 可能静默丢弃
  • TCP 发送队列满 → sk_stream_is_writeable() 返回 false,阻塞式 socket 挂起,非阻塞则返回 -EAGAIN

为什么 conntrack 会改写源端口或丢包

启用 nf_conntrack 后,所有新建连接都会被跟踪,而它的哈希表大小、超时策略、状态匹配逻辑直接影响转发行为。最常见问题是 SNAT 场景下,conntrack -L 显示 TIME_WAIT 条目堆积,导致新连接被拒绝或源端口被复用错乱。

关键配置项必须检查:

灵办AI
灵办AI

免费一键快速抠图,支持下载高清图片

下载
  • net.netfilter.nf_conntrack_max:默认 65536,高并发场景极易打满
  • net.netfilter.nf_conntrack_tcp_timeout_time_wait:默认 120 秒,短连接服务建议压到 30
  • net.ipv4.netfilter.ip_conntrack_tcp_be_liberal:设为 1 可缓解某些中间设备 RST 导致的状态不一致

调试时用 conntrack -E 实时监听事件,比翻日志快得多。

eBPF 如何安全观测协议栈关键点

传统工具(如 tcpdump、ss)只能看到“结果”,eBPF 可在 tcp_v4_rcvip_finish_outputdev_hard_start_xmit 等函数入口插桩,且不修改内核代码。但要注意:不是所有函数都支持 kprobe,优先用 tracepoint(如 skb:kfree_skb)或 fentry(5.10+ 内核)。

一个实用观测点:

#!/usr/bin/env python3
from bcc import BPF

bpf_text = """
TRACEPOINT_PROBE(skb, kfree_skb) {
    if (args->reason == 10) { // SKB_DROP_REASON_NOT_SPECIFIED
        bpf_trace_printk("drop at %s\\n", args->location);
    }
    return 0;
}
"""
b = BPF(text=bpf_text)
b.trace_print()

注意:args->location 是内核符号地址,需配合 /proc/kallsyms 解析;生产环境避免用 bpf_trace_printk,改用 perf ring buffer。

协议栈里真正难定位的是跨 CPU 队列竞争、softirq 抢占延迟、RPS/RFS 配置失当——这些不会报错,只会让延迟毛刺变多、吞吐上不去。别只盯着函数路径,得看调度上下文。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

378

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

566

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

378

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

566

2023.08.10

location.assign
location.assign

在前端开发中,我们经常需要使用JavaScript来控制页面的跳转和数据的传递。location.assign就是JavaScript中常用的一个跳转方法。通过location.assign,我们可以在当前窗口或者iframe中加载一个新的URL地址,并且可以保存旧页面的历史记录。php中文网为大家带来了location.assign的相关知识、以及相关文章等内容,供大家免费下载使用。

224

2023.06.27

tcp和udp的区别
tcp和udp的区别

TCP和UDP的区别,在连接性、可靠性、速度和效率、数据报大小以及适用场景等方面。本专题为大家提供tcp和udp的区别的相关的文章、下载、课程内容,供大家免费下载体验。

117

2023.07.25

udp是什么协议
udp是什么协议

UDP是OSI参考模型中一种无连接的传输层协议。本专题为大家带来udp是什么协议的相关文章,免费提供给大家。

271

2023.08.08

tcp和udp有什么区别
tcp和udp有什么区别

tcp和udp的区别有:1、udp是无连接的,tcp是面向连接的;2、udp是不可靠传输,tcp是可靠传输;3、udp是面向报文传输,tcp是面向字节流传输。想了解更多tcp相关的内容,可阅读本专题下面的相关文章。

353

2024.11.14

从零到实战:Python 编程系统入门专题
从零到实战:Python 编程系统入门专题

本专题面向零编程基础及初学者,系统讲解 Python 编程语言的核心知识与实战技巧。内容涵盖 Python 基础语法、数据结构、函数与模块、常用标准库、简单算法思维,以及真实应用场景下的小项目实战。通过循序渐进的学习路径,帮助读者快速建立编程思维,掌握 Python 在数据处理、自动化脚本及日常开发中的实际应用能力,为后续深入学习 Web 开发、数据分析或人工智能打下坚实基础。

2

2026.01.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.6万人学习

Git 教程
Git 教程

共21课时 | 2.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号