讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

首页 > 运维 > linux运维 > 正文

一次线上 Node.js 业务流量异常增长问题定位过程

看不見的法師

发布： 2025-07-13 09:32:16

原创

727人浏览过

线上 node.js 业务流量异常增长问题定位

问题现象

某天，通过我们自建的监控系统，发现部门下属所有业务的 notFound 页面性能上报量出现了显著的异常增长，进而影响了单一页面以及整体性能指标。

问题分析

面对流量突然激增的情况，我们从两个角度进行分析：业务自身的正常增长和来自爬虫的异常增长。

从正常增长的角度来看：

增长的流量全部来自于没有实际内容的 notFound 页面。与业务方沟通后，无法找到合法的流量来源，这些流量不带 referrer 以及合法用户的 cookie。通过以上三点，我们基本可以确定异常流量来源于爬虫。

定位爬虫

要解决爬虫问题，首先需要定位爬虫的特征，比如相同的 UA、相似的 IP段等。

我们在服务端日志中进行分析，发现 IP 和 UA 特征并不明显。这是由于业务特性导致的。我们业务的 notFound 页面一直承担部分爬虫流量的职责，因此整体服务调用量一直较高。在大量服务日志中，爬虫的部分 IP 并不特别显眼。

我们换个角度，从前端性能日志进行分析。虽然 notFound 页面服务调用量较高，但由于大部分请求都是直接爬取页面，没有在浏览器中进行渲染，所以前端性能上报量一直比较稳定，可以作为突破口。

标贝AI虚拟主播

标贝AI虚拟主播

一站式虚拟主播视频生产和编辑平台

标贝AI虚拟主播

69

标贝AI虚拟主播

在分析前端性能日志时，我们借助了集团内部共建的 TAM 平台的多维度分析视图来进一步定位。

一次线上 node.js 业务流量异常增长问题定位过程如图所示，在 ISP 分析视图中，来自阿里巴巴的流量占比接近70%，这是一个非常明显的异常聚集。

根据这一特征，我们在前端性能上报的原始日志中进行过滤，发现阿里巴巴的请求 IP 都在一个网段中，再使用 awk 拆解日志进行聚合分析，来自阿里巴巴的网段在头部呈现聚集态势，如图：

一次线上 node.js 业务流量异常增长问题定位过程现在我们可以得出结论：异常增长的流量来自于阿里巴巴神马搜索的爬虫。

问题解决

能够定位到爬虫的特征，我们就可以根据具体的特征施加不同维度的封禁手段。

问题总结

通过本次异常流量问题的定位和解决，我们应该学会：

通过 UA、IP段、运营商等多个维度来定位爬虫特征，并学会借助平台功能熟悉整个服务端请求链条，遇到问题应该从整个链条逐步细化定位环节。前端性能日志与服务端日志结合分析能更快地定位问题。熟练使用 awk / sort / uniq 等 Linux 文本分析工具。

以上就是一次线上 Node.js 业务流量异常增长问题定位过程的详细内容，更多请关注php中文网其它相关文章！

相关标签：

爬虫 linux 浏览器工具 sort Cookie JS linux

大家都在看：

超实用的 Linux 高级命令，运维一定要懂！一次线上 Node.js 业务流量异常增长问题定位过程怎样通过Nginx日志发现潜在威胁 Nginx日志里隐藏着哪些安全信息超实用的 Linux 高级命令，程序员一定要懂！

最佳 Windows 性能的顶级免费优化软件

最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移，垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是，许多工具可以让 Windows 保持平稳运行。

来源：php中文网

上一篇：ECCV 2020 Oral | 可逆图像缩放：完美恢复降采样后的高清图片下一篇：重磅启动！第 17 届「中国 Linux 内核开发者大会」征稿开始

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

技嘉电脑卡死怎么更新驱动_技嘉电脑卡死驱动升级与回滚【技巧】

2025-12-18 13:29:02
神庙逃亡小游戏免费入口试玩神庙逃亡小游戏免费入口网页

2025-12-18 13:30:02
腾讯文档怎么插入超链接_腾讯文档超链接添加指向与打开方式【指南】

2025-12-18 13:30:06
企查查如何查看企业股权穿透图谱企查查查股权穿透图谱方法【步骤】

2025-12-18 13:32:43
用什么软件记录姨妈期记录姨妈周期的app前十名推荐

2025-12-18 13:45:43
迅雷网盘会员中心入口_迅雷网盘会员权益官方管理页面

2025-12-18 13:46:02
php怎么把一行数组变为两行_php数组分行技巧【教程】

2025-12-18 13:56:40
用什么软件拍车辆违章有奖励常用举报软件及奖励方式

2025-12-18 13:58:58
php怎么输出变量和字符串数组中_php输出变量与字符串数组echo拼接法【教程】

2025-12-18 13:59:12
用什么软件记录大姨妈来的日子记录大姨妈日子的主流软件推荐

2025-12-18 14:00:38

最新问题

Linux语言环境如何统一_locale配置详解【教程】 Linux设置locale需先生成再配置：用locale-a检查目标locale是否存在，若无则按发行版启用（如Debian编辑/etc/locale.gen后locale-gen），再通过系统级文件（如/etc/default/locale）或localectl设置环境变量，最后重启终端生效。

2025-12-20 11:17:02

641

Linux本地访问慢远程正常_回环接口排错方法【教学】 Linux本地访问慢但远程正常，大概率是回环接口（lo）异常、/etc/hosts解析错误、iptables/nftables未放行lo或systemd-resolved干扰所致，需依次排查并修复。

2025-12-20 10:27:08

513

LinuxShell如何处理参数_位置参数与getopts解析【教学】 LinuxShell脚本处理命令行参数核心是位置参数（$1、$2等）和getopts解析短选项；需用"$1"防空值报错、"$@"保分词，getopts支持-a-b-carg格式，长选项可用set预处理转换，最后须校验参数有效性并设默认值。

2025-12-20 09:37:40

546

LinuxShell循环语句如何用_forwhile实战示例【教程】 for适合遍历已知集合，while适合条件驱动的不确定循环；for常用于列表、文件、数字范围，while用于读取输入、轮询或状态检测；二者可嵌套组合，需注意引号、IFS、子shell等避坑细节。

2025-12-20 08:51:07

928

Linux高负载如何排查_操作步骤详解提升实战能力【指导】 Linux负载高需先结合CPU核心数判断是否真超标，再通过top查%Cpu(s)、r/b值及进程排序定位瓶颈类型，最后用perf、iostat、free等工具深入分析根因。

2025-12-20 05:31:14

419

LinuxShell定时任务失败怎么办_执行环境排查思路【技巧】 Shell定时任务失败主因是cron环境与交互式Shell差异，需模拟其极简PATH、工作目录和环境变量来排查，重点检查日志、路径、权限及重定向。

2025-12-20 01:39:13

255

LinuxLVM逻辑卷怎么使用_动态扩容实战说明【教学】 LinuxLVM逻辑卷的核心价值在于“动态调整容量”，不用重启、不丢数据，关键在分清PV、VG、LV三层关系并按顺序操作：先用pvdisplay/vgdisplay/lvdisplay摸清现状；VG无空闲时需先扩容（pvcreate+vgextend或pvresize）；再lvextend扩LV，最后resize2fs（ext4）或xfs_growfs（xfs）扩文件系统；缩容须卸载、e2fsck、先缩文件系统再缩LV。

2025-12-20 01:35:20

915

Linux软件包管理基础说明_Linux包安装更新卸载方法 Linux软件包管理需按发行版选择工具：Debian/Ubuntu用apt（依赖自动处理）和dpkg（本地.deb），RHEL/CentOS/Fedora用yum或dnf（后者更智能）；操作须用root权限，禁手动删文件，优先用包管理器卸载与清理。

2025-12-19 22:41:23

761

LinuxSSH安全怎么提升_操作步骤详解提升实战能力【技巧】 LinuxSSH安全提升聚焦四大关键动作：禁用密码登录启用密钥认证（ed25519优先）、禁止root直连并限制AllowUsers、修改端口配合防火墙精准放行、启用fail2ban及加固协议算法；建议按序实施并逐项验证。

2025-12-19 22:41:02

646

Linux系统漏洞如何修复_补丁管理流程说明【指导】 Linux漏洞修复是闭环流程：发现、评估、测试、部署、验证、监控。需建立识别机制、分环境打补丁、无补丁时配置缓解或手动修复，并严格验证生效与业务影响。

2025-12-19 22:40:40

735

相关专题

更多>

热门推荐

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

Python 并发编程实战

6423次学习
收藏
适合小白练手的38个Python爬虫实战项目

20926次学习
收藏
10个Python完整小项目教你爬虫+数据分析+数据可视化

8680次学习
收藏

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部