-
- 初学者指南:Kubernetes可观测性基础知识
- 在当今复杂的软件开发环境中,确保应用程序的顺畅运行至关重要。可观测性是基础设施管理中的一个关键方面,它帮助开发和运维团队深入了解系统的性能和健康状况,有效地检测和解决问题,并最终提供更好的用户体验。Kubernetes是一个开源的容器编排引擎,用来对容器化应用进行自动化部署、扩缩和管理。随着Kubernetes的普及,了解如何监视和观察这些集群变得至关重要。在本文中,我们将介绍可观测性的概念及其三个主要支柱:指标、日志和跟踪。我们将探讨K8s中自带的可观测性功能,并介绍一些流行的可增强Kuber
- 安全 . 运维 1340 2023-06-09 14:22:42
-
- K8s 增强版工作负载 OpenKruise 之运维增强功能
- 前面我们和大家已经学习了OpenKruise的基本概念以及常用的几个增强控制器,接下来我们来继续了解其他高级功能。SidecarSetSidecarSet支持通过admissionwebhook来自动为集群中创建的符合条件的Pod注入sidecar容器,除了在Pod创建时候注入外,SidecarSet还提供了为Pod原地升级其中已经注入的sidecar容器镜像的能力。SidecarSet将sidecar容器的定义和生命周期与业务容器解耦,它主要用于管理无状态的sidecar容器,比如监控、日志等
- 安全 . 运维 920 2023-06-09 14:13:06
-
- 途游邹轶:中小公司的运维怎么做?
- 通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。这一期我们邀请到的是邹轶,途游游戏运维总监,邹总经常戏称自己是世界500万强企业的运维代表,可见内心中是觉得中小公司的运维建设思路和大型企业是有差别的,今天我们带着几个问题,来请邹总分享一下他的中小公司研运一体化之路。这里是接地气、有高度的《运维百家讲坛》第6期,开讲!问题预览途游是游戏公司,您觉得游戏运维有哪些独特性?面临的最大运维挑战是什么?您又是如何解决这些挑战的?游戏运维的人
- 安全 . 运维 1012 2023-06-09 13:56:08
-
- 运维监控必看:必懂的 InfluxDB 使用指南,关键时刻能用上
- InfluxDB是什么InfluxDB是一个由InfluxData开发的开源时序型数据库。它由Go写成,着力于高性能地查询与存储时序型数据。InfluxDB被广泛应用于存储系统的监控数据,IoT行业的实时数据等场景。技术特点包括:InfluxDB在技术实现上充分利用了Go语言的特性,无需任何外部依赖即可独立部署[5]。InfluxDB提供了一个类似于SQL的查询语言并且一系列内置函数方便用户进行数据查询。InfluxDB存储的数据从逻辑上由Measurement,tag组以及field组以及一
- 安全 . 运维 2273 2023-06-09 13:40:49
-
- 从CTO视角来看:如何搭建运维/SRE能力
- 近期有很多文章在探讨运维岗位去留的问题,我主持的SRETalk公众号里也发了多个运维总监的观点,个人也和行业内挺多人做了交流,有些许小小的想法,记录下来,供各位CTO/CIO参考,作为运维/SRE的你如果觉得迷茫,也推荐你仔细读一下本文。我自认为这是一个深度的思考了,可能枯燥,但对择业和团队搭建都会有些帮助。本文欢迎有理有据的讨论,不欢迎杠精,另外,很多事情其实也没有非黑即白,文章内容对你有些启发,对CXO们的决策带来新的思考,那就是极好的。另外,SRETalk的运维总监采访还会继续,还会有更多
- 安全 . 运维 833 2023-06-09 12:37:08
-
- 使用 Terraform 来管理 OpenStack 集群
- 在拥有一个OpenStack生产环境和家庭实验室一段时间后,我可以肯定地说,从管理员和租户的角度置备工作负载和管理它是很重要的。Terraform是一个开源的基础设施即代码(IaC)软件工具,用于置备provisioning网络、服务器、云平台等。Terraform是一种声明性语言,可以作为你正在建设的基础设施的蓝图。你可以用Git来管理它,它有一个强大的GitOps使用场景。本文介绍了使用Terraform管理OpenStack集群的基础知识。我使用Terraform重新创建了Open
- 安全 . 运维 1233 2023-06-09 12:20:32
-
- 详解MBR与GPT分区,你学会了吗?
- 一、MBR分区MBR是MasterBootRecord的缩写,是一种旧的分区表格式,用于在硬盘上标识和管理分区。MBR分区表可以标识最多4个主分区或3个主分区和1个扩展分区。2TB的限制是指,使用MBR分区表格式的硬盘最大只能分区到2TB,因为MBR使用32位的LBA(LogicalBlockAddressing)寻址方式,最大地址只能表示2^32个扇区,每个扇区大小为512字节,因此最大支持的硬盘大小为2TB。为了支持更大的硬盘容量,硬盘制造商和操作系统开发商引入了GPT(GUIDPartit
- 安全 . 运维 17739 2023-06-09 11:02:28
-
- 【夜莺监控】初识夜莺,还是强!
- 前言可观测性是大部分中小公司比较头疼的问题,主要表现以下几个方面:需要不同的开源软件来组装以实现不同的功能,比如使用Skywalking实现链路监控,使用ELK实现日志收集监控,使用Grafana+Prometheus来实现指标监控。每个开源软件背后都是独立的一套体系,它们之前是相互独立的(Grafana全家桶已经实现组合)。数据孤岛,链路、日志、指标各玩各的,没有建立联系。目前市面上的解决方案要么是商业化产品,要么是自研。本文的主角其实也没有做大一统,目前阶段依然是不同的开源组件实现不同的功能
- 安全 . 运维 1334 2023-06-09 10:01:21
-
- 度小满陈存利:20年老“司令”聊运维、绩效、成长
- 通过采访和约稿的方式,请运维领域老炮输出深刻洞见,共同碰撞,以期形成一些先进的共识,推动行业更好得前进。这一期我们邀请到的是陈存利,度小满系统运维部总经理,20多年的职业生涯中绝大部分时间在互联网领域。在百度运维部期间由于带队风格过硬,兄弟团队称其为”陈司令”。今天我们请“陈司令”来聊聊他的观点。这里是接地气、有高度的《运维百家讲坛》第5期,开讲!问题预览您很早加入了百度,后来随度小满独立,我们了解到您身边有许多员工其实是很长时间一直跟随着您,经历了很多业务的运维考验,相信大家都很感兴
- 安全 . 运维 1634 2023-06-09 09:56:57
-
- 【夜莺监控】海王——Categraf
- 有没有人和我一样,遇到同样的困惑:当我使用Prometheus来搭建监控体系的时候,每当有一个组件需要监控,我就要为其增加一个exporter,如果有10个组件,我就要增加10个exporter,先不说这10个exporter的质量如何(因为大部分exporter都是广大网友自己开发的),光学习成本、部署成本以及维护成本都让人头疼。有没有一个组件,就能搞定大部分指标采集的?Categraf就是这样的一个采集器。惊不惊喜,意不意外?什么是CategrfCategraf是一个监控采集Agent,类似
- 安全 . 运维 1193 2023-06-09 09:18:59
-
- 【夜莺监控】告警管理,香!
- 监控是方法,告警是手段,解决是目的。但是,大家有没有遇到这种困惑。我收集了一大堆指标,但是我不知道哪些指标应该告警,也不知道如何把这些告警发送到对应的团队或者个人,更不知道如何做告警升级。我之前用Prometheus+Altermanager这一套的时候,为每个团队弄一个钉钉群,然后打了一堆的标签,匹配不同的标签发送到不同的群,如果要做告警升级的话,很多时候都是通过阈值升级来完成,但是同一个告警通过时间来升级就不好办。但是夜莺在做告警规则管理就没那么复杂(复杂的事情他们给你做了),而且还很优雅。
- 安全 . 运维 1198 2023-06-09 08:31:30
-
- 业务指数级增长,可用性建设也可以如此稳当?
- 一、问题与挑战从图中可以看到,从17年开始,vivo的机器规模、服务数量都有很大的增长。在机器规模方面,从17年到22年大概是增长了五倍的左右,在服务数量方面也是基本上增长了十几倍。在规模增长的情况下,挑战和复杂度肯定随之上升,在vivo比较典型的挑战主要分为变更挑战和故障挑战。1、变更挑战变更中还是存在着或多或少的手工变更场景;我们的单次的发布时间是比较长的;存在很多的业务大量迁移的场景;谷歌SRE有这样一个概念:70%的故障是由变更引起的。对应到vivo也确实是存在这种情况,变更对线上稳定性
- 安全 . 运维 927 2023-06-09 00:17:13
-
- 进行自动化安全测试的七个地方
- 就个人而言,我喜欢DevSecOps(安全团队在Dev和Ops正在执行的整个过程中编织安全性)。由于我的热情,客户经常询问我何时、如何以及在何处注入各种类型的测试和其他安全活动。下面是我为客户提供的用于自动化测试的选项列表(在DevOps中有更多的安全工作要做——这只是自动化测试)。他们一起分析列表并根据他们当前的状态决定哪些地方最有意义,并根据他们当前的关注点选择工具。自动化测试的七个地方1.在集成开发环境中:几乎像拼写检查器一样检查代码的工具(不确定这叫什么,有时称为SAST)代理管理和依赖
- 安全 . 运维 1666 2023-06-09 00:07:54
-
- 【夜莺监控】从日志中提取指标的瑞士军刀
- mtail是谷歌开源的一款从应用日志提取metrics的工具,它会实时读取应用程序的日志,然后通过自己编写的脚本分析日志,最终生成时间序列的指标,项目地址是:https://github.com/google/mtail。夜莺的Categraf对日志指标的收集也是采用的mtail,不过做了一些优化,具体优化了什么我们慢慢道来。现在,我们先从谷歌的mtail开始聊起,再慢慢聊到夜莺的mtail插件。mtail的安装前面已经对mtail做了简短的介绍,其实那就是全部。所以,我们直接从安装开始。从ht
- 安全 . 运维 1327 2023-06-08 21:48:04
-
- 流水的运维,铁打的锅
- 在6月5号,唯品会发布了23年3月29号的故障报告,因为南沙IDC冷冻系统故障导致唯品会线上商城停止服务,造成了数以亿计的损失(作为小运维的我,瑟瑟发抖)。对于唯品会来说,线上商城是其核心业务入口,故障不可避免,但是故障如此之长却不能容忍,为什么会造成这种事情发生呢?在我们这种小运维的眼里,这种事故不应该发生在这种量级的公司中,我们都是在模仿、学习他们的PPT中寻找运维之路。但是,PPT的高大上,无法压住故障不发生,这是为什么呢?我个人斗胆说几种猜测:PPT≠现实故障演练=走过场?多活,说说而已
- 安全 . 运维 1407 2023-06-08 21:24:55
PHP讨论组
组员:3305人话题:1500
PHP一种被广泛应用的开放源代码的多用途脚本语言,和其他技术相比,php本身开源免费; 可以将程序嵌入于HTML中去执行, 执行效率比完全生成htmL标记的CGI要高许多,它运行在服务器端,消耗的系统资源相当少,具有跨平台强、效率高的特性,而且php支持几乎所有流行的数据库以及操作系统,最重要的是

