运维

SREWorks 数智服务尝鲜,你的数据准备好了吗?
运维资讯
SREWorks 数智服务尝鲜,你的数据准备好了吗?

在 SREWorks 的开源社群以及各类咨询中,很多用户对其中的数智能力表现出浓厚的兴趣。但在目前的开源版本中,SREWorks 是围绕企业应用,提供端到端的完整数智能力,用户需要将业务应用迁入 SR


运维资讯
京东云开发者|提高IT运维效率,深度解读京东云AIOps落地实践

在过去的几年中,aiops业界提出了各种解决异常检测问题的方法。机器学习 (ML) 和深度学习 (DL) 颇受欢迎。在传统的 ML 中,通常采用 K-means、基于密度的空间聚类和隔离森林 (IFo


美图SRE:一次线上大事故,我悟出了故障治理的3步9招
运维资讯
美图SRE:一次线上大事故,我悟出了故障治理的3步9招

 作者介绍 美图SRE负责人-石鹏2016年加入美图,运维技术专家,美图产品SRE负责人。目前在美图负责社区、商业化、创新等全线产品的运维保障工作,同时参与公司日志、监控等基础设施的建设。参与或主导过


开源项目丨ChengYing 1.1版本重磅发布:新增超多功能,全新优化体验!
运维资讯
开源项目丨ChengYing 1.1版本重磅发布:新增超多功能,全新优化体验!

ChengYing脱胎于袋鼠云数栈自主研发的一站式运维管家EasyManager,承袭袋鼠云开源项目名剑家族的概念,取自十大名剑之承影剑,1.0版本于2022年5月30日在github上线。2022年


开源交流丨一站式大数据平台运维管家ChengYing安装原理剖析
运维资讯
开源交流丨一站式大数据平台运维管家ChengYing安装原理剖析

视频回放:点击这里ChengYing开源项目地址:github 丨 gitee 喜欢我们的项目给我们点个__ STAR!STAR!!STAR!!!(重要的事情说三遍)__技术交流钉钉 qun:3053


运维资讯
StratoVirt 的 vCPU 拓扑(SMP)

常见的 CPU SMP 结构是:因为 x86 和 ARM 的拓扑获取方式不同,下面将会分开进行介绍。在 x86 架构下面,操作系统会通过读取 CPUID 来获取 CPU 拓扑结构。在 x86 体系结构


运维资讯
监控告警怎么搭建比较合理?B站SRE实践总结了4大关键步骤

老板问你系统现在到底健康与否,能不能快速给个判断,你却不敢断言?业务方说你的系统有问题,但你认为没问题,又无法自证?这一切都源自于你的系统没有做好监控和告警:没有监控或者没有一个好的监控,导致你无法快


运维资讯
故障复盘后的告警如何加出效果?浙江移动等老司机总结了 6 条注意事项

某企业内部故障统计数据显示 85%的异常是靠用户上报发现而非监控发现。针对一个故障场景增加一个告警,往往需要增加数百上千个监控项,这样加下去,真的能提升业务异常的监控效率吗?到底告警要怎样加才是有效的


运维资讯
StratoVirt 中的虚拟网卡是如何实现的?

Virtio-net 是一种虚拟的以太网卡,通过 tap 设备基于 virtio 协议的半虚拟化框架来实现前后端通信。Virtio 协议是一种在半虚拟化场景中使用的 I/O 传输协议,它的出现解决了全


运维资讯
openEuler资源利用率提升之道02:典型应用下的效果

本篇我们针对容器在离线场景下的典型应用类型( CPU 敏感型、内存敏感型、网络 IO 敏感型 ),并在搭载了 openEuler 混合部署 QoS 方案的 x86 环境上展开了专项的应用场景测试。针对


10年稳定性保障经验总结,故障复盘要回答哪三大关键问题?|TakinTalks大咖分享
运维资讯
10年稳定性保障经验总结,故障复盘要回答哪三大关键问题?|TakinTalks大咖分享

这是很多企业/团队都要面对的问题,有着超10年系统稳定性保障经验的李道兵老师给我们分享了他的观点:故障复盘的三大关键问题:故障复盘的四大注意项:道兵老师结合实践经验分享了许多干货,感兴趣的可以往下阅读


运维资讯
Grafana9.0发布,Prometheus和Loki查询生成器、全新导航、热图面板等新功能!

https://grafana.com/grafana/plugins/alexanderzobnin-zabbix-app/Grafana 9.0 的主要重点是改善 Grafana 的用户体验,使可


我们被一个 kong 的性能 bug 折腾了一个通宵
运维资讯
我们被一个 kong 的性能 bug 折腾了一个通宵

在我们最早交付的集群中,kong 还是较为早期的 0.14 版本,随着业务层面对安全的要求日益趋增,我们需要基于 kong 实现安全插件,帮助系统能够具备更好的安全能力。由于较为早期的 0.14 版本


运维资讯
openEuler 资源利用率提升之道 01:概论

据 Canalys 发布的一份报告显示[1],全球云基础设施服务支出在 2022 年第一季度同比增长 34%,达到 559 亿美元。然而,多个研究表明,当前全球数据中心用户集群的平均 CPU 利用率低


运维资讯
StratoVirt 的 virtio-blk 设备是如何实现的?

virtio-blk 是虚拟化 KVM 平台下虚拟磁盘的一种实现方式,本质上为一种半模拟技术。virtio-blk 设备中采用 io_event_fd 进行前端到后端通知,采用中断注入方式实现后端到前


c