kvmdiskio突然为0

网上科普有关“kvmdiskio突然为0”话题很是火热,小编也是针对kvmdiskio突然为0寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助...

网上科普有关“kvmdiskio突然为0”话题很是火热,小编也是针对kvmdiskio突然为0寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。

1、之前偶尔也会出现个别readonly的情况,没有深入排查,只是推测和chunkserver磁盘坏道有关,当vm读写正好在chunkserver坏道的块上时,可能出现报错,导致异常。

2、此次出现大批量readonly,且监控和日志显示均是在凌晨出现,故排除磁盘坏道问题。

3、如果虚拟机上承载docker 、mysql 等可能造成大并发的业务,也可能造成此类问题。但是虚拟机镜像在mfs上是连续的空间,正常的mysql读写并不会有问题。有出现在vm上进行批量docker容器删除时,出现异常的情况。

4、推测有vm用户提交了大量并发的读写任务,而我们并未对虚拟机读写进行限制,也有可能造成此类问题。前期有vm出现load 90+ 报警,紧接着就有chunkserver出现load 100+的报警,和此问题非常类似。

排查定位:

1、检查宿主机负载、网络等,未发现异常情况。

2、检查mfschunkserver ,发现有部分磁盘出现raid errro。

3、检查mfschunkserver ,发现有一台chunkserver出现load +100,iowait达到90%以上的情况,带宽未见异常,写入的数据量也很低,现象大概持续3分钟左右。

4、检查vm在凌晨的监控情况,发现批量机器出现iowait达到100%,流量、load均未见明显异常。有部分vm上有大量的sendmail进程。

5、检查虚拟机上凌晨的crontab、进程等,没有发现异常。

6、检查mfs上的读写情况,未见在凌晨有大量的 chunk create 和replica,但是 max operations in queue 值特别高。

7、检查虚拟机备份程序,发现正好是在凌晨0:10进行备份,执行了snapshot操作,而且每台vm备份间隔仅1s,初步确认此备份为导致异常的主要原因。

由于snapshot操作并未带来大量的读写,之前并未关注到。在深入剖析了snapshot的原理,发现是执行了类似linux 系统的硬链接操作,此时批量的snapshot虚拟机,200台vm大概20TB,按照mfs的每个chunk块 64MB的划分,换算下来执行一次操作,会产生 2010241024/64 = 327680 创建链接的操作,每台vm备份也会产生1600次操作,如果在1s内没有完成,那么cpu队列就会越来越大,从而产生了load和iowait都非常高的现象。由于镜像备份并不是十分紧急的任务,故将间隔时间修改到60s执行一台。

可能造成虚拟机readonly故障的原因:

1、虚拟机备份进程的批量操作产生大量的并发,导致chunkserver 的cpu队列拥塞,产生vm读写出现iowait过高超时的情况,从而造成了磁盘remount为readonly的情况。故有此类批量操作的动作,一定要考虑并发负载的问题。 因为chunkserver是存储型服务器,cpu配置都比较低。

2、个别vm用户大量的提交任务导致后端异常。针对此现象,使用cgroug 进行io限制。可避免此类问题发生。

3、mfschunkser 规格建议配置一致,避免读写负载出现不均衡的情况。

此次定位问题耗时一周:

1、监控不到位,由于zabbix 进行大批量机器对比时,效率很低,临时部署了openfalcon和grafana,耗时较长。

2、没有关注到备份任务,之前一致以为是vm用户的问题,但是通过监控定位并不是用户的问题。

3、对mfs的snapshot未深入理解。

关于“kvmdiskio突然为0”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!

本文来自作者[之亦]投稿,不代表长隆号立场,如若转载,请注明出处:https://clcgzw.com/cshi/202502-1046.html

(335)

文章推荐

  • 植物生长的必要条件是什么?

    网上科普有关“植物生长的必要条件是什么?”话题很是火热,小编也是针对植物生长的必要条件是什么?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。一:光照。万物生长靠太阳,所以说光的强弱对植物的生长有极大的影响,有些植物喜阳性,有些植喜阴性。二:水分。世间有生命的

    2024年12月15日
    10
  • 北京市公园管理中心的单位简介

    网上科普有关“北京市公园管理中心的单位简介”话题很是火热,小编也是针对北京市公园管理中心的单位简介寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。2006年1月24日北京市人民政府办公厅对外发布京政办发[2006]6号文件——《北京市人民政府办公厅关于组建北京

    2024年12月15日
    16
  • 冷门专业有哪些

    网上科普有关“冷门专业有哪些”话题很是火热,小编也是针对冷门专业有哪些寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。关于冷门专业有哪些如下:冷门专业:材料学类专业、地质类专业、地矿类专业、古生物学专业、兵器类专业、核工程类专业等。大学冷门专业有哪些比较稀少的

    2025年02月19日
    281
  • 深圳社保三档缴费标准

    网上科普有关“深圳社保三档缴费标准”话题很是火热,小编也是针对深圳社保三档缴费标准寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。深圳社保分三档,档数越高,其以后享受的待遇也越好,当然,各个档数每月所交的费用也不一样。那么深圳社保三档多少钱一个月呢?下面让我们

    2025年02月19日
    345
  • 降血压的茶有哪些?

    网上科普有关“降血压的茶有哪些?”话题很是火热,小编也是针对降血压的茶有哪些?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。现在身体健康对于人们来说很重要,都注重养生,注重身体素质,茶的种类很多,泡制的方法也不同,还有平时的保健养生也很重要的!注意降血压的茶

    2025年02月19日
    268
  • 京东快递赔偿标准是什么?

    网上科普有关“京东快递赔偿标准是什么?”话题很是火热,小编也是针对京东快递赔偿标准是什么?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。2022京东快递延误赔偿标准如下:消费者下单成功后,京东规定48内不发货算是延迟发货。第三方卖家延迟发货赔偿30%,最高5

    2025年02月20日
    328
  • 河北未来几天的天气预报?

    网上科普有关“河北未来几天的天气预报?”话题很是火热,小编也是针对河北未来几天的天气预报?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。7月12日白天,保定、廊坊及以北地区和沧州北部阴有大到暴雨,局地有大暴雨,其他地区阴有小到中雨。雷雨时局地伴有短时强降水、

    2025年02月20日
    270
  • 南平天气预报:武夷山市气象台发布暴雨蓝色预警信号

    网上科普有关“南平天气预报:武夷山市气象台发布暴雨蓝色预警信号”话题很是火热,小编也是针对南平天气预报:武夷山市气象台发布暴雨蓝色预警信号寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。在冷空气足够的厚的情况下,它是可以翻山越岭,就不要说秦岭,根本就不是它对手

    2025年02月20日
    292
  • 北京发布了哪6个预警?

    网上科普有关“北京发布了哪6个预警?”话题很是火热,小编也是针对北京发布了哪6个预警?寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。8月12日至13日,北方现大范围强降雨过程,京津冀等地将出现入汛以来最强降雨,局地暴雨或大暴雨。应对这场强降雨,12日北京11

    2025年02月21日
    344
  • virtualbox怎么共享文件夹

    网上科普有关“virtualbox怎么共享文件夹”话题很是火热,小编也是针对virtualbox怎么共享文件夹寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。方法/步骤1、首先在自己的实体机(电脑)上的磁盘上新建一个文件夹,例如在G盘新建“虚拟机共享文件夹”。

    2025年02月23日
    326

发表回复

本站作者后才能评论

评论列表(4条)

  • 之亦
    之亦 2025年02月24日

    我是长隆号的签约作者“之亦”!

  • 之亦
    之亦 2025年02月24日

    希望本篇文章《kvmdiskio突然为0》能对你有所帮助!

  • 之亦
    之亦 2025年02月24日

    本站[长隆号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 之亦
    之亦 2025年02月24日

    本文概览:网上科普有关“kvmdiskio突然为0”话题很是火热,小编也是针对kvmdiskio突然为0寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助...

    联系我们

    邮件:长隆号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们