• 向德荣寓言:农夫、青蛙与苍蝇(原创首发) 2019-05-19
  • 杭州教师史记体评语引热议 网友直呼有才、用心 2019-05-13
  • 晋世绘——黄河新闻网 2019-05-13
  • 河北:举报环境违法行为最高可奖励5万元 2019-05-05
  • 魏占军的专栏作者中国国家地理网 2019-05-02
  • 回复@老老保老张工:那边有个铁环,比较适合伪高工玩…… 2019-05-02
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-04-20
  • 让中国高铁领跑世界——我国高铁装备业唯一女总工程师梁建英 2019-04-19
  • eHub发布“鲁班”智能营销云 重塑智能时代的商业变革 2019-04-18
  • 拜博口腔医疗集团创始人、董事长黎昌仁获第十二届人民企业社会责任奖年度人物奖 2019-04-18
  • 巴川中学王苗:留守儿童长大了 2019-04-15
  • 真正学进去 积极讲出来 扎实做起来市委常委部门分别召开会议传达学习全国两会精神 2019-04-15
  • 实拍武汉万人“父母相亲会”  现场“摆摊”征婚 2019-04-13
  • 丸子-热门标签-华商生活 2019-04-13
  • 房奴!房奴!亚历山大幸福吗? 2019-04-06
  • ceph_osd故障检测

    广东十一选5一定牛 www.aavbg.com 1.     当前monitor可以通过3种途径检测到osd离线

    1)      Osd自主上报

     

    2)      Osd通过投票的方式(满足一下条件之一,mon会将osd标记为down)

    a)      投票携带了Force/Immediate标识(和其他osd建立链接时返回econnrefused)

    b)      有效票数已经达到阈值mon_osd_min_down_reporters(默认为2)(同一故障域只会记1票)

    <1>   选择每个pg的Up与Acting中的osd

    <2>   选择在编号上与本osd相邻的前一个和后一个状态为Up的osd

    <3>   如果该osd的心跳伙伴个数小于最小值osd_heartbeat_min_peers(默认为10),则以本osd编号作为基准,依次选择集群中下一个状态为Up,编号相邻的osd,直至达到最小值

    Note: osd之间的心跳采用单播(点对点)的方式(如果集群较大,采用广播可能会导致广播风暴)

    3)      周期性向monitor发送beacon消息进行?;?/h3>

    Osd周期性向monitor发送beacon消息进行?;頾sd_beacon_report_interval(默认100秒),超过mon_osd_report_timeout(默认 300秒)没有收到osd的beacon消息,则将该osd标记为Down

    2.     osd心跳

    1)      osd之间的心跳:

           OSD 之间每 osd_heartbeat_interval(默认 2 秒)会有一个来回心跳包的检测,该心跳包会分别从public和cluster网分别发出,当一个 OSD 在 osd_heartbeat_grace(默认 7 秒)时间内没有收到其他 OSD 心跳的时候,那么这个 OSD 会向 MON 汇报说另一个 OSD 心跳已经超时。当MON 收到多个来自不同故障域的 OSD 都汇报了同一个 OSD 的心跳问题,就会将这个 OSD mark DOWN

    2)      OSD向mon报告自己的状态:

           OSD每最小osd_beacon_report_interval(默认100秒),如果一 OSD 在 mon_osd_report_timeout(默认300秒) 时间内没向mon报告过自己的状态,mon就认为它 down 了。

    3)      Osd向mon报告自己的事件

           从一 OSD 启动或其它可报告事件发生以来,osd_mon_report_interval_min(默认3秒)时间内必须向监视器报告一次,监视器允许 OSD 报告的最大间隔为osd_mon_report_interval_max(默认为15秒),超时将认为 OSD 挂了( down )

    4)      Osd心跳参数:

    osd_heartbeat_interval

    描述:默认值2,osd发送heartbeat给其他osd的间隔时间

     

    osd_heartbeat_grace

    描述:默认值7,OSD 多久没心跳就会被集群认为它挂( down )了

    5)      Osd向mon心跳参数

    osd_beacon_report_interval

    描述:默认值100,osd报告beacon消息间隔

     

    mon_osd_report_timeout

    描述:默认值300,宣布无响应 OSD down 前的宽限期,秒

     

    mon_osd_adjust_heartbeat_grace

    描述:默认值false,设置为 true 时, Ceph 将根据滞后量伸缩

    6)      Osd事件参数:

    osd_mon_report_interval_min

    描述:默认值3,从一 OSD 启动或其它可报告事件发生以来,多长时间内必须向监视器报告一次

     

    osd_mon_report_interval_max

    描述:默认值15,监视器允许 OSD 报告的最大间隔,超时将认为 OSD 挂了( down )

     

    mon_osd_down_out_interval

    描述:默认值10800,在 OSD 停止响应多少秒后把它标记为 down 且 out

     

    mon_osd_adjust_down_out_interval

    描述:默认值false,设置为 true 时, Ceph 将根据滞后量伸缩

     

    3.     参考资料:

    1、//wiki.xsky.com

    2、《ceph之rados设计原理与实现》

    3、//docs.ceph.com

    posted @ 2019-04-20 10:02 hlc-123 阅读(...) 评论(...) 编辑 收藏
  • 向德荣寓言:农夫、青蛙与苍蝇(原创首发) 2019-05-19
  • 杭州教师史记体评语引热议 网友直呼有才、用心 2019-05-13
  • 晋世绘——黄河新闻网 2019-05-13
  • 河北:举报环境违法行为最高可奖励5万元 2019-05-05
  • 魏占军的专栏作者中国国家地理网 2019-05-02
  • 回复@老老保老张工:那边有个铁环,比较适合伪高工玩…… 2019-05-02
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-04-20
  • 让中国高铁领跑世界——我国高铁装备业唯一女总工程师梁建英 2019-04-19
  • eHub发布“鲁班”智能营销云 重塑智能时代的商业变革 2019-04-18
  • 拜博口腔医疗集团创始人、董事长黎昌仁获第十二届人民企业社会责任奖年度人物奖 2019-04-18
  • 巴川中学王苗:留守儿童长大了 2019-04-15
  • 真正学进去 积极讲出来 扎实做起来市委常委部门分别召开会议传达学习全国两会精神 2019-04-15
  • 实拍武汉万人“父母相亲会”  现场“摆摊”征婚 2019-04-13
  • 丸子-热门标签-华商生活 2019-04-13
  • 房奴!房奴!亚历山大幸福吗? 2019-04-06