分享

让运维体系落地

 霍耕田 2019-10-11

前序

众所周知,70% 的数据中心故障是由人为造成的。数据中心的拓扑结构非常重要,但是运行管理同样重要。很多业主投入大量资金建设高等级的数据中心,却忽略了运行管理的重要性。

一个完善的运维体系是数据中心运行管理的前提条件,如何能让运维体系100%落地实施,是保障数据中心稳定运行的关键因素。

运维体系标准选择
1)运维体系介绍

Operational Sustainability Management & Operation 数据中心基础设施运维管理指南等标准应用场景。

  • 体系标准选择

  • 标准分析


在工业和信息化部、国家标准化委员会的领导和支持下,由ITSS工作组研制的一套IT服务领域的标准库和一套提供IT服务的方法论。是一套以IT服务生命周期角度出发的管理体系,由5个阶段4个要素组成。

5个阶段:规划设计、部署实施、服务运营、持续改进和监督管理。

4个要素 :人员、过程、技术、资源。

ITIL即IT基础架构库(Information Technology Infrastructure Library)1986年由英国商务部发布,目前已经更新到ITIL v3版本 适用于IT服务管理,在V3版本中它主要强调ITIL 最佳实践的执行支持,以及在改善过程中需要注意的细节。

ITIL v3拥有三个组件:核心组件、补充组件和网络组件。

核心组件:服务战略、服务设计、服务转换、服务运营、服务改进。

补充组件:指导在不同市场、技术或规范环境中的应用,不定期的根据需求进行变更。

网络组件:流程图、定义、模版、业务案例和实例学习等。

GB/T 19001/ISO 9001质量管理体系,用于证实组织具有提供满足顾客要求和适用法规要求的产品的能力,目的在于增进顾客满意

GB/T 24405/ISO 20000信息技术服务管理体系标准,是面向机构的IT服务管理标准,目的是提供建立、实施、运作、监控、评审、维护和改进IT服务管理体系(ITSM)的模型

GB/T 30146/ISO 22301业务连续性管理体系是一套一体化的管理流程计划,使企业对潜在的灾难加以辨别分析,阻止或抵消这些威胁,减少灾难事件给企业带来损失。

TCOS可持续运营标准的目标就是有效管理除Tier 等级分类外可能影响数据中心基础设施长期稳定运行的行为和风险。

主要分为3个要素:Management& Operations、建筑特点、机房地点。

认证前提条件是:需要通过Uptime 的设计认证和建造认证。

2)M&O认证统计


  • 金融类数据中心占比39%。

  • IDC类数据中心占比29%。

  • 运营商类数据中心占比21%。

  • 互联网类数据中心占比11%。

3)体系模型的介绍

M&O的体系模型的5大领域与21域。

数据中心基础设施运维管理指南模型的5大标准与33个子标准。

运维人的苦恼

1)不知道存在什么风险

  • 数据中心硬件系统完善,设备处于平稳期,没有明显故障,导致运维人员思想麻痹,失去风险意识。
  • 运维一线团队每天机械巡检,看不到隐患,导致风险不断累积。
  • 没有风险分析机制,没有技术知识库支撑,导致不知道风险是什么在哪里。
  • 没有设备生命周期的数据累计,导致无法判断设备的生命曲线,错过重大隐患排除的最佳时机。

2)运维界面不清晰

  • 平行部门或岗位之间没有明确的工作界面,导致工作孤岛部门墙。
  • 运维团队岗位职责范围过大,身兼多职,导致不能有效的完成任务。
  • 沟通路径缺乏,导致信息闭塞,不能信息及时共享。
  • 边缘化出现问题相互推诿,无人愿意承担责任,导致问题蔓延扩大。

3)不知道该配置多少人合理

  • 初建建运维团队时,没有经验和方法不知道配置多少人。
  • 参考同类数据中心人员配置,殊不知人家的配置是否合理。
  • 按照老板给的成本配置人员,导致后期工作滞后、风险隐患巨大。
  • 老板要求核算人员配置,苦愁没有标准可依,最后拍脑袋决定。
  • 下属提交上来人员需求,无法判断是否合理,应该多少人。

4)制度流程一大堆就是用不了

  • 套用别人的运维体系,导致水土不服,实施起来费时费力,效果差。

  • 制度文件相互交叉,导致运维体系不能实施。

  • 没有充分根据自身的特点编制,导致制度流程走不通无法落地实施。

  • 运维体系编制时没有考虑驱动因素,导致体系文件成为“工艺品”。

以上问题你的数据中心是否也存在?

中国数据中心设施论—数据中心建设管理者闭门研讨会于2019年11月28日在深圳益田威斯汀酒店(深圳市南山区深南大道9028号-2)三层宴会厅举行。届时,运维领域专家将为您分享风险管理策略、运维界面定义、运维团队组织架构、运维团队岗位职能、运维团队合理配置因素、运维体系应用等案例的独到见解。

请加入我们11月的深圳会议,来聆听行业领先的专家研讨和案例分析,其中涵盖了数据中心每个方面的技术革新和突破,同时也能和中国南方地区的数据中心专业人士交流分享。

研讨会以诸多优秀案例为例,探讨数据中心可持续发展。

了解用户痛点,提供差异化解决方案。

  扫码报名参会

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多