持续运营的超融合基础设施平台维护确保系统健康
最佳实践将帮助数据中心管理将其超融合平台保持在最佳状态,并使部署未来更新的过程更加简单。
企业在构建IT基础设施之后通常运行多年。超融合基础设施(HCI)的真正价值在于确保正在进行的运营变得简单,从而节省了时间和成本。但是,仍然需要定期进行维护活动,以使超融合基础设施(HCI)平台保持在最佳状态。
虽然最常见的软件维护是修补和更新,但是这些更新可能会解锁新的配置选项或启用新的自动化。
更新:永无止境的故事
与其他任何软件一样,超融合基础设施(HCI)平台也需要更新。每个平台都使用虚拟机管理程序,也有许多平台也使用虚拟存储设备。系统管理程序更新是不可避免的,并且通常是有益的,因为它们可以解决问题并提高性能。无论使用何种虚拟机管理程序,它都将具有某种更新机制,无论它是与虚拟机管理程序集成还是使用外部服务(例如Windows Update或VMware vCenter)进行更新。
如果企业的超融合基础设施使用虚拟存储设备,那么该设备也将有更新。超融合基础设施(HCI)供应商通常会提供一套更新机制,将存储设备更新和虚拟机管理程序更新集成到单个工具中。在理想情况下,将更新工具集成到超融合基础设施(HCI)集群管理中,以实现整个集群的更新而不会导致虚拟机停机。作为客户,企业仍然必须决定何时应用这些更新。
如果遇到问题,并且供应商支持团队建议其更新到较新版本以解决特定问题,也可以触发更新。此外,企业应采取积极主动的方法并安排对测试环境的定期更新,然后再将其部署到生产环境中。
如果没有合适的测试环境,则可能需要等待几周才能部署更新。这使第三方组织或其他企业可以在将更新部署到生产环境之前对其进行测试。如果采用这种观望方式,则应注意更新失败和替换更新包的消息。在部署之前,需要确保几周内未报告任何故障。
没有测试环境并直接部署到生产环境是一个重大风险。控制IT预算的任何人都应了解这种情况,并通知实施测试环境以降低未来风险的成本。
系统优化
IT基础设施面临的挑战之一是将其配置并进行静态配置,然后运行很长时间。部署超融合基础设施(HCI)平台时,应遵循公认的最佳实践,并且应将所有相关技术部署到最佳平台。但是,最佳实践并非一成不变的真理。随着时间的推移,可接受的最佳实践会发生变化,但是通常不会修改已部署的超融合基础设施(HCI)环境以遵循新的程序。
在构建超融合基础设施(HCI)环境之后,需要记录默认设置的任何变化以及这些变化的原因。还应该注意为什么重要设置保留为默认设置。至少每年检查一次,并考虑是否需要对已部署的超融合基础设施进行更改。如果进行了配置更改,需要记住要更新所有文档。
运营优化
运营效率的核心思想之一是使例行和重复性任务自动化。正在进行的优化工作的一部分应该是确定可以自动化的日常任务,例如事件管理、事件日志创建和低风险的软件更新。
随着例行任务的自动化,释放了运营团队成员的工作,使企业能够查看最佳实践和配置详细信息。自动化流程不太容易出错,需要更少的返工,并提供一致的服务。
超融合基础设施平台应以最少的人力提供简单的运营。随着时间的推移,将需要诸如修补和更新之类的维护活动,以及对部署环境的最佳实践、一致性和优化的审查。
超融合基础设施旨在实现滚动升级,因此很少有强制要求批量替换和审查部署。定期的审核计划和结构化的更新周期将使其超融合基础设施平台保持健康发展。