欢迎来到云服务器租用和托管数据中心

网络技术

边缘基础设施管理的5个最佳实践

边缘数据中心——位于他们所服务的客户附近的小型关键任务设施,连接到一个更大的中央数据中心或多个数据中心——随着组织寻求高性能和经济高效的方法来减少延迟,正在越来越多地被使用。边缘数据中心已成为随时随地提供对当今最终用户所需的应用程序、服务和数据的访问的关键。随着大数据、物联网 (IoT)、云和流媒体服务以及其他技术趋势,延迟不再是可以容忍的。

边缘基础设施管理的5个最佳实践

由于边缘的性质,数据中心经理经常难以管理其边缘基础设施。边缘基础设施管理的一些挑战包括管理许多远程站点的复杂性、缺乏现场人员、跟踪设备和配置、站点基础设施监控、站点和设备安全以及设备维护。幸运的是,使用正确的远程管理工具,您可以减少延迟、保持可用性和正常运行时间,并在降低成本的同时实现最佳性能。

边缘基础设施管理的 5 个最佳实践

1. 监控电源和环境趋势

您应该利用企业轮询引擎从您的边缘站点收集所有电力和环境数据,长期保留这些数据,并将其转化为易于使用、灵活的图表功能形式的可操作信息,例如随着时间的推移跟踪您所在位置的有功功率。

Akamai 的 Michael Garito 分享了一个示例,说明趋势功率数据对他的价值。他们的大部分设备都是由内部硬件团队定制的,他们执行广泛的基准测试以确定其在生产中的表现。当他们部署数据中心基础设施管理 (DCIM) 软件时,Garito 说,“令人大开眼界的是,在一天的过程中发现,尽管我们有我们认为会使用的数字,但现实与我们的计划并没有非常一致。

“特别是在一个数据中心,一天中我们的电力需求从低使用期到高使用期的波动幅度可能高达 200 千瓦,”Garito 继续说道。“能够看到这种波动并使用这些信息来防止潜在的问题,例如断路器跳闸,以及确定我们超出预算的区域,这样我们就可以开始在适用的地方进行回填,这是非常有价值的信息,我们期待将其推出到更多地点。”

Garito 还监控和趋势温度数据,以减少 Akamai 的环境足迹和能源成本。

“随着时间的推移,能够监测内部温度使我们能够更好地决定何时吸入外部空气与再循环内部空气,”Garito 说。“所有这些数据随时可用并能够在一段时间内对其进行跟踪,这使我们不仅可以规划日常运营,还可以开始进行长期规划,这样我们就可以开始规划整个季节并相应地分配资源。”

边缘基础设施管理的5个最佳实践

2. 监控电力负载

在边缘部署设备成本高昂,您希望在从第三方租用的空间中放置尽可能多的设备。因此,监控电源负载不仅对于了解功耗的总体趋势很重要,而且对于了解您需要为部署的每个计算设备预算的确切负载也很重要。

Comcast 利用第二代 DCIM中的自动功率预算功能,为部署的每个计算设备收集大量数据,并使用用户可配置的策略,计算出部署每个品牌/型号实例时使用的高度准确的预算值。每个实例都有自己的预算,允许您在租用的给定空间中部署更多的计算容量。

Comcast 的迈克尔·皮尔斯 (Michael Piers) 说:“这是我们可以利用的一项重要功能。” “过去,我们所做的是一个非常手动的过程,我们会查看每个电源的铭牌并取一些任意数字,比如 60%...我们使用这个工具发现并实际得到的东西从 Power IQ 到 dcTrack 的实时数据是我们有一些设备,而不是我们使用的这 60%,可能只使用了 38%……而且我们能够在其中放置更多的设备空间。当您已经为它付费时,利用这种搁浅的力量是非常巨大的。对我们来说,这是使用该工具的真正巨大好处。”

3. 监控边缘站点的健康状况

边缘数据中心是关键任务,您需要监控它们的健康状况以确保服务继续运行。您需要一个整体视图——例如一个企业健康仪表板,它在一个单一的管理面板中显示所有边缘站点的实时电源和环境健康状况以及事件——并且能够向下钻取细粒度的机柜级指标。在这样的仪表板中,易于理解的红色/绿色/黄色颜色编码指示您的站点在可能成为问题的潜在事件或容量限制方面的状态,例如关键事件、最热的机架、最近添加的数量和佣金和当前的电力负荷。

“瓷砖的简单颜色编码是我最喜欢的功能之一,因为红色不好,绿色很好,黄色表示通常可以等到午餐后,”Akamai 的 Garito 说。

“我们最近有一个机架因功率为 9.3kw 而发出警报,而它是一个 17kw 的机架,”Garito 继续说道。“问题是有两个 PDU,每个 9.6 千瓦,功率绰绰有余。问题是现场团队没有正确地平衡两个机架 PDU 之间的服务器负载。这种事情通过 QA 就可以了,因为当它通过 QA 时,它没有足够的功率来触发警报,但是一旦它投入生产并实际获得该流量负载,这些警报就会出现。能够快速识别问题并快速区分一个 PDU 与另一个 PDU 上的所有负载,这些都是在问题升级之前实现快速响应的类型。”

边缘基础设施管理的5个最佳实践

4. 监控电源和冷却能力

增加功率容量或冷却容量通常有提前期,因此您需要准确了解您当前的容量是多少以及何时会用完。利用具有零配置仪表板小部件的DCIM 解决方案,例如按站点划分的容量计,以准确查看您所在的位置。使用您自己的红色/黄色/绿色阈值配置您的仪表,以轻松查看您是否在每个站点都有容量、是否需要额外容量,或者是否在任何地方都用完了容量。

“计划何时需要增加电力或需要增加冷却,以及两者之间的相关性——1 瓦为 3.41 BTU——是我们关注并能够理解和更好地利用我们的空间和电力,并更有效地利用的东西这些美妙的资产,”皮尔斯说。“这个工具绝对可以帮助我们了解我们所处的位置和我们要去的地方。”

5. 跟踪所有站点的所有资产

大多数拥有边缘站点的组织都有涉及多个位置和业务应用程序的复杂部署。维护每个站点所有设备的准确清单需要实时查看机柜内容、基础设施设备和布线。使用 DCIM 软件,您可以从不同的位置并排查看多个机柜,并查看机柜中物品的高保真正面和背面图像。在基于角色的访问控制方面,可以与同事共享自动绘制的机架立面图,以便他们看到与您相同的视图。

“在开始使用 DCIM 之前,一切都会进入数据库。但是,关于数据库的事情是数据库主要由人组成,这往往是跟踪这些事情的薄弱环节。拥有数十万个资产,需要跟踪很多东西,”Garito 说。“除此之外,我们的许多项目都跨越多个机架,因此您可能在相邻机架或一两排设备中有一组设备,这些集群可能会反馈到另一个机架中的聚合层。能够快速、直观地展示这些信息可以显着改善规划和故障排除。”

奖励:远程可视化您的边缘站点

现代边缘基础设施管理软件将提供比现场更好的远程可视化。您可以查看任何站点并获得真实的平面图视图,就像您身临其境一样,但也可以引入各种信息,例如可用 RU、前端温度和测得的电流,以快速查看站点的健康状况以及您可以在何处部署设备。您还可以隔离一行并叠加数据,例如实际电力负载、预算负载和环境传感器数据。您甚至可以查看橱柜上方和地板下方。

通过远程可视化,您还可以通过颜色编码将数据转化为易于理解的信息。例如,按任何资产属性(例如客户)对您的机柜和内容进行颜色编码,并查看谁拥有哪些机柜和哪些设备。了解您拥有什么、谁拥有它以及设备上的 SLA 是有效管理边缘站点的关键。

“对于故障排除,能够在视觉上快速识别所有内容通常是关键,”Garito 说。“因为我们有这么多不同的设备、不同的服务器型号、服务器型号的不同变体,我们跟踪所有这些信息,能够快速识别——不仅仅是准备一个列表——而是识别特定型号的所有服务器在空间中的位置被认为有缺陷的零件……并在问题发生之前将它们停产。”

边缘基础设施管理的5个最佳实践

汇集一切

由于缺乏现场人员并且无法了解正在发生的事情,边缘基础设施管理可能是一个挑战,但是使用 DCIM 软件,您可以简化边缘基础设施管理并提高正常运行时间、效率和生产力。无论您是刚刚了解 DCIM 软件还是已经是资深用户,这些来自业界最佳边缘数据中心专业人士的最佳实践和技巧都可以帮助您克服管理边缘站点的挑战。当您的新知识与 DCIM 软件结合使用时,将推动更智能、更有效的边缘基础设施管理。

Copyright © 2003-2020 香港服务器和服务器租用 梦飞数据中心 版权所有