El consumo de energía y la eficiencia operativa de los centros de datos están bajo intenso escrutinio. Al sentir la necesidad de controlar el crecimiento de los centros de datos, los legisladores y reguladores han comenzado a esforzarse para exigir a los operadores que proporcionen información a nivel de instalación e indicadores clave de desempeño y establezcan umbrales mínimos de desempeño de las instalaciones.
Su objetivo final es exigir a los operadores que informen métricas indicativas de rendimiento y eficiencia, incluida la efectividad del uso de energía (PUE) y una métrica de trabajo entregado por unidad de energía consumida.
La Unión Europea ha actuado primero. La Directiva de Eficiencia Energética (EED) y el Reglamento Delegado (finalizado pero no publicado) exigen que los centros de datos con más de 500 kilovatios de demanda de energía de equipos de TI instalados informen sobre 30 parámetros de ubicación y funcionamiento a los estados miembros y a la base de datos europea sobre centros de datos.
El reglamento delegado final amplía los requisitos de informes EED y establece requisitos de informes para la capacidad de trabajo del servidor instalado (SERT® active state performance o SERT CPUrendimiento) y capacidad de almacenamiento instalada (petabytes).
Incluso sin mandatos regulatorios, una métrica de trabajo por energía representa una de las mejores prácticas de la industria. Cada nueva generación de equipos de TI ofrece el doble o el triple de capacidades de trabajo de los equipos y trabajo por vatio que la generación de equipos anterior. Los avances en el software de gestión de cargas de trabajo permiten a los operadores de TI aumentar la utilización de su infraestructura de equipos de TI. Una métrica de trabajo por energía captura e ilustra los beneficios de actualizar y consolidar los equipos de TI.
Los operadores de centros de datos enfrentan desafíos importantes a la hora de informar sobre los indicadores de capacidad de almacenamiento y servidores. Para cumplir con estos requisitos o calcular una métrica de trabajo por energía para una instalación de centro de datos, los operadores deben mantener un inventario de equipos con datos de componentes críticos y ubicación de equipos y establecer un proceso para capturar y calcular la capacidad de trabajo del servidor del centro de datos. La industria necesita un método estandarizado para informar la capacidad de trabajo del servidor.
Inventarios de equipos
Calcular o estimar las capacidades de trabajo de los equipos de TI requiere conocimiento de la ubicación del equipo y las especificaciones de los componentes. Desafortunadamente, una encuesta sobre el tiempo de actividad de los operadores de TI indica que solo un tercio de los operadores de TI mantienen un inventario detallado de equipos capaz de calcular las capacidades de los equipos en un centro de datos (Tabla 1).
Calcular la capacidad total de trabajo del servidor o la capacidad de almacenamiento de una instalación de centro de datos requiere que un operador conozca la cantidad y el tipo de equipo ubicado en cada instalación. Los resultados de la encuesta indican que sólo el 30% de los operadores pueden hacer esa combinación con su inventario.
Para calcular la capacidad de trabajo total del servidor, un operador de TI necesita conocer la cantidad, el número de pieza y el recuento de núcleos de las CPU instaladas en cada servidor. Se espera que los valores de capacidad de trabajo se asignen mediante el número de pieza de la CPU o el número de núcleos. La capacidad de trabajo total se calculará o estimará con base en la agregación de los valores de capacidad de trabajo de la infraestructura de servidores instalada. La encuesta indica que actualmente sólo el 27% de los operadores recopilan números de pieza de CPU y recuento de núcleos.
Para calcular la capacidad de almacenamiento, el operador necesita conocer la cantidad de dispositivos de almacenamiento y su capacidad para cada equipo de almacenamiento. El 53% de los operadores indica que recogen estos datos.
Los operadores de centros de datos deben tomar tres pasos para actualizar y mejorar sus procesos de gestión e inventario de equipos para calcular la capacidad de trabajo del centro de datos.
- Actualizar el sistema de inventario de equipos para incluir toda la información de los componentes necesarios para calcular la capacidad de trabajo. Además de los valores requeridos para servidores y productos de almacenamiento, también se deben recopilar el ancho de banda y las tasas de transferencia de datos de los equipos de red.
- Actualizar las especificaciones y los procesos de compra de equipos para exigir la presentación de informes y la recopilación de datos de los componentes del equipo. Esto requerirá colaboración con la organización de compras y la creación de un proceso electrónico para recopilar información de inventario.
- Realice un estudio de los equipos informáticos instalados para obtener un inventario completo de la infraestructura existente. El software de descubrimiento de activos que identifica el equipo y captura la información de los componentes ofrece el mejor enfoque para actualizar el inventario actual. También se puede utilizar en lugar de un proceso de adquisición para actualizar el inventario a medida que se instalan nuevos equipos. La otra opción, que requiere muchos recursos, es realizar una encuesta manual.
Crear un sistema de inventario eficaz llevará tiempo y requerirá colaboración entre organizaciones. Los operadores de TI que carecen de un sistema son optimistas sobre su capacidad para crear o actualizar a un sistema viable: el 68% (47% del total de encuestados) indica que pueden implementar un sistema en el plazo de un año.
Capacidad de trabajo del servidor
El reglamento delegado define la capacidad de trabajo del servidor como la puntuación de rendimiento del estado activo de la herramienta de calificación de eficiencia del servidor (SERT®) según lo designado en el reglamento de la Comisión de la UE – 2019/424 (requisitos de diseño ecológico para productos de servidor y almacenamiento). El rendimiento del estado activo es la media geométrica de las puntuaciones de rendimiento medidas 100% normalizadas de los siete worklets de CPU en Server Performance Assessment Corporation (SPECSM) suite. Tiene unidades de transacciones por segundo relativas a un servidor de referencia.
La mayoría de la industria de los centros de datos apoyó el uso de la puntuación de rendimiento del estado activo de SERT como valor representativo de la capacidad de trabajo del servidor. Dado que las mediciones SERT son necesarias para demostrar el cumplimiento de los requisitos de eficiencia energética de los servidores en la UE, EE. UU. y Japón, los fabricantes de servidores están generando mediciones SERT para configuraciones seleccionadas con fines de cumplimiento normativo y de investigación interna.
En colaboración con los fabricantes, The Green Grid (TGG) ha recopilado un conjunto de datos de mediciones SERT para más de 600 configuraciones de servidores con más de 100 números de piezas de CPU. Utilizando este conjunto de datos, TGG realizó un análisis que muestra que la puntuación de rendimiento del estado activo depende del número de pieza de la CPU y es independiente de la configuración del servidor.
Un estudio de 15 números de piezas de CPU, que representan tres generaciones de CPU AMD e Intel, encontró que 13 números de piezas de CPU tenían valores promedio de rendimiento en estado activo y tenían desviaciones estándar que oscilaban entre el 3 y el 20 %, y los números de dos partes tenían desviaciones estándar de alrededor del 30 %. .
En general, los valores de rendimiento del estado activo de la CPU proporcionan una base aceptable para calcular una estimación representativa de la capacidad de trabajo total del centro de datos para servidores estándar basados en CPU, lo que permite comparar los cambios de un año a otro.
Dado el requisito de la regulación delegada del EED de comenzar a informar sobre la capacidad de trabajo limitada para el año del informe 2024, la industria debe establecer una o más bases de datos que contengan valores de rendimiento del estado activo para los números de pieza de la CPU. Las bases de datos podrían ser creadas por organizaciones industriales como TGG o por fabricantes de equipos. Un grupo de trabajo del TGG tiene en marcha un proyecto para publicar una base de datos en el segundo semestre de 2024.
Actualmente, los datos de capacidad de trabajo no están disponibles para servidores que incorporan GPU (servidores basados en GPU) para aplicaciones de computación de alto rendimiento, inteligencia artificial y aprendizaje automático. Estos servidores representan un pequeño porcentaje de la infraestructura de servidores instalada actualmente, pero se espera que su presencia en el centro de datos crezca en el futuro. Según se informa, el comité SPECPower® está trabajando en una extensión de la prueba SERT que medirá el rendimiento y los valores de energía para servidores basados en GPU y proporcionará una capacidad de trabajo para estos servidores.
Capacidad del equipo de almacenamiento
La capacidad de trabajo de un producto de almacenamiento es la capacidad de almacenamiento bruta del producto en terabytes, un valor fácilmente disponible del fabricante del producto. El valor de la capacidad de almacenamiento de un centro de datos es la suma de la capacidad de almacenamiento bruta de todos los productos de almacenamiento instalados. Los operadores deben recopilar y registrar estos datos en su inventario de equipos cuando los compren.
El ancho de banda del equipo de red y la capacidad de transferencia de datos se calcularían de manera similar.
En resumen, dado un inventario completo de equipos de servidor y un conjunto de datos de valores de rendimiento promedio del estado activo de la CPU, los operadores de centros de datos podrán calcular la capacidad de trabajo total de su centro de datos para servidores basados en CPU multiplicando la cantidad de CPU para un número de pieza determinado. el valor de rendimiento del estado activo y sumar esos valores para todos los servidores en un centro de datos específico.
Si bien se trata de una simple suma, se requiere una cantidad significativa de trabajo por parte de los operadores de centros de datos individuales y de la industria de los centros de datos para construir los conjuntos de datos necesarios para completar el cálculo de la capacidad de trabajo para los informes regulatorios.