El gobierno del Reino Unido ha tratado de ser proactivo en su enfoque para abordar el cambio climático, comprometiéndose con objetivos ambiciosos como reducir las emisiones de gases de efecto invernadero en al menos un 68% para 2030 en comparación con los niveles de 1990 y lograr cero emisiones netas para 2050.
En apoyo de estos objetivos, las obligaciones pasarán a primer plano a medida que las organizaciones desarrollen y consuman servicios de inteligencia artificial (IA) en asociación con proveedores de nube, que actualmente albergan la mayoría de las soluciones de tecnología de IA.
Si bien la IA en la nube puede acelerar la entrega de capacidades de IA, las demandas, en particular de la IA generativa (GenAI), pueden consumir grandes cantidades de energía y otros recursos. Por lo tanto, además de evaluar a los proveedores de la nube en función de sus capacidades de IA, su postura de sostenibilidad es una máxima prioridad a la hora de hacer una selección.
Lo básico es asociarse únicamente con proveedores de nube que tengan un compromiso demostrado con la sostenibilidad, pero eso es sólo el comienzo. Al implementar aplicaciones GenAI, existe una variedad de mejores prácticas de sostenibilidad y optimización que pueden mitigar muchos de los impactos ambientales del uso de plataformas de IA en la nube.
Incrementar el uso de energía renovable
Cuando sea posible, utilice únicamente servicios GenAI basados en la nube que funcionen con energía renovable. Los proveedores de nube sostenible comparten estadísticas de energía renovable para cada región de la nube y centros de datos de nube específicos. Sin embargo, tenga cuidado con el lavado verde que confunde las fuentes de energía que alimentan los centros de datos en la nube.
Algunos proveedores de nube logran sus objetivos de “energía 100% renovable” mediante el uso de certificados de energía renovable. Utilice estos centros de datos en la nube únicamente como una opción alternativa, no como una solución principal para acceder a la energía renovable.
Minimizar el consumo de energía
La colocación de cargas de trabajo y la programación de trabajos teniendo en cuenta la energía pueden garantizar que las cargas de trabajo de IA en la nube se ejecuten en los centros de datos con mayor probabilidad de operar de manera sostenible. Además, seleccione fuentes de datos en la nube que utilicen energía de manera eficiente.
Verifique la calificación de efectividad del uso de energía (PUE) para los servicios en la nube en general y los centros de datos en la nube específicamente. Las clasificaciones de PUE deben estar lo más cerca posible de 1,0. La mayoría de los centros de datos en la nube tienen clasificaciones PUE entre 1,1 y 1,5.
Tamaño adecuado para el consumo de recursos de la nube
Impulsar una mejor optimización de la nube mediante el seguimiento y la generación de informes del uso del servicio; controlar el uso no autorizado o no intencionado; dimensionar correctamente los recursos de la nube; y ampliar y reducir los recursos según sea necesario. El uso de técnicas GenAI, como el acceso basado en API a grandes modelos de lenguaje (LLM), también es una medida de optimización eficaz.
Sin embargo, hay que tener en cuenta que la accesibilidad mejorada y el coste asequible de la IA, y más específicamente de la GenAI, podrían llevar a un uso excesivo. La optimización de los recursos de la nube debe incluir políticas de gobernanza para gestionar el uso prudente y responsable de las tecnologías GenAI.
Adopte hardware optimizado para IA
Los proveedores de la nube utilizan cada vez más hardware especializado para cargas de trabajo de IA que a menudo también están optimizados energéticamente para la IA. Estos incluyen los sistemas DGX de NVIDIA, los procesadores Trainium e Inferentia de Amazon Web Services (AWS), las unidades de procesamiento Tensor de Google y los conjuntos de chips Microsoft Azure Maia recientemente anunciados.
Los principales proveedores de nube ofrecen este hardware de propósito especial como tipos de instancias de IA designados, que cuando se seleccionan pueden brindar muchos beneficios, incluido un mejor precio y rendimiento, y un menor consumo de energía.
Administre el almacenamiento de datos en consecuencia
El almacenamiento de datos es económico y fácil de usar, lo que ha llevado a una amplia proliferación y replicación de datos. Si bien eliminar datos innecesarios tendrá algunos beneficios de sostenibilidad, el uso y la gestión activos de los datos podrían consumir energía innecesaria.
Una estrategia sostenible incluye eliminar datos que no tienen valor para la organización y seleccionar los tipos de tecnología de almacenamiento más eficientes para diferentes formas de datos. También incluye el uso de almacenamiento fuera de línea cuando sea posible; implementar políticas de gobernanza de datos; almacenar datos cerca de las aplicaciones y procesos que acceden a ellos; y minimizar la replicación de datos.
Minimizar el movimiento de datos
El aumento del uso de la red al mover grandes conjuntos de datos entre centros de datos puede aumentar el consumo de energía. El mejor enfoque para minimizar esto es cotejar los datos que respaldan la IA con los procesos y aplicaciones de modelado de la IA.
Las capacidades de redes entre nubes, incluido el uso de servicios de redes de proveedores en la nube, pueden minimizar el movimiento de datos. Cuando es necesario transportar datos a través de redes, el enfoque más sostenible es garantizar que solo se envíen los datos necesarios.
Establecer arquitecturas de aplicaciones sostenibles
Las aplicaciones incorporarán cada vez más capacidades GenAI, pero no sin el riesgo potencial de introducir ineficiencias. Al diseñar aplicaciones, tenga en cuenta que las actividades de inferencia de IA utilizarán más energía que el entrenamiento del modelo de IA.
Para optimizar la inferencia de IA, utilice modelos de inferencia más pequeños para reducir el uso de memoria, aproveche el hardware y los aceleradores optimizados para la inferencia y utilice puntos de acceso distribuidos para colocar los modelos de IA más cerca del punto de consumo de la aplicación.
Adopte TI fuera de horario
Los procesos GenAI consumen mucha energía, por lo que, además de las fuentes de energía limpia, considere la disponibilidad general de energía. Algunas regiones geográficas ya tienen limitaciones de energía y agregar operaciones adicionales con uso intensivo de energía puede sobrecargar esos sistemas.
Los centros de datos en la nube pueden tener un mayor acceso a energía verde y menos costosa durante las horas de menor actividad. Emplee estrategias de ubicación de cargas de trabajo de IA para aprovechar la disponibilidad de energía en diferentes ubicaciones.
Afinando modelos de IA
Los proveedores de la nube actualmente están invirtiendo miles de millones en modelos de lenguaje grande (LLM) fundamentales para respaldar soluciones GenAI de propósito general. Si bien es posible que algunos LLM deban crearse desde cero, primero intente utilizar estos LLM fundamentales.
El uso de técnicas como el ajuste fino puede ayudar a lograr una mayor precisión utilizando los LLM existentes. Otras técnicas, como la ingeniería rápida, también pueden producir una mejor utilización de los recursos y al mismo tiempo requerir menos energía.