Limitar el carbono en las supercomputadoras de Asia

Blog

HogarHogar / Blog / Limitar el carbono en las supercomputadoras de Asia

Sep 04, 2023

Limitar el carbono en las supercomputadoras de Asia

Diseño de procesador cuidadoso, programación optimizada y fuerte apoyo gubernamental

El diseño cuidadoso del procesador, la programación optimizada y el fuerte apoyo del gobierno están ayudando a que los ecosistemas informáticos de alto rendimiento sean más sostenibles.

AsianScientist (11 de abril de 2023) — Cuando Pixar y Disney compartieron por primera vez un vistazo de su película animada Monsters University de 2013, los fanáticos notaron rápidamente un detalle llamativo: el pelaje que cubría a Sulley, uno de los dos protagonistas de la película, era extremadamente realista.

Millones y millones de diminutas hebras de pelo se balanceaban convincentemente cada vez que el gentil gigante movía sus extremidades, e incluso se erizaban debajo de una camisa ajustada, tal como era de esperar. ¿El secreto de los animadores? Una supercomputadora que se habría clasificado entre las más rápidas del mundo en ese momento, redibujando automáticamente cada hebra de piel y dejando que atrape y refleje la luz con cada cuadro de movimiento.

Las máquinas de escritorio ordinarias no tienen la destreza de procesamiento para realizar este tipo de animación; de hecho, incluso las versiones de gama alta habrían tenido problemas. Pero los animadores revelaron que Sulley y otros monstruos en la película, junto con cada textura, sombreado y marco, deben su existencia nítida y vívida a la computación de alto rendimiento (HPC).

Capaz de manejar miles de millones de cálculos fácilmente, este es el mismo tipo de tecnología que se está aprovechando para predecir tsunamis, impulsar la innovación en el cuidado de la salud y estudiar el origen de los agujeros negros súper masivos. Al combinar potentes procesadores, software sofisticado y otras tecnologías informáticas de vanguardia, HPC emplea miles de nodos informáticos que trabajan simultáneamente para completar tareas informáticas extremadamente complejas mucho más rápido que una computadora normal.

Solo hay un problema. Con un gran poder de cómputo viene una gran responsabilidad energética. Si bien los sistemas HPC están ayudando a resolver algunos de los problemas más apremiantes de la sociedad en la década posterior a Monsters University, plantean otro problema: su enorme huella de carbono.

Para equilibrar el poder de cómputo y la sustentabilidad, las supercomputadoras en Asia se están diseñando cada vez más con procesadores y programación de mayor eficiencia energética. Mientras tanto, los gobiernos se están dando cuenta de la necesidad de fuentes y políticas de energía más sostenibles a medida que dan forma a sus crecientes ecosistemas de HPC.

Uno de los principales impulsores de las emisiones de carbono de HPC es su fuerte demanda de energía. Después de todo, es necesario que haya un flujo de energía fiable y robusto para soportar una potencia informática tan intensa. El sistema HPC detrás de Monsters University, por ejemplo, constaba de 2000 computadoras con un total de 24 000 núcleos. A pesar de este poder de cómputo, la película tomó más de 100 millones de horas de CPU para renderizarse por completo. Mientras tanto, la factura de electricidad de Pixar seguía aumentando.

Además, el sistema Frontier, la supercomputadora más poderosa del mundo a partir de noviembre de 2022, necesita más de 20 MW de energía para sus más de 8,7 millones de núcleos, suficiente para abastecer a unos 52 600 hogares en Singapur durante un mes.

En total, solo alimentar las 500 supercomputadoras más importantes del mundo bombea alrededor de dos millones de toneladas métricas de dióxido de carbono por año, lo que equivale a aproximadamente 285 000 hogares.

Además, cualquier contabilidad honesta del costo ambiental de los sistemas HPC debe hacer un balance de todo el ecosistema de tecnologías que lo respaldan. Después de todo, las propias máquinas informáticas forman solo una parte, aunque central, de la ecuación.

La mayor parte de la energía que fluye hacia las supercomputadoras se disipa en forma de calor. Para gestionar las temperaturas y garantizar que las máquinas sigan funcionando correctamente, las instalaciones informáticas emplean elaborados mecanismos de refrigeración, que a menudo consumen mucha energía.

Otra fuente periférica de emisiones de carbono en los sistemas HPC son los datos. La Agencia Internacional de Energía estimó que en 2021, los centros de datos en todo el mundo usaron entre 220 y 321 TWh de energía, suficiente para eclipsar el consumo de algunos países. Dada la creciente dependencia mundial de los sistemas HPC, el profesor Tan Tin Wee, director ejecutivo del Centro Nacional de Supercomputación (NSCC) de Singapur, predijo que hasta el 10 por ciento del consumo mundial de energía provendrá de las operaciones del centro de datos en el futuro. "El consumo de energía será un gran problema", dijo Tan a Supercomputing Asia.

Una solución importante para los altos costos de energía de los sistemas HPC es maximizar la eficiencia energética de la computación, explicó el profesor Satoshi Matsuoka, director del Centro RIKEN para Ciencias Computacionales, en una entrevista con Supercomputing Asia. El objetivo, dijo, debería ser mantener el consumo de energía en el nivel más bajo posible y, al mismo tiempo, encontrar formas de lograr un mejor rendimiento.

RIKEN alberga la supercomputadora Fugaku, desarrollada por la empresa japonesa Fujitsu. Desde que Fugaku debutó en 2020, ha liderado constantemente la lista TOP500 de las supercomputadoras más rápidas del mundo. Aunque fue destronado por Frontier en junio de 2022, Fugaku sigue siendo un sólido competidor para la supercomputadora más poderosa y energéticamente eficiente del mundo, particularmente cuando se observan sus condiciones de uso real.

Según Matsuoka, gran parte de lo que sustenta el poder de Fugaku es un diseño reflexivo y decidido. "Primero, tuvimos que diseñarlo de manera eficiente", dijo, y señaló que debido a que sabían que la supercomputadora se usaría para la investigación de la sustentabilidad, construyeron específicamente sus partes para lograr el máximo rendimiento informático y eliminar otras funciones extrañas. "La máquina fue construida con la mentalidad de ahorrar energía".

El corazón de Fugaku, y en gran parte responsable de su extrema eficiencia energética, es el procesador A64FX, que también fue desarrollado por Fujitsu.

Un solo chip A64FX contiene 48 núcleos de computación divididos en cuatro grupos de memoria de núcleo (CMG). Cada CMG también puede contener hasta un núcleo adicional cada uno, que funciona como asistente. En el lenguaje de los procesadores, un núcleo es una pequeña unidad de procesamiento que puede realizar tareas informáticas independientemente de otros núcleos. La gran mayoría de los usuarios de computadoras estarán bien atendidos por máquinas que tienen dos o cuatro núcleos. A64FX aumenta su rendimiento al tener 48.

Cada núcleo del A64FX tiene una velocidad de reloj de 1,8 a 2,2 Ghz, lo que significa que cada núcleo puede completar entre 1800 y 2200 millones de ciclos por segundo. Algunas tareas informáticas más simples se pueden completar en un ciclo, mientras que las instrucciones más complejas requieren varios ciclos. Aunque un poco simplista, las velocidades de reloj más altas generalmente se traducen en un rendimiento informático superior.

Matsuoka señaló que además del procesador de Fugaku, la red en sí es muy eficiente. Mientras que las tarjetas de red comerciales consumen de 25 a 30 W por nodo, las redes Ethernet sobre cobre de Fugaku utilizan de 10 a 20 W por nodo.

El diseño de Fugaku también incluye funciones precisas de control de energía para los usuarios. Mientras que la mayoría de los procesadores funcionan con todos los nodos de cómputo encendidos o apagados al mismo tiempo, Fugaku se puede configurar para ejecutar solo las partes relevantes para una determinada tarea. "Contribuye a ahorros significativos en términos de uso de energía", dijo Matsuoka.

Estas características, junto con otras innovaciones de ingeniería, han permitido que la supercomputadora Fugaku rompa las barreras de rendimiento y ahorro de energía. En comparación con la computadora K, una supercomputadora anterior de Fujitsu que se desmanteló en 2019, Matsuoka estimó que Fugaku es unas 70 veces más potente en términos de rendimiento de uso real. "Pero el consumo de energía solo aumentó entre un 20 y un 30 por ciento", explicó. "Por lo tanto, en comparación con su predecesor, la eficiencia energética de Fugaku es casi un factor de 50".

La máxima eficiencia es también el objetivo de MN-3, una supercomputadora desarrollada por la empresa japonesa Preferred Networks, en colaboración con la Universidad de Kobe.

De hecho, a pesar de los increíbles números de Fugaku, MN-3 lo eclipsa cómodamente en términos de eficiencia energética. Según los propios números de Fujitsu, por cada vatio de energía, Fugaku puede realizar alrededor de 15 mil millones de cálculos. Con la misma cantidad de energía, MN-3 puede realizar casi 41 mil millones, más del doble de eficiencia.

Esta estadística impresionante ha colocado consistentemente al MN-3 entre las supercomputadoras más eficientes del mundo, según Green500, una clasificación semestral que enumera las máquinas en términos de eficiencia energética. El MN-3 ocupó el primer lugar en las listas de noviembre de 2021, junio de 2021 y junio de 2020.

"El MN-3 actualmente cuenta con 128 procesadores MN-Core y 1536 CPU Intel Xeon. Consta de 32 nodos con 4 procesadores MN-Core en cada uno", explicó el Dr. Yusuke Doi, vicepresidente de infraestructura informática de Preferred Networks, en un entrevista con Supercomputing Asia.

Sin embargo, "la razón clave por la que MN-3 encabezó la lista Green500 tres veces es precisamente que utiliza MN-Core, que está especializado para el cálculo matricial requerido para el aprendizaje profundo, en lugar de GPU", agregó.

MN-Core es un acelerador diseñado con una arquitectura jerárquica y viene en un paquete de cuatro matrices. Cada dado tiene cuatro bloques de nivel dos, que se dividen a su vez en ocho bloques de nivel uno. A su vez, los bloques de nivel uno albergan 16 bloques aritméticos de matriz, que a su vez contienen cuatro elementos de procesamiento cada uno.

En cada nivel, cada bloque está conectado con redes únicas en el chip, que pueden transmitir, agregar o recopilar datos en cada nivel jerárquico. Se pueden distribuir diferentes partes de un gran conjunto de datos a diferentes partes del bloque, lo que permite un procesamiento y una computación altamente eficientes.

Preferred Networks también empleó optimizaciones de software que liberaron todo el potencial del hardware de MN-Core y ayudaron a aumentar aún más las cifras de eficiencia energética de MN-3.

En particular, la compañía ideó el MN-Core Compiler, un programa que traduce el código de computadora de alto nivel a otro lenguaje más amigable para las máquinas. Fue diseñado con dos objetivos principales: minimizar la necesidad de modificaciones por parte del usuario y maximizar las funciones de MN-Core para lograr el máximo rendimiento informático.

Específicamente, el compilador tuvo que descubrir la forma óptima de asignar los cálculos a cada unidad de cálculo en la estructura jerárquica del MN-Core. Dado que el acelerador usa solo un único flujo de instrucciones, el programa también tenía que garantizar un flujo constante de datos para llevar el rendimiento lo más cerca posible de su máximo teórico.

El resultado final es un software que tiene un fuerte control sobre el hardware y puede dictar cómo se realizarán los cálculos para lograr la máxima eficiencia. "En MN-Core, lo que se decide y procesa convencionalmente dentro del hardware se expone automáticamente al lado del software, y el software puede controlar manualmente los detalles del cálculo en el hardware en un 'modo manual' para optimizar el consumo de energía", explicó Doi.

Esto refleja la filosofía central de Preferred Networks: hacer realidad la verdadera promesa del hardware a través del diseño de software inteligente. "Mientras estén debidamente controlados por el software, puede liberar el verdadero potencial del silicio", dijo Doi.

A pesar de los esfuerzos de sostenibilidad que transforman la industria de empresas como Fujitsu y Preferred Networks, algunos factores cruciales siguen estando fuera del alcance de las entidades privadas.

Por ejemplo, al evaluar el peaje de emisiones de carbono de una supercomputadora, mirar cuánta energía usa o qué tan eficientemente puede realizar los cálculos no es suficiente. También es importante tener en cuenta la combinación energética de su país. Los sistemas HPC en países alimentados principalmente por energía renovable serán más sostenibles que aquellos en territorios que aún dependen de los combustibles fósiles, razón por la cual Matsuoka compartió que parte de la misión de Fugaku es ayudar a Japón a desarrollar su generación de energía solar y eólica marina. Pero no todos los países son capaces de seguir el ritmo.

Según la Autoridad del Mercado Energético (EMA) de Singapur, alrededor del 95 por ciento de la electricidad del país proviene del gas natural. Esta es la forma más limpia de energía de combustible fósil, pero, sin embargo, es una fuente intensiva en carbono. EMA estima que Singapur seguirá dependiendo del gas natural en el futuro previsible, pero sigue buscando e invirtiendo en alternativas más sostenibles, como la energía solar.

Además de desarrollar fuentes de energía más limpias, los gobiernos también tienen el poder de dar forma a los ecosistemas HPC de sus países, elaborando políticas que podrían ayudarlos a satisfacer las demandas de los consumidores y la industria, al mismo tiempo que los mantienen en línea con los objetivos de emisiones.

En Japón, por ejemplo, el gobierno ha anunciado subsidios sustanciales para ayudar a los centros de datos a realizar actualizaciones sostenibles en sus instalaciones. El país también está considerando concentrar estos centros hambrientos de energía en las regiones más frías del país, lo que podría ayudar a reducir las necesidades de electricidad para los sistemas de enfriamiento.

Mientras tanto, el gobierno de Singapur suspendió la aprobación y construcción de nuevos centros de datos en 2019, señalando su huella de energía de 350 MW. La moratoria finalizó en 2022 y permitió a los funcionarios crear nuevos principios rectores para avanzar.

Según las nuevas reglas, solo se certificarán las instalaciones que aprueben estándares internacionales estrictos, empleen las mejores tecnologías de eficiencia energética de su clase y presenten planes claros para integrar las energías renovables y otras vías innovadoras de energía en las operaciones. Estas medidas ayudarán a Singapur a equilibrar la creciente necesidad de centros de datos con la necesidad de responder a la urgente crisis climática.

Sin embargo, las tecnologías y las circunstancias están en constante evolución. Lo que puede ser el mejor en su clase hoy podría ser ineficaz mañana; los objetivos de carbono de este año podrían ser insuficientes el próximo. Ante estas incertidumbres, Singapur ha sentado un buen precedente para sí mismo y un buen ejemplo para el resto de Asia: presione el botón de pausa, haga un balance de los que tienen y los que no tienen y trace un mejor camino a seguir.

En cuanto a NSCC, una instalación de supercomputación financiada por el gobierno, su director ejecutivo, el profesor Tan Tin Wee, señaló que su función es predicar con el ejemplo. Durante los últimos siete años, su equipo ha sido pionero en técnicas de enfriamiento más económicas y eficientes que han reducido el consumo de energía de sus sistemas HPC, un esfuerzo crucial para la supercomputación en un país tropical. "Podemos seguir probando cosas nuevas, que los centros de datos comerciales no pueden darse el lujo de hacer", explicó Tan. "Si podemos mostrar a otros que podemos hacerlo, entonces el resto de la comunidad puede seguir".

Estas técnicas se han aplicado a la supercomputadora más nueva de NSCC, la ASPIRE 2A. Diseñado en base a las lecciones de ASPIRE 1, el ASPIRE 2A tiene un PUE (o efectividad del uso de energía, una métrica utilizada para medir la eficiencia energética de un centro de datos) de cerca de 1,08. Los centros de datos típicos de la región tienen un PUE de 2.

Estas innovaciones ya han recibido un merecido reconocimiento. El centro de datos NUS-NSCC i4.0, que alberga el ASPIRE 2A, recibió el premio Platinum Green Mark Award for Data Centers de la Autoridad de Construcción y Construcción (BCA) en 2021 y el premio W.Media Southeast Asia Cloud & Datacenter (DC) Award for Energy Innovación eficiente en 2022.

Para seguir mejorando la eficiencia energética de sus sistemas, el NSCC también ejecuta simulaciones de sus propias supercomputadoras. De esta manera, dijo Tan, "las supercomputadoras no son solo un contribuyente, sino una solución al problema en sí".

Ya sea que los sistemas HPC se utilicen para crear los monstruos animados más realistas o impulsar el conocimiento científico más avanzado, es importante asegurarse de que sus emisiones se ajusten a los objetivos de sostenibilidad del planeta. Las innovaciones de Asia en procesadores, programación y políticas han demostrado que esto es posible.

Este artículo se publicó por primera vez en la versión impresa de Supercomputing Asia, enero de 2023. Haga clic aquí para suscribirse a la revista Asian Scientist en versión impresa.

Derechos de autor: Revista científica asiática.

Descargo de responsabilidad: este artículo no refleja necesariamente los puntos de vista de AsianScientist o su personal.

#Captura de carbono #Emisiones de carbono #Huella de carbono #Computación de alto rendimiento

Tristan es un escritor científico independiente con sede en Metro Manila, con alrededor de siete años de experiencia escribiendo sobre medicina, biotecnología y medio ambiente. Con una formación formal en biología molecular, una vez soñó con obtener títulos y comenzar su propio laboratorio. Pero en estos días, encuentra su mayor alegría en una botella de cerveza y una hermosa frase.

Tristan es un escritor científico independiente con sede en Metro Manila, con alrededor de siete años de experiencia escribiendo sobre medicina, biotecnología y medio ambiente. Con una formación formal en biología molecular, una vez soñó con obtener títulos y comenzar su propio laboratorio. Pero en estos días, encuentra su mayor alegría en una botella de cerveza y una hermosa frase.

Tristan Manalac limitando el carbono en las supercomputadoras de Asia El preocupante problema de energía de HPC Pensamiento minucioso y un corazón poderoso Simplificación radical en la arquitectura de software y chips Poder, política y precedente potente Tristan Manalac Tristan Manalac