El conglomerado de redes sociales Facebook en la optimización de sus desarrollos de centros de datos a hiperescala

El conglomerado de redes sociales Facebook ha descubierto cómo una renovación interna de sus procesos de sistema de gestión de edificios (BMS) en 2017 lo puso en camino para expandir rápidamente su flota global de centros de datos de hiperescala en los próximos años.

Al hablar en la conferencia virtual Schneider Electric Innovation Summit, Jeff Ronan, líder de estrategia técnica global de BMS en Facebook, brindó a los asistentes una mirada entre bastidores a los pasos que el equipo de liderazgo de la empresa ha tomado para cumplir con sus planes de expansión del centro de datos.

Ronan se unió a Facebook en 2012, en un momento en que la empresa estaba empezando a diseñar sus propios centros de datos totalmente nuevos. Él era, en ese momento, el primer contrato de ingeniería de BMS que la compañía había contratado. “Yo era el empleado número 3.000 aproximadamente, y estábamos en medio de la construcción de nuestros dos primeros centros de datos [and] todo nuestro equipo de diseño, construcción y operaciones del centro de datos en ese momento tenía alrededor de dos docenas de personas ”, dijo.

El programa BMS estaba todavía en su infancia. “No teníamos estándares y teníamos secuencias y especificaciones muy vagamente definidas. Cuando me contrataron, mis órdenes de marcha eran: ‘Solo mira a tu alrededor y trata de encontrar una manera de mejorarnos’, dijo Ronan.

Las razones de esto no son difíciles de comprender, ya que 2012 fue un año lleno de acontecimientos para Facebook. La plataforma no solo alcanzó los mil millones de usuarios activos, sino que su equipo de liderazgo también fortaleció su control en el mercado de las redes sociales a través de su adquisición por $ 1 mil millones del sitio para compartir fotos Instagram.

La compañía necesitaba asegurarse de tener un plan de expansión de centro de datos escalable y resistente para adaptarse al crecimiento en el número de usuarios y las interacciones que su creciente lista de plataformas de redes sociales generaría potencialmente.

Este desafío se volvería aún más apremiante en los años siguientes, con el despegue de Facebook Messenger, junto con la compra de la empresa en 2014 del servicio de mensajería instantánea WhatsApp. “A principios de 2017, nuestro liderazgo lanzó una [datacentre] programa de construcción y, al mismo tiempo, estábamos llegando a los límites de nuestro control digital directo actual [DDC] plataforma ”, dijo Ronan.

Sistemas DDC

Los sistemas DDC son sistemas de control que normalmente se implementan en propiedades comerciales y oficinas para regular sus sistemas de calefacción, ventilación y aire acondicionado (HVAC), pero no siempre se consideran adecuados para entornos de misión crítica, incluidos los centros de datos.

“Nuestros centros de datos se consideran instalaciones críticas, que se tambalean en la línea entre lo comercial y lo industrial [use cases] al considerar un sistema de gestión de edificios ”, dijo Ronan.

Algunos de los problemas que enfrentaba la empresa con su plataforma DDC se remontaban al hecho de que era propietaria, lo que limitaba la gama de socios tecnológicos con los que Facebook podía trabajar, pero también carecía de “redundancia inherente”.

“Necesitábamos resolver todos estos problemas si [our datacentre buildouts were] se volverá más repetible y escalable ”, dijo.

En el transcurso de un mes, los equipos de operaciones, diseño y construcción de Facebook llevaron a cabo una evaluación para establecer la mejor manera de abordar estos problemas, antes de encontrar un reemplazo adecuado para su plataforma DDC patentada.

“[They] acordó pivotar a un PLC [programmable logic controller] plataforma y un modelo de entrega que podría proporcionar una solución más intrínsecamente redundante con mayor velocidad de comercialización ”, dijo Ronan.

“Un controlador lógico programable que se puede adquirir a través de cualquier mayorista, y que cualquier integrador de sistemas calificado puede instalar y poner en servicio, y esto realmente nos abrió nuestras opciones”.

“Necesitábamos un socio con alcance global, que pudiera respaldar todas las facetas de nuestras necesidades comerciales de BMS en todo el mundo”

Jeff Ronan, Facebook

Los PLC se clasifican como sistemas de control industrial y, por lo general, cuentan con una unidad de computadora robusta que se puede usar para automatizar y regular los procesos del centro de datos de una manera más personalizada y personalizable.

Habiendo decidido que cambiar su DDC por un PLC sería el camino correcto a seguir, la empresa necesitaba encontrar el proveedor adecuado para obtener la tecnología, antes de decidirse por Schneider Electric.

“Necesitábamos un socio con alcance global, que pudiera respaldar todas las facetas de nuestras necesidades comerciales de BMS en todo el mundo”, dijo. “Nosotros [also] Necesitaba un socio lo suficientemente grande y flexible para ir rápido y cambiar de rumbo en un abrir y cerrar de ojos. Necesitábamos un socio que trabajara en estrecha colaboración con nosotros para comprender nuestros desafíos y desarrollar soluciones juntos.

“Deberían ser expertos en el hardware de la plataforma, pero también en HVAC y controles. Nosotros [also] necesitaba un socio que nos permitiera influir en sus hojas de ruta de productos y crear herramientas que respaldaran nuestros cada vez más complejos diseños y procesos “.

Tras un proceso de entrevistas “largo y arduo”, Schneider emergió como el proveedor que podía cumplir con sus criterios, dijo Ronan. “Y sentimos que podíamos confiar [the company] para ayudarnos a alcanzar nuestro crecimiento global “.

El equipo de Ronan recomendó al equipo de liderazgo sénior de Facebook que procedieran con relativa lentitud con el contrato de Schneider al contratar a la empresa para trabajar con ella en una implementación piloto. “[That was so] podríamos obtener lecciones que nos ayuden a construir un plan de ejecución repetible y de alta calidad ”, dijo, pero el equipo de administración de Facebook tenía otras ideas sobre cómo debería proceder el compromiso.

“Nuestro equipo de liderazgo tomó la decisión de ‘estafar la tirita’ para trasladar inmediatamente todo el diseño y los próximos proyectos a PLC”, dijo Ronan. “Significó mucho trabajo para todos, pero, en retrospectiva, fue la decisión correcta”.

Finalización del diseño

En el momento de esta decisión, la empresa tenía cuatro regiones de centros de datos cerca de la finalización del diseño y dos expansiones regionales que acababan de finalizar, recordó.

“La decisión fue pivotar para cada uno de estos y todos los proyectos en el futuro”, dijo. “Eso significó una reescritura completa de las especificaciones, el desarrollo de todos los nuevos estándares basados ​​en PLC, la construcción de un modelo de entrega de PLC y, al mismo tiempo, obtener la aceptación y aceptación de todos nuestros socios intermedios. También tuvimos que preparar a nuestros equipos internos para gestionar flujos de trabajo completamente nuevos o diferentes “.

Una de las primeras cosas que hizo Schneider Electric después de obtener el contrato de Facebook fue crear un equipo multifuncional, formado por expertos del mundo de la gestión de edificios y los sistemas industriales, recordó Bill Westbrock, ejecutivo de cuentas de estrategia global de la compañía.

“Comenzamos construyendo un equipo multifuncional que se basa en los expertos de Schneider Electric no solo del lado de la administración de edificios que se enfoca en las categorías de HVAC, sino también del lado de la automatización industrial para asegurarnos de que estábamos capturando la parte de automatización industrial de PLC, mezclando esas cosas ”, dijo.

En el lado de Facebook, también se puso en marcha un nuevo modelo de entrega para sus proyectos de centros de datos para garantizar que cada contratista fuera responsable y asumiera la responsabilidad del producto específico del que eran responsables.

“Era un modelo que ninguno de nuestros socios había experimentado nunca, y vino con algunos dolores de crecimiento significativos, pero [as a project owner] sabíamos que la única forma de conseguir lo que realmente queríamos era hacerlo nosotros mismos ”, dijo Ronan.

“Como tal, creamos una estructura de entrega con supervisión directa del propietario del proyecto de desarrollo y entrega de todos los elementos de programación de diseño de hardware asociados con BMS. A nivel de proyecto, los contratistas generales contrataron integradores de sistemas independientes para instalar y poner en marcha cada sitio individual “.

Para dar a los asistentes una idea de cómo el cambio de estrategia había acelerado el ritmo de los planes de desarrollo del centro de datos de Facebook, Ronan explicó cómo la empresa tenía un centro de datos con 50 megavatios de capacidad para 2011.

Sin embargo, para 2018, la compañía tenía 18 granjas de servidores en línea con 450 megavatios de capacidad. “Para fines de 2022, esperamos tener alrededor de 68 centros de datos que atiendan el tráfico en todo el mundo”, dijo.

Y en términos de cuánto tráfico asciende, dijo, a través de Facebook, Messenger, WhatsApp e Instagram, los centros de datos de la empresa albergaron más de 100 mil millones de mensajes todos los días para fines de 2020. Para acomodar todas estas interacciones y mensajes, los centros de datos Las compilaciones de Facebook son decididamente de gran tamaño. “Estos centros de datos no solo son extremadamente grandes, sino que [exist] en un campus de 200 acres, [and that] el campus tiene varias salas de datos, así como una subestación de servicios públicos de alto voltaje ”, dijo Westbrock de Schneider Electric.

“Hay un sistema de energía renovable y docenas de generación en espera para los requisitos de respaldo y luego, por supuesto, una vez que ingresa, solo filas y filas interminables de bastidores e infraestructura de TI”, dijo. “Tanto que necesita scooters y bicicletas para moverse dentro de la sala de datos y para ir de un edificio a otro en el campus. [They] realmente son un diseño y un logro extraordinarios de Facebook “.

Dado el gran tamaño de la huella del centro de datos de Facebook, su equipo de liderazgo senior está continuamente buscando formas de agilizar aún más el proceso de construcción, siendo la optimización de sus procesos un enfoque clave para la empresa a lo largo de 2020.

“Siempre hay que echar un vistazo a lo que funciona y lo que no y hacer correcciones en el rumbo, y 2020 se convirtió en nuestro año de optimización”, dijo Ronan. “Habíamos superado nuestro programa de construcción original, pero necesitábamos una mayor alineación organizativa y una ejecución eficiente.

“A finales de 2019, pusimos en marcha una hoja de ruta agresiva para 2020, trabajando con [our] Equipo de liderazgo. Reorganizamos las estructuras internas del equipo para una alineación más amplia [because] necesitábamos liderar nuestros procesos de ejecución comercial y crear flujos de trabajo mucho más repetibles “.

La bibliotecaria

Este trabajo generó el desarrollo de un kit automatizado llamado The Librarian, que Facebook ahora usa para catalogar todos sus diferentes tipos de sistemas mecánicos en números de modelo, dijo Ronan. “Y el equipo de Schneider Electric creó una herramienta que generará entregables automatizados basados ​​en [known] cuellos de botella. Lo que solía tardar un mes o una semana ahora puede tardar días o incluso horas en producirse “.

Es una tecnología de la que otros operadores de centros de datos también podrían aprovechar los beneficios, continuó Westbrock.

“El Bibliotecario permite a los propietarios y operadores de cualquier empresa de centro de datos reproducir continuamente los escenarios ‘qué pasaría si’”, dijo. “Y hacer eso con un mínimo de personal y costos de ingeniería. Esto permite a los propietarios de centros de datos ejecutar algunos escenarios diferentes y luego continuar mejorando el proceso sin inhibir su flujo de trabajo de diseño actual.

“Al final, esto les permite mantenerse al día con los cambios en la tecnología para satisfacer la creciente demanda de su negocio”, dijo Westbrock. “También libera a parte del personal del equipo de Schneider porque no necesitamos tanta gente que ejecute esos diseños y esas personas pueden ayudar en otras funciones con el negocio de Facebook. Hay grandes eficiencias [to be had] utilizando The Librarian en todas las cuentas de tipo centro de datos “.

Como ejemplo de las eficiencias que Facebook ha logrado mediante el uso de la herramienta The Librarian, Ronan señaló cómo la tecnología había permitido a la organización optimizar el número de variantes de diseño de paneles de 64 a aproximadamente una docena, lo que describió como una “gran mejora ”Para los planes de desarrollo de centros de datos globales de la empresa.

“Nuestros esfuerzos de optimización están dando sus frutos”, dijo. “Pudimos hacer más solicitudes de manera efectiva a medida que el diseño de nuestro centro de datos y la construcción programada crecieron y se aceleraron, y redujimos la plantilla de soporte del programa de Schneider Electric en un 38%, al tiempo que aumentamos la calidad y disminuimos el retraso en el cronograma”.

Reducción de plantilla

Hubo una reducción en la plantilla en el lado de Schneider Electric de 135 miembros del equipo a 88, dijo Ronan. “Mientras tanto, el propio equipo de diseño interno de BMS de Facebook creció de cuatro a lo que ahora es 14. Esto redujo los costos de BMS de nuestro proyecto base en más de un 22% en promedio y creó cierta flexibilidad para cambiar los recursos capacitados y capacitados [around the business]. “

Reflexionando sobre cuáles fueron sus propios aprendizajes personales al participar en el proyecto, dijo que el compromiso con Schneider Electric sirvió para resaltar la importancia de tener “socios confiables y relaciones sólidas” que se basan en la “confianza recíproca” para obtener buenos resultados.

“Sobre todo, debe tener un enfoque de un solo equipo. O tenemos éxito todos juntos o fracasamos todos juntos ”, dijo Ronan.

Exit mobile version