En este podcast, analizamos el almacenamiento distribuido en la nube con Enrico Signoretti, vicepresidente de productos y asociaciones de Cubbit.
Hablamos de cómo el almacenamiento ha pasado a modos híbridos y multinube y de cómo el almacenamiento distribuido en la nube separa el plano de control de los datos para proporcionar retención de datos en múltiples ubicaciones, en el sitio y en múltiples nubes.
Signoretti también habla de cómo las organizaciones que necesitan mantener el control sobre los datos (sobre los costos y la ubicación, por ejemplo) pueden lograrlo con la nube distribuida, además de hablar sobre las cargas de trabajo a las que se adapta mejor.
Antony Adshead: ¿Qué es la nube distribuida y por qué es importante en este momento?
Enrico Signoretti: Entonces, puedo comenzar con por qué es importante en este momento y luego profundizar en qué es y qué hace.
Es importante porque vivimos en un momento en el que las empresas están abandonando los modelos tradicionales, al principio, [to] solo la nube, y luego descubrimos la nube híbrida, por lo que mantuvimos algunas de nuestras cosas de TI en las instalaciones y otras en la nube pública.
Luego hablábamos cada vez más de multinube; la mayoría de las grandes empresas tienen múltiples nubes y múltiples aplicaciones ejecutándose en diferentes entornos.
Entonces, desde este punto de vista, una nube distribuida es un modelo totalmente diferente a lo que estamos acostumbrados a ver en el mercado. Entonces, los grandes hiperescaladores hacen todo en centros de datos únicos. Así que sí, se ve la nube, pero todo ejecutándose en uno o en un conjunto de centros de datos muy cerrados.
Con el modelo de nube distribuida separas el plano de control del plano de datos; algo que sucedió en el pasado cuando hablábamos de definido por software.
Así, el proveedor de servicios mantiene el control de este plano de control. . . pero los recursos se pueden utilizar y desplegar en todas partes. Podrían estar en el mismo entorno de nube pública que mencioné antes o en su centro de datos. Entonces, estás construyendo esta nube distribuida.
Más aún, cuando se trata de almacenamiento, cuando hablamos de nube distribuida geográficamente, significa que estos recursos realmente están distribuidos geográficamente, lo que significa que puede tener algunos de sus datos en Francia tal vez y otros segmentos de los datos en Italia o Alemania. o incluso más distribuido que eso.
Este es el concepto principal y es realmente importante para todos porque elimina muchos obstáculos cuando llega el momento de trabajar con la multinube.
Adshead: ¿Cuáles son las ventajas y desventajas de la nube distribuida frente a la nube pública y el centro de datos in situ?
Signoretti: El principal beneficio de la nube distribuida es el control. Puedes tener control en varios niveles. Cuando empiezas a pensar en la nube distribuida, no hay ningún bloqueo porque tienes la posibilidad de elegir dónde poner tus datos.
Existe soberanía de datos así como –podríamos llamarla– independencia de datos. No solo se logra la soberanía de los datos, sino que también se logra el control de todas las capas y todos los aspectos de la gestión de datos.
Y esto es muy importante porque, aunque la mayoría de los hiperescaladores responden muy rápidamente a las nuevas regulaciones que están apareciendo aquí en Europa, y también en los EE. UU., sigue siendo un mundo complejo y para muchas organizaciones en Europa que dan sus datos a Este tipo de organización no es factible.
La idea aquí es que con la nube distribuida tienes el nivel de soberanía que necesitas pero también control de costos, control de políticas que se aplican a esta gestión de datos.
Quizás si pensamos en una comparación entre los tres modelos (local, nube pública y nube distribuida) podemos ver que la nube distribuida está justo en el medio entre las demás. Por un lado, mantienes el control de toda la pila y, por otro, tienes la flexibilidad de la nube pública.
Entonces, al combinar estos dos, puede tener una infraestructura muy eficiente implementada y administrada por su organización pero manteniendo todas las ventajas de la nube pública.
Adshead: ¿Cuáles son las principales cargas de trabajo para la nube distribuida?
Signoretti: Hay que pensar en la nube distribuida todavía como nube. Por lo tanto, si tiene una carga de trabajo de baja latencia y alto rendimiento para la cual normalmente necesita la CPU [central processing unit] muy cerca del almacenamiento, eso no es para la nube distribuida.
En ese caso, es mucho mejor elegir algo que esté en las instalaciones o en la misma nube.
Desde mi punto de vista, todas las demás cargas de trabajo están bien, desde copias de seguridad, recuperación ante desastres, colaboración e incluso grandes lagos de datos para almacenar enormes cantidades de datos para la IA. [artificial intelligence] y ml [machine learning].
En la mayoría de los casos puede tener un buen rendimiento. Es sólo la latencia la que no existe, pero lo mismo ocurre con la nube pública. Este es probablemente el conjunto de casos de uso más adecuados para la nube distribuida.