Nos reunimos con el director ejecutivo de Pure Storage, Charlie Giancarlo, en el evento Accelerate de la compañía en Las Vegas esta semana. Nos dio su opinión sobre por qué la velocidad de escritura del almacenamiento es clave para los puntos de control en las cargas de trabajo de inteligencia artificial (IA), por qué Pure pretende que los datos corporativos estén disponibles rápidamente y en el lugar donde realiza su trabajo diario, cómo su predicción. de la desaparición de la unidad de disco duro (HDD) está en camino y por qué los competidores no pueden copiar los módulos flash de alta capacidad de Pure.
¿Cómo está cambiando la IA el almacenamiento de datos?
Lo que más llama la atención en la prensa es la gran GPU. [graphics processing unit] entornos de tipo IA en la nube a gran escala, porque son grandes ofertas y es emocionante escuchar acerca de decenas de miles de GPU.
Para el almacenamiento es interesante pero es una de las oportunidades más pequeñas. La próxima oportunidad interesante es el mercado de inferencia de IA. Se trata de que las empresas adopten estos diversos modelos, LLM. [large language models] y así sucesivamente, y aplicándolos a su propio entorno y datos (por ejemplo, la industria farmacéutica con el plegamiento de proteínas o el análisis de medicamentos, las empresas comerciales de alta velocidad para el análisis de acciones, los grandes bancos para los fraudes, las empresas de telecomunicaciones para las operaciones de red) y hemos estado trabajando para construir soluciones verticales integradas relevantes para ese tipo de entornos.
Eso significa combinarlo con software, preparación y curación de datos, bases de datos vectoriales, etc., para que sus científicos de datos puedan ponerse en marcha rápidamente.
Además, está lo que estamos haciendo con Fusion. Tradicionalmente, lo que hacía un cliente era procesar y seleccionar datos, copiarlos de entornos relevantes a un almacén de datos o lago de datos y colocarlos en Hadoop o similar para realizar el análisis. Pensamos que eso es una tontería. ¿Por qué no se puede acceder a los datos en los arreglos en los que realiza su misión principal simplemente teniendo suficiente rendimiento allí y teniendo los datos conectados en red?
¿Cómo ayuda Pure Storage con las cargas de trabajo de IA?
Ahora pasamos a las áreas de rendimiento para entornos realmente grandes. Meta tiene 24.000 GPU, por ejemplo. Otro cliente tiene 10.000 GPU. Y luego necesita proporcionar gigabytes o cientos de gigabytes por segundo de rendimiento, y nuestro producto FlashBlade es capaz de hacerlo.
Charlie Giancarlo, almacenamiento puro
Algo de lo que no se ha hablado mucho (la métrica clave) es la escritura, debido a los puntos de control. Los modelos LLM grandes pueden funcionar durante días y semanas, y si algo sale mal, no querrás volver al principio. Entonces toman todos los datos que hay en el modelo y los escriben en la memoria no volátil.
La escritura es de cientos de gigabytes y el modelo se detiene en ese punto: cuanto más te detienes, más tiempo no avanzas.
Por eso la velocidad de escritura es de vital importancia. No sólo tenemos las mejores y más consistentes velocidades de escritura, sino que no utilizamos modelos de almacenamiento en caché y somos extraordinariamente buenos en velocidades de escritura. Es por eso que Meta nos eligió para su súper grupo de investigación.
En el evento del año pasado, usted predijo la desaparición del disco duro giratorio. ¿Cómo va el progreso en eso?
Puedo decirte algunas cosas.
Nuestra familia E de arreglos de almacenamiento de alta densidad que tienen un precio y están posicionados en entornos de almacenamiento HDD continúa creciendo muy rápidamente.
He dicho públicamente que creo que obtendremos nuestra primera victoria en diseño en un hiperescalador este año, y eso es específicamente para reemplazar su almacenamiento estándar y en un entorno de almacenamiento muy grande.
La conversación comenzó en torno a reemplazar su almacenamiento basado en disco, del cual hay varios niveles, pero ahora están hablando de todo su almacenamiento en línea.
Y si estamos hablando de múltiples hiperescaladores, como ocurre en cualquier situación en la que hay un caballo líder, estoy razonablemente seguro de que firmaremos ese caballo líder este año. Uno podría imaginar que si no tuviéramos un precio que pudiera reemplazar el disco, entonces sería poco probable que un hiperescalador lo hiciera.
Literalmente no me preocupa mi predicción anterior.
¿Podría la cadena de suministro soportar tal cambio hacia el flash?
Una buena pregunta, y la que se hacen los hiperescaladores. Si todos dijeran: “Queremos hacer esto el año que viene”, la cadena de suministro no podría soportarlo. Pero todo tiene un final. Hay una rampa para el primer hiperescalador y hay una rampa para el segundo y el tercero.
Creo que la capacidad de la cadena de suministro para satisfacer inmediatamente la demanda y aumentar, digamos, cinco años está ahí.
El punto débil del mercado de HDD son los hiperescaladores: el 60% de sus ventas son para hiperescaladores. Si comienza a cambiar, realmente comienza a sacar el volumen del mercado.
¿Qué impide que otros proveedores fabriquen módulos flash de alta capacidad? Huawei, por ejemplo, planea uno de 128TB [terabyte] unidad flash para el próximo año?
No hay nada que impida que alguien copie nuestro DFM [DirectFlash Module]. Puedes verlo, comprar los mismos chips y construirlo. No es un SSD [solid-state drive]. Es una tarjeta flash con algo para hablar con más autobuses, un pequeño microcontrolador.
Lo que no es fácil de construir es el software que opera estos DFM porque un SSD es algo muy diferente: es un módulo flash que tiene hardware y software para que parezca un disco duro.
Charlie Giancarlo, almacenamiento puro
Retroceda 15 años y los chicos que fabricaban flash dijeron: esto es genial y nos gustaría verlo en computadoras portátiles, de escritorio y servidores. Pero había muchos sistemas operativos diferentes y el flash funciona de manera muy diferente al disco giratorio. Habrían tenido que conseguir que todos los proveedores cambiaran sus sistemas operativos. Entonces decidieron hacer que el flash pareciera un disco duro e inventaron el SSD.
Entonces, el SSD tiene hardware y software para hacer que el flash, un semiconductor, parezca un disco duro mecánico. Al hacerlo, no proporciona el mismo nivel de rendimiento o eficiencia que el flash sin formato.
Por lo tanto, hay que crear SSD para poder escribir inmediatamente, recuperar celdas y hacerlas disponibles, protegerlas contra fallas de energía y hacer todas estas cosas en el módulo mismo. Entonces contiene mucha DRAM. [dynamic random access memory]un microprocesador para realizar toda la conversión a lo que espera un disco duro.
La salsa secreta está en nuestro software que opera en nuestros controladores o en cualquier lugar que se comunique con los DFM.
Puedes considerarlo como una gran cantidad de traducción adicional que no es necesaria. Esa traducción consume energía, hardware costoso y limita el rendimiento.