Requisitos de almacenamiento para IA, ML y análisis en 2022

La inteligencia artificial (IA) y el aprendizaje automático (ML) prometen transformar áreas enteras de la economía y la sociedad, si aún no lo están haciendo. Desde automóviles sin conductor hasta “bots” de servicio al cliente, los sistemas basados en IA y ML están impulsando la próxima ola de automatización empresarial.

También son consumidores masivos de datos. Después de aproximadamente una década de crecimiento relativamente constante, los datos utilizados por los modelos de IA y ML han crecido exponencialmente a medida que los científicos e ingenieros se esfuerzan por mejorar la precisión de sus sistemas. Esto impone demandas nuevas y, en ocasiones, extremas a los sistemas de TI, incluido el almacenamiento.

AI, ML y análisis requieren grandes volúmenes de datos, principalmente en formatos no estructurados. “Todos estos entornos aprovechan grandes cantidades de datos no estructurados”, dice Patrick Smith, CTO de campo para Europa, Oriente Medio y África (EMEA) del proveedor Pure Storage. “Es un mundo de datos no estructurados, no de bloques ni bases de datos”.

El entrenamiento de modelos de IA y ML en particular utiliza conjuntos de datos más grandes para predicciones más precisas. Como señala Vibin Vijay, especialista en inteligencia artificial y aprendizaje automático de OCF, se espera que un modelo básico de prueba de concepto en un solo servidor tenga una precisión del 80 %.

Con el entrenamiento en un grupo de servidores, esto se moverá al 98 % o incluso al 99,99 % de precisión. Pero esto impone sus propias exigencias a la infraestructura de TI. Casi todos los desarrolladores trabajan sobre la base de que más datos es mejor, especialmente en la fase de entrenamiento. “Esto da como resultado colecciones masivas, al menos petabytes, de datos que la organización se ve obligada a administrar”, dice Scott Baker, CMO de IBM Storage.

Los sistemas de almacenamiento pueden convertirse en un cuello de botella. Las últimas aplicaciones de análisis avanzado hacen un uso intensivo de las CPU y, especialmente, de los clústeres de GPU, conectados a través de tecnología como Nvidia InfiniBand. Los desarrolladores incluso están considerando conectar el almacenamiento directamente a las GPU.

“En las cargas de trabajo de IA y ML, la fase de aprendizaje generalmente emplea potentes GPU que son costosas y tienen una gran demanda”, dice Brad King, cofundador y CTO de campo del proveedor Scality. “Pueden masticar grandes volúmenes de datos y, a menudo, pueden esperar sin hacer nada por más datos debido a las limitaciones de almacenamiento.

Más contenido para leer: La consultora cibernética francesa Hackuity establece una operación en el Reino Unido

“Los volúmenes de datos son generalmente grandes. Grande es un término relativo, por supuesto, pero en general, para extraer información útil de los datos, cuantos más datos pertinentes estén disponibles, mejor será la información”.

El desafío es proporcionar almacenamiento de alto rendimiento a escala y dentro del presupuesto. Como señala Vijay de OCF, los diseñadores pueden querer todo el almacenamiento en flash de nivel 0 de alto rendimiento, pero esto rara vez, si es que alguna vez, es práctico. Y debido a la forma en que funcionan AI y ML, especialmente en las fases de capacitación, es posible que no sea necesario.

En cambio, las organizaciones están implementando almacenamiento en niveles, moviendo datos hacia arriba y hacia abajo a través de los niveles desde flash hasta la nube e incluso cinta. “Está buscando los datos correctos, en el lugar correcto, al costo correcto”, dice Vijay.

Las empresas también deben pensar en la retención de datos. Los científicos de datos no pueden predecir qué información se necesita para modelos futuros, y los análisis mejoran con el acceso a datos históricos. El archivo rentable de datos a largo plazo sigue siendo importante.

Song Xperia 1 IV Fecha de lanzamiento, precio y rumores de especificaciones

Rumores de fecha de lanzamiento, precio, características y diseño del iPhone SE 4

Servicios

Recursos

¿Donde estamos?

Requisitos de almacenamiento para IA, ML y análisis en 2022

¿Qué tipos de almacenamiento son mejores?

Almacenamiento de acceso en bloque

archivo y objeto

Almacenamiento en la nube

¿Qué recomiendan los proveedores de almacenamiento?

Song Xperia 1 IV Fecha de lanzamiento, precio y rumores de especificaciones

Rumores de fecha de lanzamiento, precio, características y diseño del iPhone SE 4

Servicios

Recursos

¿Donde estamos?