Oracle Exadata Exascale: gran cambio de arquitectura para cargas de trabajo pequeñas

El servicio de base de datos Exadata en Exascale (ExaDB-XS) anunciado recientemente por Oracle tiene como objetivo mejorar el rendimiento de las cargas de trabajo de bases de datos y reducir los costos.

La arquitectura en Exascale, que es la arquitectura multiinquilino de Oracle que asigna de manera inteligente grupos de computación optimizados para sus bases de datos, se basa en los mismos dispositivos (X8M, X9M y X10M) que Oracle utiliza en su servicio de base de datos Exadata en infraestructura dedicada. Exadata data de hace una década y es la infraestructura de Oracle para su base de datos relacional.

Lo nuevo es un enfoque en cargas de trabajo de inteligencia artificial (IA) y bases de datos vectoriales, así como una estructura de costos de pago por uso.

Desde que sus dispositivos X8M estuvieron disponibles, Oracle ha conectado servidores al almacenamiento a través de redes RoCE, y los servidores de almacenamiento de Oracle están equipados con su memoria XRMEM, a la que se accede a través de RDMA desde unidades NVMe y HDD para formar tres niveles de almacenamiento: caliente, tibio y frío.

Esa lógica se ha adaptado a una arquitectura compartida, principalmente modificando el software de gestión de las bases de datos.

“Antes de esto, cada inquilino tenía su propio almacenamiento y computación Exadata dedicado”, dijo Kodi Umamageswaran, vicepresidente senior de Exadata y tecnologías de escalamiento horizontal en Oracle.

“Y teníamos un software llamado Gestión automática de almacenamiento (ASM) que se utilizaba para distribuir el almacenamiento entre bases de datos”, dijo. “Ahora, un conjunto común de computación y almacenamiento a exaescala se hará cargo de miles de inquilinos y millones de bases de datos”.

En resumen, se utiliza un plano de control exaescala específico para administrar las máquinas virtuales y el almacenamiento.

Tradicionalmente, Oracle representaba cada disco duro en el sistema operativo mediante un número de unidad lógica (LUN) y administraba todos los activos lógicos en forma de archivos, como datos en una base de datos, instantáneas, registros de rehacer, clones y bloques de almacenamiento.

Más contenido para leer:  IA generativa: privacidad de datos, copia de seguridad y cumplimiento

Pero con Oracle ASM, cada tipo de archivo se comparte por cada grupo de unidades asociadas con la base de datos, sus archivos de recuperación, instantáneas y configuración de almacenamiento extendido. Esto sirve para garantizar la redundancia de los datos y su separación entre volúmenes de almacenamiento discretos.

A partir de ahora, con Exascale, será el tipo de archivo el que determine la redundancia. Las plantillas permiten la configuración de niveles de redundancia y el plano de control garantiza que los datos no se almacenen en la misma unidad.

Además, los archivos se dividen en “extensiones” de 8 MB, como las llama Oracle, un tamaño elegido para optimizar el rendimiento en la arquitectura multiinquilino. “Estos fragmentos de 8 MB son lo suficientemente grandes como para obtener un buen rendimiento secuencial cuando escaneamos datos contiguos”, dijo Umamageswaran. “Y lo suficientemente pequeño como para permitir la distribución de una base de datos a través de la nube de almacenamiento para compartir la carga de E/S”.

Las extensiones se asignan a los depósitos de almacenamiento mediante un código hash y una tabla de mapeo indica en qué disco están almacenados. “Todas las extensiones que residen en un depósito se almacenan de manera redundante en tres discos en tres servidores de almacenamiento para proteger contra cortes de almacenamiento e interrupciones del servicio”, dijo Umamageswaran.

El número máximo de depósitos se fija en 100.000. “Es suficiente para compartir los datos entre miles de servidores de almacenamiento y lo suficientemente pequeño para la tabla de correspondencia que se mantiene en caché en los servidores de bases de datos del cliente”, dijo.

Más contenido para leer:  Los directores de seguridad de la información (CISO) no cuentan con suficiente apoyo y están bajo presión, según Trellix

Rendimiento igual al de una infraestructura dedicada

Esta arquitectura, que utiliza una red RoCE y un protocolo de conexión RDMA, permite un rendimiento similar al de los servicios dedicados de Exadata. Eso significa un rendimiento de 2880 GBps con cargas de trabajo de referencia genéricas y una latencia de 17 µs, con servidores X10M.

Este rendimiento se deriva de la organización en niveles de datos sobre la marcha y automatiza la paralelización del procesamiento SQL, entre otras cosas.

Los desarrolladores pueden beneficiarse de la posibilidad de crear clones de bases de datos, completos o “ligeros”, a partir de una base de datos en producción o una instantánea. La tecnología de redireccionamiento en escritura reduce la capacidad de almacenamiento requerida para los clones porque los clones comparten bloques de la base de datos original sin guardar datos nuevos. Sin embargo, la mayoría de estas funciones ya existen.

En lugar de grupos de discos, los administradores ahora ven “bóvedas” adjuntas a los clústeres de VM. Estas bóvedas son contenedores de almacenamiento lógico que extraen recursos de servidores físicos conectados a clústeres de VM.

Las bóvedas representan una forma nueva y más visible de trabajar para los administradores porque la base de datos Oracle las utiliza directamente en lugar de los grupos de discos ASM.

Durante la implementación, es posible configurar máquinas virtuales, bóvedas conectadas y aprovisionar la imagen del contenedor de la base de datos de la misma manera que la red de nube virtual y sus redes de cliente y de respaldo.

Los administradores pueden implementar entre dos y 10 máquinas virtuales, y a cada una se le asigna una cantidad elástica de núcleos por hora en el esquema ECPU de Oracle. Una bóveda puede tener entre 300 GB y 100 TB de espacio de almacenamiento.

Más contenido para leer:  Emerging low-loss materials pave road to 6G

Menos costoso, a menor escala

Gracias a la arquitectura multiinquilino, ExaDB-XS será un 95% menos costoso que Exadata Cloud Infrastructure X9M Dedicated.

Para una configuración básica (incluida la licencia) que utiliza un cuarto de rack X9M, es decir, dos servidores de bases de datos para tres servidores de almacenamiento, la infraestructura de nube Exadata dedicada cuesta 10.000 € al mes aproximadamente, en comparación con los 330 € al mes con la infraestructura Exadata Exascale.

Debe agregar los servicios de base de datos Exadata en ejecución, que Oracle factura como procesamiento a través de RDMA. Una instancia base de ExaDB-XS cuesta alrededor de 4.000 € al mes, frente a los 13.700 € de una instancia dedicada X9M en la nube, con 4 OCPU (8vCPU) asociadas al servicio de base de datos Exadata. Según el proveedor, esto supone un ahorro de alrededor del 70%.

Si bien la instancia X9M de un cuarto de rack tiene más capacidad de almacenamiento (190 TB), 4 OCPU no son suficientes para procesar esta cantidad de datos. Por lo tanto, es posible que Exadata Exascale no sea menos costoso para la misma capacidad de almacenamiento.

“El pequeño coste de Exascale permite a las grandes empresas y pymes utilizarlo para pequeñas cargas de trabajo”, afirmó Umamageswaran.

Los analistas coinciden en que Oracle continúa innovando frente a la competencia de sus competidores. Entre ellos, los más importantes son PostgreSQL y sus variantes, respaldados por grandes implementaciones entre los gigantes de la nube, además de MongoDB. Oracle tardó en ofrecer licencias basadas en el uso, pero parece decidido a ponerse al día.

En el futuro, Exadata Exascale será la arquitectura subyacente para todos los servicios de bases de datos en Oracle Cloud Infrastructure, según Umamageswaran.

Nuestro objetivo fué el mismo desde 2004, unir personas y ayudarlas en sus acciones online, siempre gratis, eficiente y sobre todo fácil!

¿Donde estamos?

Mendoza, Argentina

Nuestras Redes Sociales