Siete formas de estar seguro de que puedes restaurar desde una copia de seguridad

Un plan de recuperación ante desastres sólo es eficaz si puede restaurar los datos. Pero a pesar de los crecientes riesgos (especialmente del ransomware), no todas las organizaciones están seguras de poder recuperarse de sus copias de seguridad.

Cuando se trata de copias de seguridad y recuperación, las pruebas periódicas y rigurosas deberían ser una parte fundamental de cualquier plan. Pero hay otras medidas que los administradores de TI pueden tomar, como auditar los procesos de respaldo, seguir la regla de respaldo 3-2-1 y verificar la integridad de los archivos de respaldo.

Las pruebas de respaldo deben ir de la mano con una comprensión profunda de qué sistemas y datos son los más críticos y cómo los sistemas dependen unos de otros en el entorno de producción.

A continuación, resumimos algunas de las preguntas clave que los líderes de TI y los equipos de continuidad del negocio deberían hacerse.

¿Cuáles son los elementos clave de las restauraciones confiables a partir de una copia de seguridad?

Las organizaciones necesitan saber que sus copias de seguridad funcionan, que pueden recuperar datos y restaurar sistemas con la mínima interrupción y sin pérdida ni corrupción de datos.

Esto se divide en varios elementos entrelazados. El plan de copia de seguridad y recuperación de cada organización establecerá el objetivo de tiempo de recuperación (RTO), es decir, la rapidez con la que se deben recuperar los datos; y el objetivo del punto de recuperación (RPO), es decir, hasta dónde está dispuesto a llegar para encontrar la última copia buena de los datos.

Estos parámetros establecen cómo sería una recuperación exitosa para el negocio. Sin embargo, con el ransomware hay otra métrica clave. Y eso es si la empresa puede lograr una restauración limpia de los datos.

No tiene sentido recuperar sistemas después de un ciberataque si al hacerlo se reinfectan los sistemas con código ransomware. Y podría ser que el RPO para, digamos, un corte de energía, sea diferente al RPO para ransomware. Todo se reduce a la tolerancia al riesgo de la empresa.

La restauración confiable también depende de la integridad de los datos recuperados. ¿Los archivos recuperados funcionan como deberían o algunos datos no se pudieron restaurar o se corrompieron?

Las empresas también deben considerar el orden en el que restauran los datos. Algunos sistemas son de misión crítica o deben restaurarse primero debido a dependencias de otras aplicaciones. Una prueba de recuperación debería comprobar si los sistemas vuelven a estar en línea en el orden correcto.

Esto, a su vez, depende del acceso a los medios. Las copias de seguridad en la nube requieren ancho de banda, mientras que las copias locales necesitan que los sistemas de respaldo estén en funcionamiento. Los medios de respaldo externos deben recuperarse y llevarse al sitio, o cargarse en un sistema de respaldo o en la nube.

Las empresas también deben comprobar que los sistemas de conmutación por error o de reserva entren en funcionamiento según lo previsto. Esto incluye capacidad de nube e instalaciones de recuperación ante desastres, si es necesario invocarlas. Por último, ¿puede la organización acceder a los servicios de soporte que necesita para recuperar datos?

Estos incluyen energía y refrigeración, comunicaciones y personal clave. No basta con comprobar que el software de copia de seguridad funcionó según lo previsto.

¿Cómo se auditan los procesos de respaldo?

Una auditoría de respaldo, o una auditoría de respaldo y recuperación, es un proceso formalizado para verificar que el respaldo y la recuperación funcionan como deberían.

Las auditorías de respaldo deben incluir controles sobre dónde se guardan los datos y qué aplicaciones admiten, qué protección de datos existe y la ubicación de los objetivos de respaldo. Esto incluye datos almacenados en la nube y respaldados en la nube.

Luego, la auditoría analizará la recuperación de datos, incluido el cumplimiento de los objetivos de RPO y RTO, y examinará la política y los procedimientos de copia de seguridad y recuperación de la organización. Esto incluye criterios técnicos y quién gestionará el proceso de recuperación.

El resultado será un informe con recomendaciones de acción.

¿Qué es la regla de respaldo 3-2-1?

La regla de copia de seguridad 3-2-1 es un método de larga data para garantizar que los datos estén adecuadamente protegidos. La regla establece que las organizaciones deben conservar tres copias de sus datos, en al menos dos tipos de medios o sistemas de almacenamiento. Una copia de los datos debe estar fuera del sitio.

Mantener la regla 3-2-1 es mucho más fácil ahora que la industria ofrece una gran cantidad de servicios de respaldo basados ​​en la nube. Pero todavía hay motivos para realizar copias de seguridad físicas fuera del sitio en muchas industrias, sobre todo como protección contra el ransomware.

Y es necesario verificar todas las partes de la regla 3-2-1 para garantizar una restauración efectiva y la integridad de los datos.

¿Cómo se prueba la integridad de una copia de seguridad?

La copia de seguridad es inútil si no se restaura correctamente. Esto puede parecer obvio, pero probar la integridad de las copias de seguridad es una parte esencial de cualquier plan de copia de seguridad y recuperación o continuidad del negocio.

Los archivos pueden corromperse o infectarse, los medios físicos como las cintas pueden degradarse con el tiempo, volverse inaccesibles o incluso destruirse durante un desastre. Los servicios en la nube pueden dejar de estar disponibles o degradarse y afectar la capacidad de recuperar datos urgentes en el orden correcto.

El software de respaldo utiliza herramientas que incluyen validación de suma de verificación y hash para verificar la recuperación lógica. Los proveedores también han introducido el aprendizaje automático y la inteligencia artificial para buscar patrones inusuales en los datos (a veces llamados entropía) para detectar ransomware y otras formas de corrupción.

La única forma segura de probar la integridad de una copia de seguridad es intentar restaurarla. Esto plantea problemas prácticos, especialmente cuando se restauran datos en sistemas de producción de misión crítica que están en uso constante. Es posible que los equipos de TI necesiten probar la recuperación de un sistema a la vez o en máquinas virtuales.

Algunos proveedores han desarrollado alternativas. Commvault, por ejemplo, tiene un producto de recuperación de “sala limpia” que permitirá a los clientes restaurar datos en una réplica virtual de su entorno en la nube.

Pero sigue siendo fundamental probar también la recuperación en hardware físico, especialmente para sistemas más antiguos que no se pueden replicar fácilmente en tecnologías de nube.

¿Por qué es importante probar los procedimientos de copia de seguridad y restauración?

Los procedimientos de prueba son tan importantes como la tecnología de prueba, pero es fácil pasarlos por alto.

Gran parte de las pruebas de respaldo se centran correctamente en aspectos técnicos, como si el software de respaldo se ejecuta según lo previsto y si los archivos de respaldo se pueden recuperar y restaurar.

Pero a menudo cuando la recuperación falla es por razones no técnicas. En una situación convencional de recuperación ante desastres y un ataque de ransomware, el personal está bajo presión, las líneas de comunicación se interrumpen y es difícil mantener el mando y el control.

Los procedimientos de copia de seguridad y recuperación deben establecer qué debe suceder, cuándo y quién es responsable de ello.

Un plan claro y procedimientos sólidos ayudarán enormemente cuando suceda lo peor. Pero eso significa que los procedimientos deben probarse de la manera más realista posible.

De esa manera, se puede identificar y abordar cualquier debilidad antes de que sea necesario utilizar procedimientos con ira. ¿Se pueden encontrar copias de seguridad y activar sistemas de recuperación? ¿Se restauran los sistemas en el orden correcto? ¿El entorno de recuperación ante desastres (físico o en la nube) funciona según lo previsto? ¿Y todos conocen su papel?

La recuperación ante desastres es uno de esos casos en los que realmente se trata de herramientas, procesos y personas. Todos los elementos deben someterse a pruebas de estrés.

¿Cuáles son los objetivos de las pruebas de respaldo?

El objetivo principal de las pruebas de respaldo es garantizar que los archivos se puedan restaurar desde copias de seguridad a los sistemas de producción.

Las pruebas deben garantizar que los sistemas de producción funcionen como deberían después de la recuperación. Si una empresa planea realizar una conmutación por error a una configuración en espera en su propio centro de datos, con un proveedor de recuperación ante desastres o en la nube, debe comprobar que la conmutación por error funciona. Y, lo que es más importante, que puedan recuperarse del sistema de producción cuando llegue el momento.

Sin embargo, a menudo las pruebas de respaldo implican mucho más que la cuestión puramente técnica de si el respaldo funciona. Como hemos visto, las empresas necesitan probar sus procedimientos generales para garantizar que los planes se lleven a cabo en la secuencia correcta, que las comunicaciones y el comando y control funcionen según lo previsto y que todos conozcan sus funciones.

Sin embargo, si se profundiza más, las pruebas integrales de respaldo pueden revelar mucho más sobre la preparación y la resiliencia de una organización.

¿Se están cumpliendo, por ejemplo, los RPO y RTO? Y si lo son, ¿son apropiados para la organización? Las empresas cambian, y un RTO que era aceptable, digamos, hace cinco años, podría no serlo ahora.

Las empresas también deben tener en cuenta los requisitos reglamentarios relacionados con la continuidad del negocio y el tiempo de inactividad.

¿Con qué frecuencia deberías probar las restauraciones a partir de copias de seguridad?

La respuesta sencilla es “tan a menudo como puedas”. Las pruebas de respaldo y recuperación a gran escala son disruptivas y potencialmente costosas, y es posible que solo se realicen anualmente. Otras pruebas pueden ser más frecuentes. Estas podrían incluir comprobaciones aleatorias de aplicaciones críticas o incorporar pruebas como parte de las actualizaciones de aplicaciones, por ejemplo.

Bien podría ser que algunos sistemas se prueben diariamente, pero esto dependerá de la criticidad del sistema, la importancia de sus datos y, por supuesto, la visión del riesgo de la empresa.

Exit mobile version