Tiempo de lectura: 4 minutos, 13 segundos

Recuperación ante desastres
¿Qué es la recuperación ante desastres?

En TI, la recuperación ante desastres (DR) se refiere a las estrategias, los procesos, los productos y las soluciones a los que se recurre para recuperar y proteger la infraestructura de TI de la empresa en caso de desastre. Esto incluye desastres naturales, ciberataques, fallos de hardware y otros eventos catastróficos.

La recuperación ante desastres es crítica porque minimiza el tiempo de inactividad en caso de desastre y protege la integridad de los datos. Ayuda a las empresas a reanudar rápidamente las operaciones y reducir el impacto de las disrupciones. Todas las empresas deben tener un plan de recuperación ante desastres y un plan de recuperación cibernética como parte de su estrategia de continuidad del negocio y resiliencia empresarial.

Unos hombres hablando sobre los daños de un incendio devastador.
  • Plan de recuperación ante desastres (DRP)
  • RTO y RPO
  • Pruebas de recuperación ante desastres
  • HPE y la recuperación ante desastres
  • ¿Cuál es la diferencia entre la recuperación ante desastres y la recuperación cibernética?
Plan de recuperación ante desastres (DRP)

¿Qué es un plan de recuperación ante desastres (DRP) y por qué es tan importante?

Un plan de recuperación ante desastres es un enfoque documentado y estructurado con instrucciones para responder a incidentes empresariales no planificados. Incluye un plan detallado para recuperar infraestructura de TI, aplicaciones y datos.

Un plan de recuperación ante desastres debe contar con lo siguiente:

  • Evaluación de riesgos y análisis del impacto en el negocio
  • Objetivo de tiempo de recuperación y objetivo de punto de recuperación (RTO y RPO)
  • Procedimientos de recuperación detallados
  • Funciones y responsabilidades
  • Un plan de comunicación de recuperación ante desastres
  • Una combinación de soluciones de recuperación ante desastres y copia de seguridad
  • Pruebas y actualizaciones

Un plan de recuperación ante desastres garantiza:

  • la continuidad del negocio para que las funciones críticas del negocio puedan continuar durante y después de un desastre;
  • la protección de datos para evitar la pérdida o la corrupción de datos importantes;
  • el mínimo tiempo de inactividad para reducir el tiempo necesario para restaurar la actividad normal, minimizando el impacto financiero y reputacional;
  • el cumplimiento para satisfacer los requisitos normativos a efectos de protección de datos y continuidad del negocio;
  • la preparación para dar una respuesta estructurada en caso de desastre, reduciendo el pánico y la confusión durante un evento real

Un DRP es un componente esencial de la estrategia de gestión de riesgos de una organización, al garantizar que es capaz de recuperarse rápidamente de las disrupciones y mantener la continuidad del negocio en caso de eventos imprevistos.

RTO y RPO

¿Qué son el RTO y el RPO?

Los dos factores más importantes en la recuperación ante desastres son restablecer las operaciones lo más rápidamente posible (RTO) y evitar la pérdida de datos (RPO).

  • El RTO (objetivo de tiempo de recuperación) es el período de tiempo previsto dentro del cual se debe restaurar un proceso empresarial después de un desastre para evitar consecuencias inaceptables. El RTO se calcula en función de la determinación del tiempo de inactividad máximo tolerable y de la capacidad de la solución de recuperación ante desastres y del plan para ejecutar la recuperación.
  • El RPO (objetivo de punto de recuperación) se refiere a la cantidad máxima aceptable de datos perdidos medida en el tiempo. El RPO se calcula combinando qué volumen pérdida de datos que resulta tolerable y qué volumen de pérdida de datos se puede prevenir técnicamente con el plan y la solución de protección de datos y recuperación ante desastres.

Los RTO y RPO pueden variar entre aplicaciones y conjuntos de datos, en función del análisis del impacto en el negocio o la evaluación de riesgos. Los sistemas críticos pueden tener RTO y RPO medidos en minutos o segundos, mientras que los sistemas no críticos pueden tener RTO y RPO medidos en horas, días o incluso semanas. Tanto el tiempo de inactividad como la pérdida de datos, que los RTO y RPO pretenden prevenir, pueden tener graves consecuencias tanto financieras como reputacionales para las empresas. Por ello, los RTO y RPO son tan importantes en la planificación de la recuperación ante desastres.

Los RTO agresivos medidos en minutos generalmente se logran con conmutación por error y conmutación por recuperación. La conmutación por error suele consistir en un proceso automatizado que se inicia manualmente cuando ocurre una disrupción y que pone en línea con rapidez una copia de la carga de trabajo de datos o aplicaciones interrumpida para sustituirla.

Durante la conmutación por error, desde la perspectiva del usuario, la aplicación y los datos vuelven a estar en línea en cuestión de minutos, como si la carga de trabajo principal estuviera nuevamente en línea. En el back-end, las cargas de trabajo se ejecutan ahora desde la réplica, que puede estar ubicada en un sitio remoto de recuperación ante desastres. La conmutación por recuperación es el proceso de devolver a los usuarios a la carga de trabajo principal una vez que esta se ha restaurado completamente cuando ha finalizado la disrupción.

La conmutación por error y por recuperación generalmente reducen el tiempo de inactividad y el RTO de horas o días a minutos en comparación con la recuperación de cargas de trabajo desde las copias de seguridad. De manera similar, el RPO se puede reducir a segundos en lugar de horas o días mediante el uso de soluciones de replicación en tiempo real en lugar de tecnologías de copia de seguridad periódica.

Pruebas de recuperación ante desastres

¿Qué son las pruebas de recuperación ante desastres?

Las pruebas de recuperación ante desastres son un conjunto de ejercicios y validaciones para confirmar que los planes y soluciones de recuperación ante desastres funcionan según lo previsto. Las pruebas de recuperación ante desastres suelen ser un requisito para el cumplimiento de las regulaciones de protección de datos y el mantenimiento de los estándares del sector. Formar al personal en planes de recuperación ante desastres y actualizar dichos planes en función de los resultados de las pruebas constituye un ejercicio de gran valor.

Beneficios de las pruebas de recuperación ante desastres:

  • Cumplimiento de las regulaciones y los estándares de protección de datos
  • Validación y actualización de planes de recuperación ante desastres
  • Mantener al personal formado en los planes y procedimientos de recuperación ante desastres
  • Validación de RTO, RPO y acuerdos de nivel de servicio

El alcance de las pruebas de recuperación ante desastres puede variar: desde la recuperación de una sola aplicación o conjunto de datos hasta una recuperación ante desastres a nivel de uno o varios sitios completos, que simule una disrupción específica, como un desastre natural. Las pruebas de mayor escala pueden provocar mayores disrupciones y requerir más recursos, por lo que a menudo se realizan con menor frecuencia que las de menor escala.

La frecuencia con la que se realizan las pruebas generalmente depende del tiempo que consumen y de cómo afectan a las operaciones. En función de las capacidades de las herramientas de recuperación ante desastres, incluso probar una sola aplicación puede disrumpir la productividad. Lo ideal es que las herramientas de recuperación ante desastres cuenten con capacidades de prueba integradas que permitan realizar pruebas sin disrumpir la producción. Con herramientas de este tipo, se pueden realizar pruebas con frecuencia.

Mejores prácticas para las pruebas de recuperación ante desastres:

  • Realiza pruebas con frecuencia: idealmente, con periodicidad trimestral o semestral
  • Prioriza las pruebas de las cargas de trabajo más críticas con los RTO y RPO más agresivos
  • Prueba todas las cargas de trabajo para comprobar que cumplen sus RTO, RPO y acuerdos de nivel de servicio
  • Valida las pruebas en colaboración con los administradores de aplicaciones y redes 
  • Documenta los resultados de las pruebas y actualiza los planes de recuperación ante desastres según sea necesario
HPE y la recuperación ante desastres

¿Qué ofrece HPE para la recuperación ante desastres?

HPE Zerto Software ayuda a las organizaciones que cuentan con capacidad de recuperación ante desastres para proteger sus datos y aplicaciones en caso de disrupciones:

Protección de datos continua: HPE Zerto Software replica continuamente los datos de los entornos de producción a un sitio secundario en tiempo real. Esto garantiza que los datos replicados estén siempre actualizados, lo que minimiza la pérdida de datos en caso de desastre.

Recuperación basada en registros: HPE Zerto Software lleva un registro de los puntos de recuperación creados con segundos de diferencia para todas las máquinas virtuales protegidas. Este registro permite a las organizaciones recuperar datos de cualquier punto en el tiempo dentro del período de mantenimiento del diario. Esta funcionalidad es crucial para recuperarse de desastres hasta segundos antes de que los datos se vieran comprometidos por primera vez.

Homogeneidad de aplicaciones y máquinas virtuales: HPE Zerto Software es capaz de crear puntos de recuperación homogéneos en varias máquinas virtuales y aplicaciones. Esto garantiza la recuperación al mismo punto en el tiempo de todos los componentes de una aplicación, manteniendo la integridad de los datos y la consistencia de la aplicación.

Conmutación por error y recuperación automatizadas: HPE Zerto Software automatiza el proceso de conmutación por error, lo que permite una recuperación rápida y predecible de los servicios en un sitio secundario. De manera similar, automatiza el proceso de conmutación por error, lo que permite a las organizaciones revertir las operaciones al sitio principal una vez solucionado el problema.

Pruebas no disruptivas: HPE Zerto Software permite a las organizaciones probar sus planes de recuperación ante desastres sin incidir en el entorno de producción. Estas pruebas no disruptivas garantizan que los planes de DR sean efectivos y que el personal esté familiarizado con los procedimientos de recuperación.

Compatibilidad con entornos multinube y de nube híbrida: HPE Zerto Software admite la replicación hacia y desde diversos entornos, incluidos centros de datos locales, nubes públicas (como AWS, Azure y Google Cloud) y configuraciones de nube híbrida. Esta flexibilidad permite a las organizaciones elegir la estrategia de DR que mejor se adapta a sus necesidades.

Escalabilidad: HPE Zerto Software se ha diseñado para escalar con el crecimiento de una organización. Puede proteger una pequeña cantidad de máquinas virtuales o escalar para proteger miles de máquinas virtuales en múltiples sitios y nubes.

Organización y automatización: HPE Zerto Software incluye funciones de organización y automatización que agilizan el proceso de recuperación. Las organizaciones pueden definir planes de recuperación que especifiquen el orden de recuperación de las máquinas virtuales, las configuraciones de red y otros pasos necesarios.

Análisis y elaboración de informes: HPE Zerto Software proporciona funcionalidades avanzadas de análisis y elaboración de informes, lo que ofrece a las organizaciones visibilidad sobre su preparación para la recuperación ante desastres, el rendimiento de la replicación y el uso de recursos. Esta información ayuda a optimizar las estrategias de DR y a garantizar el cumplimiento de los requisitos internos y externos.

Cumplimiento y auditorías: HPE Zerto Software ayuda a las organizaciones a cubrir los requisitos de cumplimiento proporcionando registros e informes detallados de las actividades de DR, incluidas pruebas y casos reales de conmutación por error. Estos registros son útiles para las auditorías y para garantizar el cumplimiento de los estándares regulatorios.

Resiliencia ante el ransomware: la detección de cifrado en tiempo real, las copias de datos inmutables y la recuperación basada en registros de HPE Zerto Software facilitan la detección de amenazas, la protección de datos de recuperación y la rápida restauración a un punto en el tiempo antes de un ataque de ransomware, lo que minimiza la pérdida de datos y el tiempo de inactividad.

HPE Zerto Software mejora la recuperación ante desastres ofreciendo protección de datos continua, homogeneidad de las aplicaciones, procesos automatizados de conmutación por error y conmutación por recuperación, pruebas no disruptivas, compatibilidad multinube, escalabilidad, organización, análisis integrales y capacidades de cumplimiento fiables. Este enfoque integral garantiza que las organizaciones puedan proteger eficazmente sus datos y aplicaciones, minimizar el tiempo de inactividad y mantener la continuidad del negocio en caso de disrupciones.

¿Cuál es la diferencia entre la recuperación ante desastres y la recuperación cibernética?

¿Cuál es la diferencia entre la recuperación ante desastres y la recuperación cibernética?

La recuperación ante desastres y la recuperación cibernética son cruciales para la estrategia de resiliencia de una organización. La recuperación cibernética aborda de manera específica los problemas relacionados con ciberataques que, a diferencia de otros tipos de desastres, incluyen un comportamiento malicioso diseñado para evitar la recuperación. Una arquitectura de recuperación sólida de la continuidad del negocio requiere conocer sus diferencias e interacciones.

  • Similitudes:

- Ambas restauran servicios de TI y datos para la continuidad del negocio. 
- Necesitan pruebas y actualizaciones frecuentes para funcionar. 
- Ambas reducen el tiempo de inactividad relacionado con las disrupciones y el efecto en las operaciones. 

  • Cómo trabajan juntas:

Las empresas deberían combinar la recuperación ante desastres y la recuperación cibernética en un único plan de continuidad del negocio para gestionar las diversas amenazas. Esto significa: 

- Coordinación de planes de recuperación cibernética y no cibernética. 
- Instalación de sistemas de copia de seguridad ciberresistentes. 
- Probar los planes de respuesta conjuntamente para encontrar carencias. 
- Asegurarse de que los equipos de seguridad informática y continuidad del negocio colaboran. 

La combinación de estos métodos ayuda a las empresas a proteger sus operaciones, limitar costes y recuperarse rápidamente de disrupciones como los ataques cibernéticos y los desastres naturales.

Diferencias clave entre la recuperación ante desastres y la recuperación cibernética

Aspecto
Recuperación ante desastres
Recuperación cibernética

 

Foco

Recuperación de una amplia gama de disrupciones, incluidos desastres naturales, fallos de hardware y errores humanos

Recuperación de amenazas cibernéticas como ransomware que provocan tiempo de inactividad y pérdida de datos

Amenazas abordadas

Interrupciones naturales y provocadas por el hombre que afectan a la infraestructura de TI y las operaciones de negocio

Actividades cibernéticas maliciosas destinadas a comprometer los datos y evitar su recuperación

 

Ámbito

Restaurar la infraestructura de TI, las aplicaciones y los datos, lo que a veces requiere la reubicación de las operaciones

 

Restaurar la integridad de los datos, proteger los sistemas comprometidos y eliminar las amenazas cibernéticas

Componentes

Copia de seguridad de datos, conmutación por error del sistema, acuerdos de sitios alternativos, planificación de continuidad del negocio y restauración de infraestructura

 

Respuesta a incidentes, análisis forense, erradicación de malware, medidas de ciberseguridad y copias de seguridad de datos seguras

 

Objetivo

Minimizar el tiempo de inactividad y las pérdidas financieras restaurando los sistemas de TI y las operaciones de negocio

 

Contener, eliminar y recuperarse de las amenazas cibernéticas. al tiempo que se garantiza la seguridad de datos

 

Temas relacionados

Resiliencia cibernética

Recuperación ante desastres como servicio

Recuperación cibernética