¿Qué es la recuperación ante fallos como servicio (DRaaS)?

Esencialmente, la recuperación ante fallos significa proteger las aplicaciones y los datos de la empresa del tiempo de inactividad de TI, que puede producirse por diversas razones (por ejemplo, desastres naturales, errores humanos o ciberataques). Cuando un centro de datos (en su totalidad o tan solo una parte) deja de prestar servicio a sus clientes, las empresas se exponen a la pérdida de ingresos, al deterioro de su reputación y a que se pongan en peligro su credibilidad en el sector (por ejemplo, en el sector financiero o sanitario). Idealmente, los clientes no deberían verse afectados durante las interrupciones del centro de datos. Sin embargo, garantizar una continuidad empresarial total es difícil y costoso, de modo que las empresas deben alcanzar un equilibrio entre rendimiento y coste. Por ejemplo, no todas las empresas cuentan con el presupuesto necesario para proporcionar una replicación sincrónica de aplicaciones y datos que dé soporte a un plan de recuperación ante fallos (DR) sin pérdida de datos.

Una alternativa rentable para un número cada vez mayor de empresas es optar por un servicio gestionado para sus necesidades de recuperación ante fallos. La recuperación ante fallos como servicio (DRaaS) cuenta con la mayoría de las capacidades básicas que puede necesitar una empresa de presupuesto amplio, pero a una fracción del coste y con un tiempo de amortización mucho más rápido. Los sacrificios típicos suelen ser del objetivo de punto de recuperación (RPO) y/o del objetivo de tiempo de recuperación (RTO). Mientras que una solución de recuperación ante fallos on-premise podría acercarse a un RPO y RTO de cero, las soluciones de DRaaS tienden a estar en el orden de las horas (o minutos, en el mejor de los casos) para cada métrica. Para la mayoría de las empresas, esto es aceptable. En consecuencia, la DRaaS suele resultar atractivo para empresas que pueden resistir una pérdida moderada de datos con el beneficio de un coste total de propiedad mucho más bajo.

Recuperación ante fallos como servicio explicada
Recuperación ante fallos como servicio explicada

El modelo de servicio estándar para DRaaS es una suscripción básica ligada a un acuerdo de nivel de servicio (SLA), al que el proveedor de servicios (PS) está obligado por contrato. Algunos PS también miden el tráfico de entrada y salida y añaden cargos adicionales, en función del uso. Esencialmente, el centro de datos de la DRaaS se convierte en el objetivo de recuperación ante fallos para las aplicaciones y los datos de una empresa on-premise. Una vez establecida la relación, se establece una VPN entre el cliente y el centro de datos del PS, y las instantáneas de las aplicaciones se replican en el centro de datos de DRaaS en función de las métricas de RPO requeridas. En caso de una interrupción del centro de datos, se inicia la conmutación por error al centro de datos de la DRaaS y se restablecen las operaciones comerciales de acuerdo con el SLA.

Una buena solución de DRaaS incluye pruebas de conmutación por error/conmutación por recuperación durante el horario laboral normal, sin afectar la experiencia del cliente convencional. También incluye la difícil tarea de preservar las configuraciones de red tras la conmutación por error para que no sea necesario el redireccionamiento de IP. Por último, una interfaz de gestión común que abarque toda la empresa simplifica las tareas operativas, lo cual hace destacar esta solución DRaaS del resto. 

¿Cómo funciona?

La diferencia clave entre la recuperación ante fallos tradicional y la DRaaS es el aspecto del servicio gestionado de la segunda. Existen las mismas fases fundamentales de la recuperación ante fallos en ambos casos: replicación, conmutación por error y conmutación por recuperación.

Replicación

Cuando las aplicaciones se seleccionan para la protección en el plan de recuperación ante fallos de una empresa, se realizan capturas o instantáneas de estado con los datos que las acompañan a una frecuencia coherente con los requisitos de RPO. Una vez realizado un lote de instantáneas, se replica en el centro de datos de destino de DRaaS, que almacena grupos de instantáneas en un algoritmo FIFO (PEPS). Las instantáneas más recientes se convierten en los objetivos principales de la conmutación por error durante un fallo.

Conmutación por error

Cuando se produce un fallo, iniciar un evento de conmutación por error hace que el usuario final tenga acceso a las aplicaciones y los datos desde el centro de datos principal al centro de datos DRaaS, donde las aplicaciones y los datos se han ubicado desde la última instancia de 'snapshots' replicadas. Este proceso de transición, con el proveedor adecuado, es sencillo de gestionar. Algunos buenos servicios de DRaaS también incluyen la captura automática de instantáneas mientras se ejecutan las aplicaciones en modo de conmutación por error, lo cual permite una conmutación por recuperación elegante y una pérdida de datos nula, una vez restablecidas las operaciones normales del centro de datos primario.

Conmutación por recuperación

Una vez mitigado el fallo, la conmutación por recuperación es el proceso de trasladar el acceso de los usuarios finales al centro de datos primario. Una vez completada la conmutación por recuperación, se restablece el proceso de tres fases y el sistema se prepara para el próximo fallo.

Los pasos cíclicos de la DRaaS

DRaaS vs. Copia de seguridad como servicio (BaaS)

La DRaaS protege las aplicaciones y los datos, mientras que el BaaS sólo protege estos últimos. Desde una perspectiva de continuidad empresarial, la DRaaS es un tipo de superconjunto de BaaS, en el sentido de que incluye servicios de procesamiento para facilitar la continuidad de las aplicaciones para los clientes, además de los servicios de copia de seguridad de datos necesarios para admitir dichas aplicaciones. La DRaaS también ofrece políticas de protección a nivel de aplicación y automatización de runbook para orquestar procesos de conmutación por error/conmutación por recuperación/pruebas. Las soluciones de BaaS son más manuales, menos elegantes y requieren más tiempo para alcanzar el mismo fin que una solución de DRaaS.

¿Cuáles son los beneficios de la recuperación ante fallos como servicio?

Recuperación rápida con un tiempo de inactividad mínimo

Con DRaaS, las empresas pueden seguir operando y pueden restaurar recursos importantes en cuestión de horas o incluso minutos, dependiendo de los SLA.

Una solución rentable

Debido a las economías de escala, la DRaaS es capaz de ofrecer un punto de entrada para que las empresas que de otro modo tendrían limitaciones presupuestarias puedan proteger eficazmente sus negocios de las ramificaciones del tiempo de inactividad de TI.

Mayor flexibilidad

Las consideraciones tradicionales, como infraestructura, alimentación y alquiler, personal de TI y licencias, se incorporan en un solo servicio.

Optimización de recursos

Dado que DRaaS es una solución basada en la nube, su uso es elástico, lo cual garantiza que los clientes solo consumen y pagan por lo que necesitan. En la mayoría de los casos, esto es superior a los centros de datos de recuperación ante fallos más caros propiedad de los clientes o gestionados por ellos, ya que la capacidad debe pagarse por adelantado "por si acaso".

¿Por qué las empresas deberían elegir DRaaS?

La estructura de TI es el salvavidas de la mayoría de las empresas actuales. Si se implementa correctamente, supone una ventaja competitiva para algunos, mientras que para otros simplemente significa que pueden dedicar más tiempo a sus competencias principales, ya sea enseñar en colegio, llevar un caso judicial o gestionar una tienda de alimentación. La tranquilidad que aporta permite a las empresas funcionar de la mejor forma posible. Una buena solución de DRaaS puede contribuir en gran parte a esa visión.

Teniendo en cuenta la tendencia al alza de posibles fallos, la recuperación ante desastres es una de las primeras pólizas de seguros que se están planteando las empresas. La DRaaS permite a empresas con presupuestos limitados tener acceso a las herramientas necesarias para mantener la continuidad del negocio en los contextos más difíciles. Al ser una tecnología basada en la nube, la DRaaS les ofrece a los clientes la flexibilidad de ampliar su huella de recuperación ante fallos a medida que crece su negocio.

La DRaaS ha demostrado ser una alternativa viable y rentable a la creación de un centro de datos de recuperación ante fallos que podría quedarse inactivo buena parte del tiempo. Además, permite a las empresas la opción de convertir CapEx en OpEx, liberando recursos para otras prioridades de negocio. No es una solución que encaje para todo el mundo, pero la DRaaS sin duda se está convirtiendo en una de las soluciones favoritas de la mayoría.

Recursos relacionados

Recuperación ante fallos y copia de seguridad como servicio con Nutanix

Soluciones de Nutanix X-Powered para la protección de datos como servicio

Guía de prácticas recomendadas: protección de datos y recuperación ante fallos

Introdúzcase en la infraestructura hiperconvergente (HCI)

Prueba de Xi Leap