Prácticas recomendadas de recuperación ante desastres de AWS

Cualquier actividad que pueda afectar negativamente a la continuidad empresarial de una compañía cuando se trata de cargas de trabajo locales o en la nube podría calificarse de desastre. Es crucial que una empresa invierta tiempo y recursos en identificar todos los riesgos posibles y definir planes para prevenirlos, o al menos actuar en consecuencia para mitigar cualquier impacto negativo.

La creación de un plan exhaustivo de recuperación ante desastres (DR) para su infraestructura local y en la nube de AWS es una cuestión de máxima prioridad. En esta publicación del blog, cubrimos las prácticas recomendadas para la planificación de la recuperación ante desastres de AWS para ambos casos, haciendo hincapié en las cargas de trabajo de AWS.

Disaster Recovery for Amazon EC2

Disaster Recovery for Amazon EC2

Boost Amazon EC2 data protection by creating replicas of EC2 instances across AWS regions and accounts. Switch to replicas with a few clicks for low RTOs.

Ventajas del uso de AWS para la recuperación ante desastres

La plataforma Amazon Web Services (AWS) ofrece una amplia gama de servicios, como almacenamiento de bases de datos, potencia de cálculo, entrega de contenidos y otras funciones distintas. AWS también se puede utilizar para restaurar rápidamente las operaciones empresariales que se ejecutan en máquinas virtuales e instancias EC2 en caso de desastre. AWS le permite crear réplicas y configurar la recuperación ante desastres tanto para entornos locales como en la nube. Mantener los datos críticos para el negocio en la nube de AWS también elimina la necesidad de un sistema de almacenamiento físico secundario, que generalmente conlleva costes significativos.

De hecho, sus datos de backup y replicación pueden almacenarse en varias regiones de AWS de todo el mundo, de forma segura y fiable. Como parte de sus funciones de recuperación ante desastres, AWS le permite ejecutar y probar una solución de recuperación ante desastres de terceros para comprobar si existen deficiencias (realizar pruebas de recuperación ante desastres de AWS). A continuación, puede utilizar las plantillas de AWS CloudFormation para definir las prácticas de DR más eficaces y guardarlas en una nube privada virtual de Amazon para su uso posterior.

Escenarios de recuperación ante desastres de AWS

Amazon ofrece cuatro estrategias de recuperación ante desastres en AWS. La elección depende de las necesidades y el presupuesto de su organización. Son posibles varias combinaciones para adaptarse a las necesidades específicas de cualquier infraestructura virtual.

  • Backups y restauración. Se puede hacer backup de los datos críticos y enviarlos a una ubicación externa como el almacenamiento de Amazon S3, donde están bien protegidos y se pueden restaurar rápidamente según sea necesario. La interfaz de usuario web de Amazon S3 permite acceder a él desde cualquier lugar. Puede copiar datos directamente a Amazon S3 o crear backups y almacenarlos en la nube. Este es uno de los escenarios de recuperación ante desastres más populares en AWS.
  • Luz piloto. Este escenario de recuperación ante desastres permite disponer de una pequeña versión de un entorno virtual en la nube, manteniéndolo siempre en funcionamiento y actualizado. Puede recuperar y lanzar rápidamente los componentes más críticos de su infraestructura basada en AWS. Se utilizan servicios como las imágenes de máquina de Amazon (AMI) y las instantáneas de Amazon EBS. El método del piloto es más conveniente que la estrategia de backup-and-restore AWS DR, ya que reduce significativamente el tiempo dedicado a la recuperación.
  • Espera caliente. En este escenario de recuperación ante desastres, una versión reducida de su infraestructura de producción se ejecuta siempre en la nube. Durante un evento de DR, se puede ampliar rápidamente para minimizar el tiempo de inactividad y restaurar las operaciones y cargas de trabajo críticas.
  • Instalación en varios sitios («hot standby»). Este método consiste en replicar los datos críticos para la empresa y los componentes básicos de su infraestructura y distribuirlos por varias ubicaciones locales o en la nube. Todos estos sitios están activos; comparten el tráfico y las cargas de trabajo. Si una catástrofe afecta a una de las ubicaciones, seguirá disponiendo de un sistema intacto listo para funcionar en pleno modo de producción. Amazon EC2 Auto Scaling se utiliza para ejecutar este proceso. Con la espera en caliente, se alcanzan los objetivos mínimos de tiempo de recuperación (RTO) y de punto de recuperación (RPO). Si decide utilizar la espera en caliente entre los escenarios de recuperación ante desastres de AWS, recuerde que ejecutar varios sistemas virtuales a la vez puede resultar bastante costoso.

En el contexto de la recuperación ante desastres, cabe mencionar también las siguientes funciones:

  • Replicación. Para garantizar una alta disponibilidad, se puede implementar la replicación entre regiones si sus cargas de trabajo principales se encuentran en la nube de AWS. Aquí, los datos críticos y los componentes del sistema se replican en cualquier otra región de AWS que elija. Si se produce algún cambio en la base de datos primaria, los datos pueden actualizarse al instante (replicación síncrona) o con un pequeño retraso (replicación asíncrona). Estos dos tipos de replicación responden a necesidades empresariales diferentes.
  • Conmutación por error. Durante el proceso de DR, la carga de trabajo de la instancia afectada se traslada al sitio de destino y se enciende la instancia de réplica (conmutación por recuperación). Una vez restaurado el sitio primario, puede recuperar la instancia original. Para guardar todos los cambios en los datos que se ejecutaron en la instancia DR desde la conmutación por recuperación, es necesario invertir el flujo de replicación de datos de vuelta al sitio primario (conmutación por error).
  • Varias regiones de AWS. Cada región de AWS es un área separada e independiente destinada a almacenar instancias o datos. Para una recuperación ante desastres satisfactoria, puede optar por almacenar los datos en dos o más regiones de AWS para mitigar el impacto de desastres a gran escala.

Prácticas recomendadas de recuperación ante desastres de AWS

Estas son las prácticas recomendadas para la recuperación ante desastres de AWS, que debe recordar al crear un plan de recuperación ante desastres de AWS para su entorno.

  • Pruebas de recuperación ante desastres de AWS. Después de instalar una solución de RD, debe probarla. Las pruebas pueden realizarse a demanda o programarse. Puede practicar «pruebas de día de juego», que es una forma de probar sus aplicaciones e instancias para comprobar si su plan de DR funciona como se espera y se pueden cumplir los RTO. Para ello, se puede utilizar AWS CloudFormation para implementar entornos completos en Amazon EC2. Puede crear una plantilla de recursos, que le permite modelar y gestionar componentes de infraestructura en su entorno de nube. Las pruebas periódicas verifican que todos los componentes de la recuperación ante desastres estén correctamente planificados y organizados, y que sus RTO y RPO puedan cumplirse cuando sea necesario.
  • Supervisión y alerta. Para evitar que cualquier posible catástrofe acabe con su infraestructura, debe identificar rápidamente los posibles problemas. Puede supervisar regularmente el flujo de trabajo de su sistema y comprobar su integridad. Esto le permite detectar rápidamente amenazas emergentes como problemas de conectividad, fallos del servidor o cierre de aplicaciones. Amazon CloudWatch evalúa el rendimiento de sus recursos de AWS. Se pueden configurar alarmas y notificaciones para que le avisen cuando determinadas métricas alcancen un nivel crítico.
  • Copia de seguridad y replicación periódicas. Antes de que se produzca una catástrofe, es fundamental preparar el sistema y ejecutar regularmente jobs de backup y replicación. Como resultado, tienes un buen objetivo para la conmutación por recuperación. Después de cambiar a su entorno de DR, debe seguir ejecutando regularmente los jobs de backup y replicación. Almacenar estos backups y réplicas en ubicaciones remotas separadas permite evitar el riesgo de tener un único punto de fallo. AWS puede ejecutar pruebas periódicas de recuperación ante desastres para verificar el estado de su infraestructura de recuperación ante desastres.
  • Utilización de herramientas y técnicas de AWS. Para garantizar la aplicación de las prácticas recomendadas de recuperación ante desastres de AWS, debe adoptar grupos de recuperación o pilas de aplicaciones. De este modo, podrá organizar adecuadamente la recuperación de su infraestructura: por ejemplo, las aplicaciones críticas para la empresa deben recuperarse en primer lugar, ya que tienen la máxima prioridad.

Servicios de recuperación ante desastres de AWS

Para ello, AWS ofrece varios servicios:

  • AWS Elastic Disaster Recovery es un servicio de replicación de datos y recuperación de aplicaciones que se ejecutan en las instalaciones locales y en la nube. Puede lanzar la recuperación de instancias de AWS en la nube para recuperar aplicaciones en dichas instancias.
  • AWS Importación/Exportación permite el acceso a dispositivos de almacenamiento portátiles para transferir datos y aplicaciones críticos para el negocio dentro y fuera de AWS. Gracias a la red interna de alta velocidad de Amazon, incluso grandes cantidades de datos pueden enviarse con rapidez y seguridad al lugar de destino.
  • Amazon Elastic Cloud Compute (Amazon EC2) permite utilizar recursos informáticos y formar un centro de datos virtual completo en la nube de AWS bajo demanda. Las instancias EC2 pueden crearse en cuestión de minutos y mantener un control total durante todo el periodo de recuperación ante desastres.
  • Amazon Simple Storage Service (Amazon S3) está diseñado para almacenar y recuperar datos de máxima prioridad. Este servicio mantiene los componentes críticos para la empresa en múltiples dispositivos repartidos por varias instalaciones, proporcionando así el máximo nivel de disponibilidad. AWS garantiza una mayor protección mediante la administración de identidades y acceso (IAM), las políticas de bucket, la autenticación multifactor (MFA) y el control de versiones de objetos.
  • Amazon Elastic Block Store (Amazon EBS) es un almacenamiento a nivel de bloque para los datos utilizados con sus instancias de Amazon EC2 en la nube. Los datos se almacenan en base a instantáneas que se envían a Amazon S3, proporcionando así un almacenamiento fiable y a largo plazo de sus datos.
  • Servicio de base de datos relacional de Amazon (Amazon RDS) ayuda a configurar y administrar una base de datos relacional en la nube de AWS. Es una solución rentable y flexible para realizar múltiples tareas de administración de bases de datos.
  • Amazon Direct Connect permite configurar una conexión dedicada entre una red local y la nube de AWS. Esto le ayuda a asegurar y acelerar las conexiones de red sin incurrir en costes elevados.
  • Acceso seguro. Cuando se trabaja con datos privados y/o críticos para la empresa, proporcionar un alto nivel de seguridad es crucial para organizaciones de cualquier escala. Para ello, puede aplicar AWS Identity and Access Management (IAM), que garantiza el acceso seguro a los recursos en su entorno de DR. Con IAM, puede crear políticas de seguridad basadas en roles y en usuarios que controlen el acceso de los usuarios a datos críticos.
  • Automatización. La automatización de la recuperación ante desastres es un aspecto importante de las prácticas recomendadas de AWS DR. Durante un evento de recuperación ante desastres, es esencial tener un control total sobre sus servidores basados en AWS y sus servidores locales. Sin embargo, a menudo es físicamente imposible supervisar manualmente la recuperación de cada aplicación e instancia. Para una gestión eficaz, se requiere la orquestación y automatización de los procesos de recuperación ante desastres. Para ello existen varios servicios de gestión de Amazon:
    • Un conjunto de funciones incluidas en AWS CloudFormation le permite aprovisionar servicios de infraestructura de forma automatizada.
    • AWS OpsWorks ayuda a automatizar la configuración, la instalación y la administración de servidores en sus instancias de Amazon EC2, así como en entornos informáticos locales.
    • El autoescalado puede ampliar o reducir sus instancias para satisfacer las demandas en función de los parámetros que especifique en AWS CloudWatch. Esto resulta muy útil en caso de recuperación ante desastres. La solución puede ampliarse automáticamente para hacer frente al aumento de la carga de trabajo en los servidores y reducirse una vez que los procesos de la infraestructura de producción vuelven a su estado normal.
  • Concesión de licencias. La instalación de aplicaciones con licencia correcta en su entorno de AWS es crucial para un rendimiento eficaz. AWS dispone de varios tipos de licencias, como «Licencia incluida» y «Bring-Your-Own-License», para ajustarse a las necesidades específicas de su negocio. Tenga en cuenta que su solución de protección de datos también debe tener licencia para una integración perfecta con AWS.

Solución de recuperación ante desastres de AWS de NAKIVO

Amazon EC2 es una nube altamente fiable y segura. Sin embargo, hay una serie de amenazas que pueden perturbar el rendimiento de las instancias EC2 y socavar la continuidad del negocio. Una solución integrada dedicada de backup y recuperación ante desastres como NAKIVO Backup & Replication puede garantizar los mejores objetivos de fiabilidad y recuperación.

La solución NAKIVO puede proteger su entorno en la nube con backup de instancias de Amazon EC2 y replicación de instancias de Amazon EC2, permitiéndole seguir las prácticas recomendadas de recuperación ante desastres de AWS. Entre las funciones de recuperación tras fallos de la solución se incluyen la conmutación por error automatizada, Site Recovery para orquestación de secuencias de recuperación tras fallos de cualquier complejidad y pruebas de recuperación tras fallos.

El producto le permite crear y gestionar réplicas de sus instancias EC2 originales y almacenarlas en una ubicación de destino de su elección. Las réplicas de instancias permanecen apagadas en el sitio de DR y pueden encenderse fácilmente durante un evento de DR cuando se requiere una recuperación instantánea. Así, no se incurre en costes adicionales por mantener constantemente réplicas de instancias en espera.

1 Year of Free Data Protection: NAKIVO Backup & Replication

1 Year of Free Data Protection: NAKIVO Backup & Replication

Deploy in 2 minutes and protect virtual, cloud, physical and SaaS data. Backup, replication, instant recovery options.

Artículos recomendados