Cómo hacer backup de Amazon S3 y AWS EC2 en la nube

Amazon proporciona servicios de computación y almacenamiento en la nube. Se pueden utilizar diferentes servicios de AWS para almacenar backups en la nube y garantizar la protección de los datos, incluidos Amazon EC2 y Amazon S3. Sin embargo, estos servicios difieren en cómo funcionan y qué datos de backups pueden almacenar y cómo.

En esta publicación del blog se explica cómo se pueden utilizar los volúmenes de EBS adjuntos a las instancias de Amazon EC2 y Amazon S3 para almacenar datos de backups.

Nota: Este post no es una comparación completa de EC2 y S3, ya que EC2 es una plataforma de computación en nube utilizada para ejecutar cargas de trabajo en la nube. En su lugar, se centra en Elastic Block Storage (EBS) utilizado para el almacenamiento de datos de EC2 y lo compara con S3.

NAKIVO for AWS EC2 Backup

NAKIVO for AWS EC2 Backup

Backup of Amazon EC2 instances to EC2, AWS S3 and onsite. Anti-ransomware options. Fast recovery of instances and application objects.

Por qué usar AWS para backups de datos

De acuerdo con la regla 3-2-1 para hacer backups, debes mantener al menos tres copias de los datos críticos, una de las cuales debe almacenarse de forma externa. El almacenamiento en la nube, incluidos Amazon S3 y los volúmenes de EBS en las instancias de Amazon EC2, se puede utilizar como almacenamiento externo para los datos de backups. Pero, ¿cómo y cuándo utilizarlos? Empecemos por repasar lo que ofrecen los dos servicios de AWS.

  • Las instancias de Amazon EC2 (Elastic Cloud Computing) son máquinas virtuales que se ejecutan en la nube de AWS en servidores de AWS y en centros de datos de AWS. El contenedor que almacena los datos de las instancias se denomina volumen EBS (Elastic Block Storage), que equivale a un disco virtual.

Los volúmenes EBS se clasifican como almacenamiento en bloque, ya que la unidad básica de almacenamiento de datos es un bloque. Los volúmenes EBS están conectados a instancias y almacenan los datos primarios de estas instancias. Puede elegir entre unidades de disco duro (HDD) y unidades de estado sólido (SSD) para los volúmenes EBS.

  • Amazon S3 (Simple Storage Service) es el servicio de almacenamiento de objetos de AWS. El contenedor utilizado para almacenar datos se denomina cubo. Los datos se almacenan en cubos como objetos y no como bloques. El almacenamiento basado en objetos permite utilizar el control de versiones, una función muy útil para la recuperación de datos.

Uso de Amazon EC2 para la recuperación de cargas de trabajo

Las instancias de Amazon EC2 se pueden utilizar para la recuperación en la nube de máquinas virtuales on-premise cuando un centro de datos de producción local deja de estar disponible. Para estar preparado para un escenario así, debe migrar las cargas de trabajo locales a la nube utilizando backups o réplicas como parte de un plan de recuperación ante desastres.

En un escenario de desastre, es preferible replicar a EC2 que hacer backups. Reanudar el funcionamiento de aplicaciones y servidores utilizando réplicas requiere menos tiempo que utilizando backups (es decir, menor RTO). Por ejemplo, puede replicar bases de datos de servidores locales o máquinas virtuales a instancias EC2 y realizar una conmutación por error casi instantánea cuando necesite recuperarse de un desastre.

Los volúmenes EBS utilizados por las instancias EC2 proporcionan almacenamiento de bloques de alta velocidad. A continuación se indican algunas ventajas y desventajas de utilizar volúmenes EBS para hacer backups y restauraciones.

  • Ventajas: EBS puede utilizarse para cargas de trabajo de alto rendimiento. Los datos pueden copiarse a gran velocidad de un volumen EBS a otro. También puede conseguir un mejor rendimiento de la base de datos con los volúmenes EBS de las instancias EC2 que con el almacenamiento de Amazon S3.

Si necesita transferir datos desde sus servidores locales (on-premises), la velocidad de conexión a Internet es un cuello de botella, y el uso de Amazon S3 puede ser más racional en este caso.

  • Desventajas: Con la excepción del uso de volúmenes EBS para hacer backups de otros volúmenes EBS, EBS es demasiado caro como destino de backups, especialmente para cargas de trabajo que no sean instancias EC2.

Protección de datos de instancias EC2 en AWS

Las instancias de Amazon EC2 y los volúmenes EBS conectados a ellas no se copian automáticamente en AWS.  Los datos sólo se replican entre servidores dentro de la misma zona de disponibilidad en los centros de datos de Amazon para la redundancia del centro de datos en caso de fallo de disco o servidor (fallo de hardware).

Aunque la funcionalidad de backups no está disponible, AWS proporciona tres métodos nativos para proteger los datos en instancias EC2:

  • Realización de instantáneas de EBS. Esta es una forma sencilla de crear puntos de recuperación para volúmenes EBS (incluso para volúmenes EBS cifrados). Las instantáneas pueden utilizarse para restaurar datos en nuevos volúmenes EBS. Cuando utilice gestores de volúmenes lógicos como LVM o mdadm, considere la posibilidad de hacer backup de la capa del gestor de volúmenes en lugar de utilizar instantáneas de EBS para preservar la consistencia de los datos y la coherencia de los volúmenes subcomponentes. Tenga en cuenta que cuando restaura volúmenes EBS mediante instantáneas, estos volúmenes EBS deben montarse en una instancia EC2 preparada.
  • Creación de una imagen de máquina de Amazon (AMI). AMI es una imagen que contiene el sistema operativo, todos los ajustes de configuración y los datos necesarios para ejecutar la instancia EC2. Utilizando una AMI, puede crear una nueva instancia EC2 basada en esta AMI. Este enfoque se utiliza para recuperar instancias EC2 y clonarlas. Tenga en cuenta que primero debe detener una instancia EC2 en ejecución y, a continuación, crear una nueva AMI.

La ventaja de este método sobre el uso de instantáneas de volúmenes EBS es que se restaura toda la instancia EC2 y no sólo los volúmenes EBS (que deben montarse manualmente en una instancia EC2 creada tras el proceso de restauración). Configurar las imágenes AMI que se utilizarán para la recuperación lleva más tiempo, pero funciona bien en términos de recuperación y escalabilidad.

  • Copia de Instancia EC2 a S3. La copia de datos almacenados en volúmenes EBS a buckets de Amazon S3 es un método alternativo para proteger los datos en instancias EC2. Como Amazon S3 es un almacenamiento basado en objetos y Amazon EBS es un almacenamiento en bloques, se necesita FUSE (sistema de archivos en el espacio de usuario) para leer/escribir archivos en/en los buckets de S3. FUSE se puede instalar en el sistema operativo que se ejecuta en una instancia de EC2, una máquina virtual y un equipo físico para obtener acceso a los buckets de Amazon S3.

Sin embargo, cuando se trata de la consistencia de los datos, copiar archivos que están en uso por aplicaciones (como bases de datos) a S3 puede causar corrupción de datos.

Uso de Amazon S3 para la recuperación de datos

Amazon S3 proporciona una función de control de versiones para los objetos almacenados en buckets. Por defecto, el control de versiones está desactivado en Amazon S3, pero puede activar esta función fácilmente. Cuando el control de versiones está activado, las versiones anteriores de los objetos se conservan después de escribir cambios en ellos. Los cambios se guardan como una nueva versión del objeto, y los objetos borrados no se eliminan permanentemente.

El uso de Amazon S3 para almacenar versiones tiene sus ventajas e inconvenientes.

  • Ventajas: Amazon S3 ofrece diferentes clases de almacenamiento a distintos precios en función de la frecuencia con la que se necesite acceder a los datos y de los tiempos de recuperación. Amazon también ofrece una política de precios flexible para utilizar el almacenamiento de Amazon S3, lo que hace que S3 sea asequible para muchos usuarios. Más información sobre Amazon S3 para saber cómo funciona AWS S3.

Amazon S3 también admite el bloqueo de objetos para proporcionar inmutabilidad de almacenamiento y proteger los objetos contra cambios o eliminaciones no deseados. Esta configuración de almacenamiento también se denomina escritura única, lectura múltiple (WORM).

  • Desventajas: Se necesitan herramientas especiales si no quieres copiar archivos manualmente usando la interfaz web de AWS. Además, AWS cobra tarifas de salida por las transferencias de datos desde Amazon S3 (estas tarifas dependen de la cantidad de datos transferidos desde AWS y del nivel de almacenamiento utilizado).

Casos prácticos de protección de datos en Amazon S3

Existen muchos casos prácticos para hacer backup de Amazon S3. Considere la posibilidad de elegir este tipo de almacenamiento para:

  • Copias de datos almacenados en volúmenes EBS. Como se ha mencionado anteriormente, puede copiar los volúmenes EBS utilizados por las instancias EC2 al almacenamiento de Amazon S3.
  • Copia de datos entre buckets S3.
  • Backups de datos almacenados en ordenadores físicos y máquinas virtuales que funcionan en local.

Cómo proteger los datos en Amazon S3

Se pueden utilizar diferentes herramientas de AWS para proteger los datos en Amazon S3 contra pérdidas. Habilite y configure el control de versiones de objetos para tener diferentes versiones de los objetos almacenados en los buckets de S3 para la recuperación y revise las herramientas disponibles a continuación:

  • Herramientas de línea de comandos. Copie objetos de un bucket de S3 a otro mediante AWS SDK u otras herramientas. También se pueden utilizar otras herramientas de línea de comandos populares para Linux y Windows, como s3cmd, s4cmd y AWS CLI. Instale una de estas herramientas para transferir datos hacia y desde buckets S3. También puede utilizar estas herramientas de línea de comandos para copiar datos entre cubos con fines de recuperación.

    Utilizar scripts para hacer backup de S3 es un enfoque común, pero requiere mucho esfuerzo. Este enfoque es aplicable para hacer backups de datos desde buckets S3, instancias EC2 y máquinas físicas y virtuales.

    • Ventajas Las herramientas CLI y los scripts están disponibles de forma gratuita.
    • Inconvenientes La configuración de la copia de datos mediante scripts es complicada. Además, antes de cualquier proceso de copia, debe dejar de ejecutar aplicaciones y de utilizar funciones como las instantáneas de volumen dentro de los sistemas operativos para preservar la coherencia de los datos.
  • Puerta de enlace de almacenamiento de AWS. Puede utilizar AWS Storage Gateway para transferir datos de máquinas físicas y virtuales locales a buckets de Amazon S3.

AWS Storage Gateway es un servicio de almacenamiento híbrido que se implementa como una máquina virtual y proporciona opciones de almacenamiento en caché para un acceso más rápido a los archivos. Existen tres tipos de AWS Storage Gateway: gateway de archivos, gateway de volúmenes y gateway de cintas.

Tras implementar la gateway de almacenamiento, se pueden utilizar protocolos de uso compartido estándar, como SMB, NFS e iSCSI, para acceder al almacenamiento de Amazon S3. AWS Storage Gateway se proporciona como appliance virtual para las plataformas VMware vSphere e Hyper-V y puede descargarse gratuitamente si dispone de un plan de suscripción para utilizar Amazon S3.

Soluciones para hacer backups de datos directamente en AWS

Una forma más eficaz y fiable de proteger sus datos en AWS es implementar una solución de protección de datos de terceros que ofrezca integración con AWS, como NAKIVO Backup & Replication. La solución NAKIVO es una solución universal de protección de datos compatible con:

  • Hacer backup de Amazon EC2. Backups coherentes y recuperación de instancias EC2 (a EBS y S3). No es necesario crear y configurar nuevas instancias EC2 ni montar volúmenes EBS recuperados manualmente. Puede iniciar la recuperación de archivos y objetos de aplicación en cuanto los necesite.
  • Replicación de Amazon EC2. Replique instancias EC2 importantes en AWS y utilice réplicas EC2 según sus escenarios de recuperación de datos y planes de recuperación ante desastres proporcionando un alto RTO.
  • backup en Amazon S3. Haga backups de máquinas virtuales Microsoft Hyper-V y VMware vSphere, máquinas físicas Windows y Linux e instancias EC2 en buckets de Amazon S3. Se compatibiliza con hacer backup de forma directa en buckets de Amazon S3 sin necesidad de implementar AWS Storage Gateway. Se crea un repositorio especial de backups de Amazon S3 en un bucket de S3.
  • Hacer backup de Amazon EC2. Puede crear un repositorio de backups en una instancia EC2, configurar una conexión de red entre su centro de datos y la red utilizada por sus instancias EC2, y hacer backups de datos en la instancia EC2.

NAKIVO Backup & Replication proporciona un conjunto de funciones útiles que hacen que la configuración de los backups en AWS sea más rápida, cómoda y fiable. Entre estas funciones se incluyen:

  • El almacenamiento de Amazon S3 con compatibilidad de inmutabilidad se puede utilizar como destino de backups para protegerse contra cambios de datos no deseados, ya sean accidentales o causados por ransomware.
  • La función Site Recovery permite automatizar y orquestar flujos de trabajo de recuperación ante desastres para instancias EC2 y otros entornos virtuales en función de condiciones y acciones definidas. Las complejas situaciones de recuperación ante desastres pueden llevarse a cabo fácilmente con la función Site Recovery.
  • Programación de jobs. Los jobs de backups se pueden programar para que se ejecuten automáticamente. Los ajustes flexibles de retención permiten conservar varios puntos de recuperación para distintos casos de recuperación.
  • Hacer backups coherentes con las aplicaciones es importante para la coherencia de los datos. NAKIVO Backup & Replication utiliza funciones como VSS (Volume Shadow Copy) en equipos basados en Windows para preservar la coherencia de los datos cuando las aplicaciones (por ejemplo, un servidor de base de datos, un servidor Active Directory, etc.) realizan operaciones de escritura en los archivos.

Direct Backup to AWS S3 | NAKIVO

Direct Backup to AWS S3 | NAKIVO

Avoid a single point of failure with simple Amazon S3 integration and anti-ransomware immutability options. Automated backup tiering and instant recovery features.

Artículos recomendados