Volver

Causas y Soluciones para Fallos en la Copia de Seguridad

Esta página explica las causas y soluciones cuando falla la copia de seguridad (replicación).

Cuando falla o se omite una copia de seguridad de una máquina virtual, recibirá un correo electrónico de “Informe de copia de seguridad” desde el servidor de Xen Orchestra. Incluso si esto ocurre, el servicio de la máquina virtual continuará, pero en el improbable caso de que ocurra un fallo en el host de Xen y el almacenamiento no pueda ser rescatado, existe el riesgo de que se pierda el punto de restauración.

Los fallos en la copia de seguridad ocurren principalmente por tres razones:

  1. Cuando no queda suficiente espacio libre en el almacenamiento local
  2. Cuando hay muchas instantáneas de una máquina virtual
  3. Cuando el tamaño del disco virtual de una máquina virtual se vuelve demasiado grande o hay demasiadas actualizaciones, y la copia de seguridad con RPO = 1 hora (dos veces por hora) ya no es suficiente.

A continuación se presentan las causas y soluciones para cada mensaje de error.

Si experimenta errores distintos a los listados, o si el problema no se resuelve por sí solo incluso después de tomar medidas, como que la situación vuelva a la normalidad de inmediato, por favor contacte a nuestro soporte o representante de ventas. Además, en el caso de los 3 puntos anteriores, la solución fundamental es reducir los objetivos de la copia de seguridad o extender el tiempo de RPO (por favor consulte).

Acerca del Informe de Copia de Seguridad

La dirección de correo del remitente es “sysadmin@justplayer.com” y el asunto es “[Xen Orchestra] fallo (o omitido) − Informe de copia de seguridad para el nombre del trabajo de respaldo”. Por favor, revise el cuerpo del correo para obtener información sobre el trabajo de copia de seguridad y el mensaje de error.

¿Cuánto Espacio de Almacenamiento Necesito?

La capacidad de almacenamiento requerida por Xen no depende solo de la capacidad de almacenamiento actualmente en uso, sino también de los diferenciales de actualización de datos dentro de la máquina virtual. Por lo tanto, no es posible determinar en términos generales cuántos gigabytes se necesitan.

Esto se debe a que las instantáneas de Xen son un tipo de sistema de instantáneas que requiere un almacén de respaldo.

Si hay una gran cantidad de actualizaciones de almacenamiento entre instantáneas (como en una base de datos o un sistema con una gran cantidad de registros), el número de discos diferenciales aumentará. Al eliminar una instantánea, los discos diferenciales deben fusionarse, pero para evitar apagones inesperados del sistema, los datos originales se dejan intactos durante el proceso de fusión, lo que requiere una gran cantidad de espacio de almacenamiento libre temporal. En Xen, este proceso de fusión no se realiza inmediatamente después de eliminar la instantánea, sino que lo realiza automáticamente el sistema, por lo que hay un ligero retraso después de que se completa el proceso.

La mayoría de los problemas surgen debido a dos características del proceso de fusión del almacén de respaldo de instantáneas: requiere espacio libre y se realiza de manera diferida.

SR_BACKEND_FAILURE_44 es a menudo un error causado puramente por la capacidad de almacenamiento. Es necesario mantener siempre una cierta cantidad de espacio libre en el almacenamiento local del host.

Tenga en cuenta que SR_BACKEND_FAILURE_109 está mayormente relacionado con el espacio restante en disco, como un fallo debido a almacenamiento insuficiente durante la operación de eliminación después del proceso de fusión.

El almacenamiento puede ahorrarse eliminando máquinas virtuales innecesarias, deteniendo copias de seguridad innecesarias o suavizando la carga general en el host, pero no se pueden pasar por alto los beneficios de este sistema en términos de trabajo de recuperación rápida y tiempo (RTO) en caso de un incidente. Dependiendo de su contrato, puede ser posible expandir su capacidad de almacenamiento. Si necesita expandir su almacenamiento (SSD), por favor contacte a nuestro soporte o representante de ventas.


Causas de los Errores y Cómo Manejarlos

Declaraciones de Error
Error: el trabajo (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) ya está en ejecución
*La cadena dentro de () será diferente para cada usuario.
Causa
Esto ocurre cuando se omite un nuevo trabajo de copia de seguridad porque ya hay un trabajo de copia de seguridad en ejecución.
Las copias de seguridad se retrasan debido a varios factores, como actualizaciones frecuentes del disco.
Primeros Respondedores
El usuario cambia la política operativa de RPO y nos contacta
Solución
Esto significa que la copia de seguridad fue omitida porque la cantidad de datos a respaldar era grande. Si la copia de seguridad termina normalmente después de eso, no hay necesidad de preocuparse.
Si esto ocurre frecuentemente, la unidad de copia de seguridad puede ser demasiado corta en comparación con la cantidad de actualizaciones del disco. En este caso, la unidad de copia de seguridad debe alargarse gradualmente a 1 hora, 2 horas, 3 horas, etc. Al mismo tiempo, el RPO se volverá más largo, lo que significa que el tiempo máximo de retroceso durante la recuperación de un fallo aumentará.

En este caso, se requiere un cambio de configuración, por favor contacte a nuestro soporte o representante de ventas.
Declaraciones de Error
Error de Fallo: SR_BACKEND_FAILURE_44(, No hay suficiente espacio, )
Causa
La capacidad de almacenamiento está llena.
Primeros Respondedores
Usuario
Solución
Básicamente, necesita eliminar algunos datos para liberar espacio. Elimine máquinas virtuales innecesarias.
Elimine instantáneas innecesarias. Para obtener información sobre cómo eliminar instantáneas innecesarias, consulte aquí. Evite respaldar máquinas virtuales innecesarias. Si desea excluirlas del respaldo, consulte aquí.
Declaraciones de Error
Error de Fallo: SR_BACKEND_FAILURE_109(, La cadena de instantáneas es demasiado larga, )
Causa
Esto ocurre cuando hay muchas instantáneas de la máquina virtual objetivo. Solo se pueden crear hasta 30 instantáneas para una máquina virtual, incluidas las invisibles. Además, la eliminación de instantáneas toma tiempo, pero estas se retrasan. El mismo error puede aparecer durante este tiempo. En el caso de Xen Orchestra, el proceso de replicación es un mecanismo para tomar instantáneas y transferir las diferencias, por lo que esto puede ocurrir si el RPO es demasiado corto para la cantidad de actualizaciones de la máquina virtual. Si esto ocurre para varias máquinas virtuales, el RPO necesita aumentarse.
Primeros Respondedores
Usuario
Solución
Elimine instantáneas innecesarias de la lista de instantáneas. Puede haber instantáneas sin nombre que Xen Orchestra creó automáticamente durante el respaldo y que permanecen. Para obtener información sobre cómo eliminar instantáneas innecesarias, consulte aquí. Si ocurre esta situación, es posible que el RPO sea demasiado corto para las actualizaciones de la máquina virtual. Si esto ocurre con frecuencia, por favor contacte a nuestro soporte o representante de ventas.
Declaraciones de Error
Razón Omitida: (cadena VDI no saludable) Trabajo cancelado para proteger la cadena VDI
Causa
Esto ocurre cuando se requiere el proceso de consolidación de instantáneas de la máquina virtual objetivo. El proceso de consolidación se realiza automáticamente, por lo que deberá esperar un tiempo. Esto puede ocurrir al ejecutar un trabajo inmediatamente después de eliminar una instantánea.
Primeros Respondedores
Usuario
Solución
Como se describe en la sección sobre la capacidad de almacenamiento requerida, Xen realiza un proceso de fusión de discos diferido después de eliminar una instantánea. Esto también puede ocurrir si el estado de fusión del disco es anormal debido a un error en la eliminación de la instantánea o al detener la eliminación a mitad de camino. Básicamente, si espera un tiempo, Xen realizará automáticamente el proceso de fusión de discos, y el problema se resolverá después de un tiempo. Si el error persiste después de unos días, en raras ocasiones, puede ocurrir un error interno y el proceso de fusión puede no ser posible. Si termina en este estado, la forma más fácil de regresar es clonar la máquina virtual y luego eliminar la original. Consulte aquí para obtener información sobre cómo clonar una máquina virtual.
Declaraciones de Error
No se pudo encontrar la VM base
Causa
Esto ocurre cuando no se puede encontrar el punto de copia de seguridad anterior de la máquina virtual o no es normal. La copia de seguridad se realiza fusionando las diferencias desde la copia anterior, por lo que si no se encuentra la copia anterior, la copia de seguridad fallará.
Primeros Respondedores
Usuario
Solución
Desde la lista de instantáneas, elimine el punto de copia de seguridad pasado [XO Backup dp4-xenpool…]. Esto hará que la copia de seguridad de esa máquina virtual inicie una sincronización completa en lugar de una sincronización diferencial. Como resultado, el mensaje “Error: el trabajo (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) ya está en ejecución” puede ocurrir por un tiempo. Esto también puede ocurrir cuando hay muchas instantáneas. En ese caso, será necesario eliminar instantáneas innecesarias. Consulte aquí para obtener información sobre la eliminación.