Retour
Causes et solutions des échecs de sauvegarde
Cette page explique les causes et les solutions en cas d’échec de la sauvegarde (réplication).
Lorsqu’une sauvegarde de machine virtuelle échoue ou est ignorée, vous recevrez un courriel intitulé “Rapport de sauvegarde” depuis le serveur Xen Orchestra. Même si cela se produit, le service de la machine virtuelle continuera, mais dans l’éventualité improbable où une panne survient sur l’hôte Xen et que le stockage ne peut être récupéré, il existe un risque que le point de restauration soit perdu.
Les échecs de sauvegarde surviennent principalement pour trois raisons :
- Lorsqu’il n’y a pas assez d’espace libre dans le stockage local
- Lorsqu’il y a de nombreux instantanés d’une machine virtuelle
- Lorsque la taille du disque virtuel d’une machine virtuelle devient trop importante ou qu’il y a trop de mises à jour, et que la sauvegarde avec un RPO = 1 heure (deux fois par heure) n’est plus suffisante.
Vous trouverez ci-dessous les causes et les solutions pour chaque message d’erreur.
Si vous rencontrez des erreurs autres que celles listées, ou si le problème ne se résout pas même après avoir pris des mesures, comme un retour à la normale immédiat, veuillez contacter notre support ou notre représentant commercial. De plus, dans le cas des trois situations mentionnées ci-dessus, la solution fondamentale est de réduire les cibles de sauvegarde ou d’allonger le temps de RPO (veuillez nous consulter).
À propos du rapport de sauvegarde
L’adresse e-mail de l’expéditeur est “sysadmin@justplayer.com” et l’objet est “[Xen Orchestra] échec (ou ignoré) − Rapport de sauvegarde pour le nom du travail de sauvegarde”. Veuillez vérifier le corps du courriel pour obtenir des informations sur le travail de sauvegarde et le message d’erreur.
De combien d’espace de stockage ai-je besoin ?
La capacité de stockage requise par Xen ne dépend pas uniquement de la capacité de stockage actuellement utilisée, mais aussi des différentiels de mise à jour des données dans la machine virtuelle. Par conséquent, il n’est pas possible de déterminer de manière générale combien de gigaoctets sont nécessaires.
Cela est dû au fait que les instantanés Xen sont un type de système d’instantanés qui nécessite un magasin de sauvegarde.
S’il y a un grand nombre de mises à jour de stockage entre les instantanés (comme dans une base de données ou un système avec un grand nombre de journaux), le nombre de disques différentiels augmentera. Lors de la suppression d’un instantané, les disques différentiels doivent être fusionnés, mais pour éviter les arrêts inattendus du système, les données originales restent intactes pendant le processus de fusion, ce qui nécessite une grande quantité d’espace de stockage temporaire libre. Dans Xen, ce processus de fusion n’est pas effectué immédiatement après la suppression de l’instantané, mais est effectué automatiquement par le système, ce qui entraîne un léger délai après la fin du processus.
La plupart des problèmes surviennent en raison de deux caractéristiques du processus de fusion du magasin de sauvegarde des instantanés : il nécessite de l’espace libre et il est effectué de manière différée.
SR_BACKEND_FAILURE_44 est souvent une erreur purement causée par la capacité de stockage. Il est nécessaire de toujours conserver une certaine quantité d’espace libre dans le stockage local de l’hôte.
Veuillez noter que SR_BACKEND_FAILURE_109 est principalement lié à l’espace disque restant, comme un échec dû à un stockage insuffisant lors de l’opération de suppression après le processus de fusion.
Le stockage peut être économisé en supprimant les machines virtuelles inutiles, en cessant les sauvegardes inutiles ou en lissant la charge globale sur l’hôte, mais les avantages de ce système en termes de rapidité de récupération et de temps (RTO) en cas d’incident ne doivent pas être négligés. Selon votre contrat, vous pourriez être en mesure d’augmenter votre capacité de stockage. Si vous avez besoin d’étendre votre stockage (SSD), veuillez contacter notre support ou notre représentant commercial.
Causes des erreurs et comment y remédier
Déclarations d’erreur |
---|
Erreur : le travail (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) est déjà en cours *La chaîne dans les () sera différente pour chaque utilisateur. |
Cause |
Cela se produit lorsqu’un nouveau travail de sauvegarde est ignoré parce qu’un travail de sauvegarde est déjà en cours. Les sauvegardes sont retardées en raison de divers facteurs, comme des mises à jour fréquentes du disque. |
Premiers intervenants |
L’utilisateur modifie la politique d’exploitation du RPO et nous contacte |
Solution |
Cela signifie que la sauvegarde a été ignorée car la quantité de données à sauvegarder était importante. Si la sauvegarde se termine normalement après cela, il n’y a pas lieu de s’inquiéter. Si cela se produit fréquemment, l’unité de sauvegarde peut être trop courte par rapport à la quantité de mises à jour du disque. Dans ce cas, l’unité de sauvegarde doit être progressivement allongée à 1 heure, 2 heures, 3 heures, etc. En même temps, le RPO deviendra plus long, ce qui signifie que le temps maximum de retour en arrière lors de la récupération après une panne augmentera. Dans ce cas, un changement de paramétrage est requis, veuillez contacter notre support ou notre représentant commercial. |
Déclarations d’erreur |
---|
Erreur d’échec : SR_BACKEND_FAILURE_44 (, Il n’y a pas assez d’espace, ) |
Cause |
La capacité de stockage est pleine. |
Premiers intervenants |
Utilisateur |
Solution |
En général, vous devez supprimer certaines données pour libérer de l’espace. Supprimez les machines virtuelles inutiles. Supprimez les instantanés inutiles. Pour plus d’informations sur la suppression des instantanés inutiles, veuillez consulter ici. Évitez de sauvegarder des machines virtuelles inutiles. Si vous souhaitez les exclure de la sauvegarde, veuillez vérifier ici. |
Déclarations d’erreur |
---|
Erreur d’échec : SR_BACKEND_FAILURE_109 (, La chaîne d’instantanés est trop longue, ) |
Cause |
Cela se produit lorsqu’il y a de nombreux instantanés de la machine virtuelle cible. Seulement jusqu’à 30 instantanés peuvent être créés pour une machine virtuelle, y compris ceux qui sont invisibles. De plus, la suppression d’instantanés prend du temps, mais ces suppressions sont retardées. La même erreur peut être affichée pendant ce temps. Dans le cas de Xen Orchestra, le processus de réplication consiste à prendre des instantanés et à transférer les différences, donc cela peut se produire si le RPO est trop court pour la quantité de mises à jour de la machine virtuelle. Si cela se produit pour plusieurs machines virtuelles, le RPO doit être augmenté. |
Premiers intervenants |
Utilisateur |
Solution |
Supprimez les instantanés inutiles de la liste des instantanés. Il peut y avoir des instantanés sans nom que Xen Orchestra a automatiquement créés pendant la sauvegarde et qui restent. Pour plus d’informations sur la suppression des instantanés inutiles, veuillez consulter ici. Si cette situation se produit, il est possible que le RPO soit trop court pour les mises à jour de la machine virtuelle. Si cela se produit fréquemment, veuillez contacter notre support ou notre représentant commercial. |
Déclarations d’erreur |
---|
Raison ignorée : (chaîne VDI non saine) Travail annulé pour protéger la chaîne VDI |
Cause |
Cela se produit lorsque le processus de consolidation des instantanés de la machine virtuelle cible est requis. Le processus de consolidation est effectué automatiquement, vous devrez donc attendre un certain temps. Cela peut se produire lors de l’exécution d’un travail immédiatement après la suppression d’un instantané. |
Premiers intervenants |
Utilisateur |
Solution |
Comme décrit dans la section sur la capacité de stockage requise, Xen effectue un processus de fusion de disques différé après la suppression d’un instantané. Cela peut également se produire si l’état de fusion des disques est anormal en raison d’une erreur dans la suppression d’instantanés ou d’un arrêt en cours de suppression. En général, si vous attendez un peu, Xen effectuera automatiquement le processus de fusion des disques, et le problème sera résolu après un certain temps. Si l’erreur persiste après quelques jours, dans de rares cas, une erreur interne peut se produire et le processus de fusion peut ne pas être possible. Si vous vous retrouvez dans cet état, le moyen le plus simple de revenir en arrière est de cloner la machine virtuelle et ensuite de supprimer l’original. Consultez ici pour plus d’informations sur le clonage d’une machine virtuelle. |
Déclarations d’erreur |
---|
Impossible de trouver la machine virtuelle de base |
Cause |
Cela se produit lorsque le point de sauvegarde précédent de la machine virtuelle ne peut pas être trouvé ou n’est pas normal. La sauvegarde est effectuée en fusionnant les différences par rapport à la sauvegarde précédente, donc si la sauvegarde précédente ne peut pas être trouvée, la sauvegarde échouera. |
Premiers intervenants |
Utilisateur |
Solution |
À partir de la liste des instantanés, supprimez le point de sauvegarde passé [XO Backup dp4-xenpool…]. Cela entraînera le démarrage d’une synchronisation complète au lieu d’une synchronisation différentielle pour la sauvegarde de cette machine virtuelle. En conséquence, le message “Erreur : le travail (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) est déjà en cours” peut apparaître pendant un certain temps. Cela peut également se produire lorsqu’il y a de nombreux instantanés. Dans ce cas, il faudra supprimer les instantanés inutiles. Veuillez consulter ici pour plus d’informations sur la suppression. |