Zurück
Ursachen und Lösungen für Sicherungsfehler
Diese Seite erklärt die Ursachen und Lösungen, wenn eine Sicherung (Replikation) fehlschlägt.
Wenn eine Sicherung einer virtuellen Maschine fehlschlägt oder übersprungen wird, erhalten Sie eine E-Mail mit dem Titel „Sicherungsbericht“ vom Xen Orchestra-Server. Selbst wenn dies geschieht, wird der Dienst der virtuellen Maschine fortgesetzt, aber im unwahrscheinlichen Fall eines Ausfalls des Xen-Hosts, bei dem der Speicher nicht gerettet werden kann, besteht das Risiko, dass der Wiederherstellungspunkt verloren geht.
Sicherungsfehler treten hauptsächlich aus drei Gründen auf:
- Wenn nicht genügend freier Speicherplatz im lokalen Speicher vorhanden ist
- Wenn es viele Snapshots einer virtuellen Maschine gibt
- Wenn die virtuelle Festplattengröße einer virtuellen Maschine zu groß wird oder es zu viele Updates gibt und die Sicherung mit RPO = 1 Stunde (zweimal pro Stunde) nicht mehr ausreicht.
Nachfolgend sind die Ursachen und Lösungen für jede Fehlermeldung aufgeführt.
Wenn Sie Fehler außerhalb der aufgeführten erleben oder das Problem trotz ergriffener Maßnahmen, wie z. B. der sofortigen Normalisierung der Situation, nicht behoben wird, kontaktieren Sie bitte unseren Support oder Vertriebsmitarbeiter. In den oben genannten Fällen 3 ist die grundlegende Lösung, die Sicherungsziele einzugrenzen oder die RPO-Zeit zu verlängern (bitte anfragen).
Über den Sicherungsbericht
Die E-Mail-Adresse des Absenders ist „sysadmin@justplayer.com“ und der Betreff lautet „[Xen Orchestra] Fehlschlag (oder übersprungen) − Sicherungsbericht für den Namen des Sicherungsjobs“. Bitte überprüfen Sie den Inhalt der E-Mail für Informationen über den Sicherungsjob und die Fehlermeldung.
Wie viel Speicherplatz benötige ich?
Die von Xen benötigte Speicherkapazität hängt nicht nur von der derzeit genutzten Speicherkapazität ab, sondern auch von den Datenaktualisierungsdifferenzen innerhalb der virtuellen Maschine. Daher ist es nicht möglich, allgemein zu bestimmen, wie viele Gigabyte benötigt werden.
Dies liegt daran, dass Xen-Snapshots eine Art von Snapshot-System sind, das einen Backing-Store benötigt.
Wenn es zwischen Snapshots eine große Menge an Speicheraktualisierungen gibt (z. B. in einer Datenbank oder einem System mit vielen Protokollen), erhöht sich die Anzahl der differentiellen Festplatten. Beim Löschen eines Snapshots müssen die differentiellen Festplatten zusammengeführt werden, aber um unerwartete Systemabschaltungen zu verhindern, bleiben die ursprünglichen Daten während des Zusammenführungsprozesses intakt, was eine große Menge an temporärem freiem Speicherplatz erfordert. In Xen wird dieser Zusammenführungsprozess nicht sofort nach dem Löschen des Snapshots durchgeführt, sondern automatisch vom System, sodass es nach Abschluss des Prozesses zu einer leichten Verzögerung kommt.
Die meisten Probleme entstehen durch zwei Merkmale des Zusammenführungsprozesses des Snapshot-Backing-Stores: Er erfordert freien Speicherplatz und wird verzögert durchgeführt.
SR_BACKEND_FAILURE_44 ist oft ein Fehler, der rein durch die Speicherkapazität verursacht wird. Es ist notwendig, immer eine gewisse Menge an freiem Speicherplatz im lokalen Speicher des Hosts zu halten.
Bitte beachten Sie, dass SR_BACKEND_FAILURE_109 meist mit dem verbleibenden Festplattenspeicher zusammenhängt, wie z. B. ein Fehlschlag aufgrund unzureichenden Speichers während des Löschvorgangs nach dem Zusammenführungsprozess.
Speicherplatz kann durch das Löschen unnötiger virtueller Maschinen, das Beenden unnötiger Sicherungen oder das Glätten der Gesamtlast auf dem Host gespart werden, aber die Vorteile dieses Systems in Bezug auf schnelle Wiederherstellungsarbeiten und Zeit (RTO) im Falle eines Vorfalls dürfen nicht übersehen werden. Je nach Vertrag können Sie Ihre Speicherkapazität erweitern. Wenn Sie Ihren Speicher (SSD) erweitern müssen, kontaktieren Sie bitte unseren Support oder unseren Vertriebsmitarbeiter.
Ursachen von Fehlern und deren Behebung
Fehleraussagen |
---|
Fehler: Der Job (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) läuft bereits *Die Zeichenfolge innerhalb () ist für jeden Benutzer unterschiedlich. |
Ursache |
Dies tritt auf, wenn ein neuer Sicherungsjob übersprungen wird, weil bereits ein Sicherungsjob läuft. Sicherungen verzögern sich aufgrund verschiedener Faktoren, wie z. B. häufigen Festplattenaktualisierungen. |
Erste Maßnahmen |
Der Benutzer ändert die RPO-Betriebsrichtlinie und kontaktiert uns. |
Lösung |
Dies bedeutet, dass die Sicherung übersprungen wurde, weil die zu sichernde Datenmenge groß war. Wenn die Sicherung danach normal endet, besteht kein Grund zur Sorge. Wenn dies häufig auftritt, ist die Sicherungseinheit im Vergleich zur Menge der Festplattenaktualisierungen möglicherweise zu kurz. In diesem Fall muss die Sicherungseinheit schrittweise auf 1 Stunde, 2 Stunden, 3 Stunden usw. verlängert werden. Gleichzeitig wird das RPO länger, was bedeutet, dass die maximale Rückspulzeit während der Wiederherstellung nach einem Ausfall zunimmt. In diesem Fall ist eine Änderung der Einstellungen erforderlich, kontaktieren Sie daher bitte unseren Support oder Vertriebsmitarbeiter. |
Fehleraussagen |
---|
Fehler: SR_BACKEND_FAILURE_44(, Es ist nicht genügend Speicherplatz vorhanden, ) |
Ursache |
Die Speicherkapazität ist voll. |
Erste Maßnahmen |
Benutzer |
Lösung |
Grundsätzlich müssen Sie einige Daten löschen, um Speicherplatz freizugeben. Löschen Sie unnötige VMs. Löschen Sie unnötige Snapshots. Informationen zum Löschen unnötiger Snapshots finden Sie hier. Vermeiden Sie die Sicherung unnötiger virtueller Maschinen. Wenn Sie sie von der Sicherung ausschließen möchten, überprüfen Sie hier. |
Fehleraussagen |
---|
Fehler: SR_BACKEND_FAILURE_109(, Die Snapshot-Kette ist zu lang, ) |
Ursache |
Dies tritt auf, wenn es viele Snapshots der Ziel-virtuellen Maschine gibt. Für eine virtuelle Maschine können maximal 30 Snapshots erstellt werden, einschließlich unsichtbarer. Auch das Löschen von Snapshots dauert Zeit, wird jedoch verzögert. Während dieser Zeit kann derselbe Fehler ausgegeben werden. Bei Xen Orchestra ist der Replikationsprozess ein Mechanismus zum Erstellen von Snapshots und Übertragen der Unterschiede, sodass dies auftreten kann, wenn das RPO im Verhältnis zur Menge der Updates der virtuellen Maschine zu kurz ist. Wenn dies bei mehreren virtuellen Maschinen auftritt, muss das RPO erhöht werden. |
Erste Maßnahmen |
Benutzer |
Lösung |
Löschen Sie unnötige Snapshots aus der Snapshot-Liste. Es können unbenannte Snapshots vorhanden sein, die Xen Orchestra während der Sicherung automatisch erstellt hat und die verbleiben. Informationen zum Löschen unnötiger Snapshots finden Sie hier. Wenn diese Situation auftritt, ist es möglich, dass das RPO für die Updates der virtuellen Maschine zu kurz ist. Wenn dies häufig auftritt, kontaktieren Sie bitte unseren Support oder Vertriebsmitarbeiter. |
Fehleraussagen |
---|
Übersprungener Grund: (ungesunde VDI-Kette) Job abgebrochen, um die VDI-Kette zu schützen |
Ursache |
Dies tritt auf, wenn der Snapshot-Konsolidierungsprozess der Ziel-virtuellen Maschine erforderlich ist. Der Konsolidierungsprozess wird automatisch durchgeführt, daher müssen Sie eine Weile warten. Dies kann auftreten, wenn ein Job unmittelbar nach dem Löschen eines Snapshots ausgeführt wird. |
Erste Maßnahmen |
Benutzer |
Lösung |
Wie im Abschnitt über die erforderliche Speicherkapazität beschrieben, führt Xen nach dem Löschen eines Snapshots einen verzögerten Festplattenzusammenführungsprozess durch. Dies kann auch auftreten, wenn der Festplattenzusammenführungszustand aufgrund eines Fehlers beim Löschen eines Snapshots oder eines Abbruchs des Löschvorgangs abnormal ist. Grundsätzlich, wenn Sie eine Weile warten, führt Xen den Festplattenzusammenführungsprozess automatisch durch, und das Problem wird nach einer Weile behoben. Wenn der Fehler nach einigen Tagen weiterhin besteht, kann in seltenen Fällen ein interner Fehler auftreten und der Zusammenführungsprozess ist nicht möglich. Wenn Sie in diesem Zustand landen, ist der einfachste Weg zur Wiederherstellung, die virtuelle Maschine zu klonen und dann das Original zu löschen. Informationen zum Klonen einer virtuellen Maschine finden Sie hier. |
Fehleraussagen |
---|
Die Basis-VM konnte nicht gefunden werden |
Ursache |
Dies tritt auf, wenn der vorherige Sicherungspunkt der virtuellen Maschine nicht gefunden werden kann oder nicht normal ist. Die Sicherung wird durch Zusammenführen der Unterschiede zur vorherigen Sicherung durchgeführt, sodass die Sicherung fehlschlägt, wenn die vorherige Sicherung nicht gefunden werden kann. |
Erste Maßnahmen |
Benutzer |
Lösung |
Löschen Sie aus der Snapshot-Liste den früheren Sicherungspunkt [XO Backup dp4-xenpool…]. Dadurch wird die Sicherung dieser virtuellen Maschine eine vollständige Synchronisierung anstelle einer differentiellen Synchronisierung starten. Infolgedessen kann die Nachricht „Fehler: Der Job (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) läuft bereits“ für eine Weile auftreten. Dies kann auch auftreten, wenn es viele Snapshots gibt. In diesem Fall müssen unnötige Snapshots gelöscht werden. Informationen zum Löschen finden Sie hier. |