返回

備份失敗的原因與解決方案

本頁說明當備份(複製)失敗時的原因與解決方案。

當虛擬機備份失敗或被跳過時,您將從Xen Orchestra服務器收到一封標題為“備份報告”的電子郵件。即使發生這種情況,虛擬機服務仍將繼續運行,但如果Xen主機發生故障且儲存無法救援,存在丟失恢復點的風險

備份失敗主要有三個原因:

  1. 當本地儲存的可用空間不足時
  2. 當虛擬機的快照數量過多時
  3. 當虛擬機的虛擬磁盤大小過大或更新過多,且RPO = 1小時(每小時兩次)的備份不再足夠時

以下是每個錯誤消息的原因與解決方案。

如果您遇到除列出以外的其他錯誤,或即使採取措施後問題仍未解決(例如情況立即恢復正常),請聯繫我們的支援或銷售代表。此外,對於上述三種情況,基本解決方案是縮減備份目標或延長RPO時間(請諮詢)。

關於備份報告

寄件人的電子郵件地址為“sysadmin@justplayer.com”,主題為“[Xen Orchestra] failure(or skipped) − Backup report for backup job name”。請查看電子郵件正文以了解備份任務和錯誤消息的資訊。

我需要多少儲存空間?

Xen所需的儲存容量不僅取決於當前使用的儲存容量,還取決於虛擬機內的數據更新差異。因此,無法一概而論地確定需要多少GB。

這是因為Xen快照是一種需要後備儲存的快照系統。

如果快照之間有大量儲存更新(例如在數據庫或有大量日誌的系統中),差異磁盤的數量將增加。刪除快照時,必須合併差異磁盤,但為了防止意外系統關閉,在合併過程中會保留原始數據,這需要大量的臨時可用儲存空間。在Xen中,這個合併過程不會在快照刪除後立即執行,而是由系統自動執行,因此在過程完成後會有輕微的延遲。

大多數問題源於快照後備儲存合併過程的兩個特性:它需要可用空間且執行是延遲的。

SR_BACKEND_FAILURE_44通常是純粹由儲存容量引起的錯誤。必須始終在主機的本地儲存中保留一定量的可用空間。

請注意,SR_BACKEND_FAILURE_109大多與剩餘磁盤空間有關,例如在合併過程後的刪除操作期間因儲存不足而失敗。

通過刪除不必要的虛擬機、停止不必要的備份或平滑主機的整體負載可以節省儲存空間,但不能忽視此系統在事件發生時快速恢復工作和時間(RTO)的優勢。根據您的合約,您可能能夠擴展儲存容量。如果您需要擴展儲存(SSD),請聯繫我們的支援或銷售代表。


錯誤原因及應對方法

錯誤聲明
錯誤:該任務 (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) 已在運行
*括號內的字符串對每個用戶不同。
原因
當新的備份任務因已有備份任務運行而被跳過時會發生此情況。
由於磁盤更新頻繁等各種因素,備份被延遲。
第一響應者
用戶更改RPO運營策略並聯繫我們
解決方案
這表示由於要備份的數據量大,備份被跳過。如果之後備份正常結束,則無需擔心。
如果此情況頻繁發生,相對於磁盤更新量,備份單位可能太短。在這種情況下,需要逐漸將備份單位延長至1小時、2小時、3小時等。同時,RPO將變長,這意味著從故障中恢復時的最大回溯時間將增加。

在這種情況下,需要更改設置,請聯繫我們的支援或銷售代表。
錯誤聲明
失敗錯誤:SR_BACKEND_FAILURE_44(, 空間不足, )
原因
儲存容量已滿。
第一響應者
用戶
解決方案
基本上需要刪除一些數據以釋放空間。刪除不必要的虛擬機。
刪除不必要的快照,有關刪除不必要快照的資訊,請參閱此處。避免備份不必要的虛擬機。如果想從備份中排除,請查看此處
錯誤聲明
失敗錯誤:SR_BACKEND_FAILURE_109(, 快照鏈過長, )
原因
當目標虛擬機的快照數量過多時會發生此情況。一個虛擬機最多只能創建30個快照,包括不可見的快照。此外,快照刪除需要時間,但這些操作會被延遲。在此期間可能會輸出相同的錯誤。在Xen Orchestra中,複製過程是通過拍攝快照並傳輸差異的機制,因此如果相對於虛擬機的更新量,RPO太短,可能會發生此情況。如果多個虛擬機發生此情況,則需要增加RPO。
第一響應者
用戶
解決方案
從快照列表中刪除不必要的快照。可能存在Xen Orchestra在備份期間自動創建的未命名快照。有關刪除不必要快照的資訊,請參閱此處。如果發生這種情況,可能是虛擬機更新的RPO太短。如果此情況頻繁發生,請聯繫我們的支援或銷售代表。
錯誤聲明
跳過原因:(不健康的VDI鏈) 任務取消以保護VDI鏈
原因
當目標虛擬機的快照整合過程需要時會發生此情況。整合過程是自動執行的,因此您需要等待一段時間。在刪除快照後立即運行任務時可能會發生此情況。
第一響應者
用戶
解決方案
如所需儲存容量部分所述,Xen在刪除快照後執行延遲的磁盤合併過程。如果因快照刪除錯誤或中途停止刪除導致磁盤合併狀態異常,也可能發生此情況。通常,如果等待一段時間,Xen將自動執行磁盤合併過程,問題將在一會兒後解決。如果錯誤在幾天後仍持續存在,在極少數情況下,可能發生內部錯誤,無法執行合併過程。如果進入這種狀態,最簡單的恢復方法是克隆虛擬機,然後刪除原始虛擬機。有關克隆虛擬機的資訊,請參閱此處
錯誤聲明
找不到基礎虛擬機
原因
當無法找到虛擬機的上一個備份點或上一個備份點不正常時會發生此情況。備份是通過合併與上一個備份的差異來執行的,因此如果找不到上一個備份,備份將失敗。
第一響應者
用戶
解決方案
從快照列表中刪除過去的備份點[XO Backup dp4-xenpool…]。這將導致該虛擬機的備份開始完全同步,而不是差異同步。因此,一段時間內可能會出現消息“錯誤:該任務 (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) 已在運行”。當快照數量過多時也可能發生此情況。在這種情況下,需要刪除不必要的快照。有關刪除的資訊,請參閱此處