返回
备份失败的原因与解决方案
此页面说明备份(复制)失败时的原因和解决方案。
当虚拟机备份失败或被跳过时,您将收到来自Xen Orchestra服务器的“备份报告”电子邮件。即使发生这种情况,虚拟机服务仍将继续运行,但在Xen主机发生故障且存储无法挽救的极少数情况下,存在丢失恢复点的风险。
备份失败主要有以下三个原因:
- 当本地存储的可用空间不足时
- 当虚拟机的快照数量过多时
- 当虚拟机的虚拟磁盘大小过大或更新过多,且RPO = 1小时(每小时两次)的备份不再足够时
以下是每个错误消息的原因和解决方案。
如果您遇到除下列之外的其他错误,或者即使采取措施后问题仍未解决(例如情况立即恢复正常),请联系我们的支持或销售代表。此外,对于上述三种情况,基本解决方案是缩小备份目标范围或延长RPO时间(请咨询)。
关于备份报告
发件人电子邮件地址为“sysadmin@justplayer.com”,主题为“[Xen Orchestra] failure(or skipped) − Backup report for backup job name”。请查看邮件正文以了解备份作业和错误消息的详细信息。
我需要多少存储空间?
Xen所需的存储容量不仅取决于当前使用的存储容量,还取决于虚拟机内的数据更新差异。因此,无法一概而论地确定需要多少GB。
这是因为Xen快照是一种需要后备存储的快照系统。
如果快照之间的存储更新量很大(例如在数据库或日志量大的系统中),差异磁盘的数量将会增加。删除快照时,必须合并差异磁盘,但为了防止意外的系统关闭,合并过程中原始数据保持不变,这需要大量的临时可用存储空间。在Xen中,此合并过程并非在删除快照后立即执行,而是由系统自动执行,因此在过程完成后会有轻微的延迟。
大多数问题源于快照后备存储合并过程的两个特性:它需要可用空间,并且执行是延迟的。
SR_BACKEND_FAILURE_44通常是纯粹由存储容量引起的错误。必须始终在主机的本地存储中保持一定量的可用空间。
请注意,SR_BACKEND_FAILURE_109大多与剩余磁盘空间有关,例如合并过程后的删除操作因存储不足而失败。
通过删除不必要的虚拟机、停止不必要的备份或平衡主机的总体负载,可以节省存储空间,但此系统在发生事故时的快速恢复工作和时间(RTO)优势不容忽视。根据您的合同,您可能可以扩展存储容量。如果您需要扩展存储(SSD),请联系我们的支持或销售代表。
错误原因及应对方法
错误声明 |
---|
错误:作业 (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) 已在运行 *括号内的字符串对每个用户不同。 |
原因 |
当新备份作业因已有备份作业正在运行而被跳过时发生此情况。 由于磁盘更新频繁等各种因素,备份被延迟。 |
第一响应者 |
用户更改RPO操作策略并联系我们 |
解决方案 |
这意味着由于要备份的数据量大,备份被跳过。如果之后备份正常结束,则无需担心。 如果这种情况频繁发生,相对于磁盘更新量,备份单位可能太短。在这种情况下,需要逐渐将备份单位延长至1小时、2小时、3小时等。同时,RPO将变长,这意味着从故障恢复时的最大回溯时间将增加。 在这种情况下,需要更改设置,请联系我们的支持或销售代表。 |
错误声明 |
---|
失败错误:SR_BACKEND_FAILURE_44(, 空间不足, ) |
原因 |
存储容量已满。 |
第一响应者 |
用户 |
解决方案 |
基本上需要删除一些数据以释放空间。删除不必要的虚拟机。 删除不必要的快照。有关删除不必要快照的信息,请查看此处。避免备份不必要的虚拟机。如果想将其排除在备份之外,请查看此处。 |
错误声明 |
---|
失败错误:SR_BACKEND_FAILURE_109(, 快照链过长, ) |
原因 |
当目标虚拟机的快照数量过多时发生此情况。一个虚拟机最多只能创建30个快照,包括不可见的快照。此外,快照删除需要时间,但这些操作会被延迟。在此期间可能会输出相同的错误。在Xen Orchestra中,复制过程是拍摄快照并传输差异的机制,因此如果相对于虚拟机的更新量RPO太短,可能会发生此情况。如果多个虚拟机发生这种情况,则需要增加RPO。 |
第一响应者 |
用户 |
解决方案 |
从快照列表中删除不必要的快照。可能存在Xen Orchestra在备份期间自动创建的无名快照残留。有关删除不必要快照的信息,请参阅此处。如果发生这种情况,可能是RPO对于虚拟机更新来说太短。如果这种情况频繁发生,请联系我们的支持或销售代表。 |
错误声明 |
---|
跳过原因:(不健康的VDI链) 为保护VDI链取消作业 |
原因 |
当目标虚拟机的快照合并过程需要时发生此情况。合并过程是自动执行的,因此需要等待一段时间。在删除快照后立即运行作业时可能会发生此情况。 |
第一响应者 |
用户 |
解决方案 |
如所需存储容量部分所述,Xen在删除快照后执行延迟的磁盘合并过程。如果由于快照删除错误或中途停止删除导致磁盘合并状态异常,也可能发生此情况。通常情况下,等待一段时间后,Xen会自动执行磁盘合并过程,问题将在一段时间后解决。如果错误在几天后仍持续存在,在极少数情况下,可能会发生内部错误,导致无法执行合并过程。如果陷入这种状态,最简单的恢复方法是克隆虚拟机,然后删除原始虚拟机。有关克隆虚拟机的信息,请查看此处。 |
错误声明 |
---|
无法找到基础虚拟机 |
原因 |
当无法找到虚拟机的先前备份点或先前备份点不正常时发生此情况。备份通过合并与前次备份的差异来执行,因此如果无法找到前次备份,备份将失败。 |
第一响应者 |
用户 |
解决方案 |
从快照列表中删除过去的备份点 [XO Backup dp4-xenpool…]。这将导致该虚拟机的备份从差异同步变为完全同步。因此,可能会暂时出现消息“错误:作业 (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) 已在运行”。当快照数量过多时也可能发生此情况。在这种情况下,需要删除不必要的快照。有关删除的信息,请参阅此处。 |