Quay lại

Nguyên nhân và Giải pháp cho Thất bại trong Sao lưu

Trang này giải thích các nguyên nhân và giải pháp khi quá trình sao lưu (nhân bản) thất bại.

Khi quá trình sao lưu máy ảo thất bại hoặc bị bỏ qua, bạn sẽ nhận được email “Báo cáo sao lưu” từ máy chủ Xen Orchestra. Ngay cả khi điều này xảy ra, dịch vụ máy ảo sẽ tiếp tục hoạt động, nhưng trong trường hợp hiếm hoi xảy ra lỗi trên Xen host và bộ nhớ không thể được cứu, có nguy cơ điểm khôi phục sẽ bị mất.

Các lỗi sao lưu xảy ra chủ yếu do ba lý do:

  1. Khi không còn đủ dung lượng trống trong bộ nhớ cục bộ
  2. Khi có quá nhiều bản chụp nhanh (snapshot) của một máy ảo
  3. Khi kích thước đĩa ảo của máy ảo trở nên quá lớn hoặc có quá nhiều cập nhật, và RPO = 1 giờ (hai lần một giờ) không còn đủ.

Dưới đây là các nguyên nhân và giải pháp cho từng thông báo lỗi.

Nếu bạn gặp phải lỗi ngoài những lỗi được liệt kê, hoặc nếu vấn đề không tự giải quyết ngay cả sau khi bạn đã thực hiện các biện pháp, chẳng hạn như tình hình trở lại bình thường ngay lập tức, vui lòng liên hệ với đội ngũ hỗ trợ hoặc đại diện bán hàng của chúng tôi. Ngoài ra, trong trường hợp của 3 trường hợp trên, giải pháp cơ bản là thu hẹp các mục tiêu sao lưu hoặc kéo dài thời gian RPO (vui lòng hỏi thêm).

Về Báo cáo Sao lưu

Địa chỉ email của người gửi là “sysadmin@justplayer.com” và tiêu đề là “[Xen Orchestra] thất bại (hoặc bị bỏ qua) − Báo cáo sao lưu cho tên công việc sao lưu”. Vui lòng kiểm tra nội dung email để biết thông tin về công việc sao lưu và thông báo lỗi.

Tôi Cần Bao Nhiêu Dung Lượng Lưu Trữ?

Dung lượng lưu trữ mà Xen yêu cầu không chỉ phụ thuộc vào dung lượng lưu trữ đang sử dụng mà còn phụ thuộc vào sự khác biệt cập nhật dữ liệu trong máy ảo. Do đó, không thể xác định một cách chung chung cần bao nhiêu gigabyte.

Điều này là do các bản chụp nhanh (snapshot) của Xen là một loại hệ thống chụp nhanh yêu cầu một kho lưu trữ nền (backing store).

Nếu có một lượng lớn cập nhật lưu trữ giữa các bản chụp nhanh (chẳng hạn như trong cơ sở dữ liệu hoặc hệ thống có nhiều nhật ký), số lượng đĩa khác biệt sẽ tăng lên. Khi xóa một bản chụp nhanh, các đĩa khác biệt phải được hợp nhất, nhưng để ngăn chặn việc tắt hệ thống bất ngờ, dữ liệu gốc được giữ nguyên trong quá trình hợp nhất, điều này đòi hỏi một lượng lớn dung lượng trống tạm thời. Trong Xen, quá trình hợp nhất này không được thực hiện ngay sau khi bản chụp nhanh bị xóa, mà được hệ thống tự động thực hiện, nên có một chút chậm trễ sau khi quá trình hoàn tất.

Hầu hết các vấn đề phát sinh do hai đặc điểm của quá trình hợp nhất kho lưu trữ nền chụp nhanh: nó yêu cầu dung lượng trống và được thực hiện một cách chậm rãi.

SR_BACKEND_FAILURE_44 thường là lỗi hoàn toàn do dung lượng lưu trữ gây ra. Cần luôn giữ một lượng dung lượng trống nhất định trong bộ nhớ cục bộ của máy chủ.

Lưu ý rằng SR_BACKEND_FAILURE_109 chủ yếu liên quan đến dung lượng đĩa còn lại, chẳng hạn như thất bại do không đủ dung lượng lưu trữ trong quá trình xóa sau khi hợp nhất.

Dung lượng lưu trữ có thể được tiết kiệm bằng cách xóa các máy ảo không cần thiết, ngừng các bản sao lưu không cần thiết, hoặc làm phẳng tổng tải trên máy chủ, nhưng lợi ích của hệ thống này về mặt khôi phục nhanh và thời gian (RTO) trong trường hợp xảy ra sự cố không thể bị xem nhẹ. Tùy thuộc vào hợp đồng của bạn, bạn có thể mở rộng dung lượng lưu trữ. Nếu bạn cần mở rộng dung lượng lưu trữ (SSD), vui lòng liên hệ với đội ngũ hỗ trợ hoặc đại diện bán hàng của chúng tôi.


Nguyên nhân của Lỗi và Cách Xử lý

Tuyên bố Lỗi
Lỗi: công việc (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) đang chạy
*Chuỗi trong () sẽ khác nhau đối với mỗi người dùng.
Nguyên nhân
Điều này xảy ra khi một công việc sao lưu mới bị bỏ qua vì một công việc sao lưu đã đang chạy.
Các bản sao lưu bị trì hoãn do nhiều yếu tố khác nhau, chẳng hạn như cập nhật đĩa thường xuyên.
Người Phản hồi Đầu tiên
Người dùng thay đổi chính sách vận hành RPO và liên hệ với chúng tôi
Giải pháp
Điều này có nghĩa là bản sao lưu đã bị bỏ qua vì lượng dữ liệu cần sao lưu lớn. Nếu bản sao lưu kết thúc bình thường sau đó, không cần lo lắng.
Nếu điều này xảy ra thường xuyên, đơn vị sao lưu có thể quá ngắn so với lượng cập nhật đĩa. Trong trường hợp này, đơn vị sao lưu cần được kéo dài dần lên 1 giờ, 2 giờ, 3 giờ, v.v. Đồng thời, RPO sẽ trở nên dài hơn, nghĩa là thời gian tua lại tối đa trong quá trình khôi phục từ sự cố sẽ tăng lên.

Trong trường hợp này, cần thay đổi cài đặt, vui lòng liên hệ với đội ngũ hỗ trợ hoặc đại diện bán hàng của chúng tôi.
Tuyên bố Lỗi
Lỗi Thất bại: SR_BACKEND_FAILURE_44(, Không đủ dung lượng, )
Nguyên nhân
Dung lượng lưu trữ đã đầy.
Người Phản hồi Đầu tiên
người dùng
Giải pháp
Về cơ bản, bạn cần xóa một số dữ liệu để giải phóng dung lượng.
Xóa các máy ảo không cần thiết.
Xóa các bản chụp nhanh không cần thiết. Để biết thông tin về cách xóa các bản chụp nhanh không cần thiết, vui lòng xem tại đây. Tránh sao lưu các máy ảo không cần thiết. Nếu bạn muốn loại trừ nó khỏi sao lưu, vui lòng kiểm tra tại đây.
Tuyên bố Lỗi
Lỗi Thất bại: SR_BACKEND_FAILURE_109(, Chuỗi chụp nhanh quá dài, )
Nguyên nhân
Điều này xảy ra khi có quá nhiều bản chụp nhanh của máy ảo mục tiêu. Chỉ có thể tạo tối đa 30 bản chụp nhanh cho một máy ảo, bao gồm cả những bản không hiển thị. Ngoài ra, việc xóa bản chụp nhanh mất thời gian, nhưng những bản này bị trì hoãn. Cùng lỗi này có thể được xuất ra trong thời gian này. Trong trường hợp của Xen Orchestra, quá trình nhân bản là cơ chế chụp nhanh và chuyển các khác biệt, vì vậy điều này có thể xảy ra nếu RPO quá ngắn so với lượng cập nhật của máy ảo. Nếu điều này xảy ra cho nhiều máy ảo, cần tăng RPO.
Người Phản hồi Đầu tiên
người dùng
Giải pháp
Xóa các bản chụp nhanh không cần thiết từ danh sách chụp nhanh. Có thể có các bản chụp nhanh không tên do Xen Orchestra tự động tạo trong quá trình sao lưu còn sót lại. Để biết thông tin về cách xóa các bản chụp nhanh không cần thiết, vui lòng tham khảo tại đây. Nếu tình huống này xảy ra, có thể RPO quá ngắn so với các cập nhật máy ảo. Nếu điều này xảy ra thường xuyên, vui lòng liên hệ với đội ngũ hỗ trợ hoặc đại diện bán hàng của chúng tôi.
Tuyên bố Lỗi
Lý do Bỏ qua: (chuỗi VDI không lành mạnh) Công việc bị hủy để bảo vệ chuỗi VDI
Nguyên nhân
Điều này xảy ra khi cần thực hiện quá trình hợp nhất chụp nhanh của máy ảo mục tiêu. Quá trình hợp nhất được thực hiện tự động, vì vậy bạn sẽ cần đợi một thời gian. Điều này có thể xảy ra khi chạy công việc ngay sau khi xóa một bản chụp nhanh.
Người Phản hồi Đầu tiên
người dùng
Giải pháp
Như đã mô tả trong phần về dung lượng lưu trữ cần thiết, Xen thực hiện quá trình hợp nhất đĩa bị trì hoãn sau khi xóa một bản chụp nhanh. Điều này cũng có thể xảy ra nếu trạng thái hợp nhất đĩa bất thường do sai sót trong việc xóa chụp nhanh hoặc dừng xóa giữa chừng. Về cơ bản, nếu bạn đợi một thời gian, Xen sẽ tự động thực hiện quá trình hợp nhất đĩa, và vấn đề sẽ được giải quyết sau một thời gian.
Nếu lỗi vẫn tiếp diễn sau vài ngày
Trong một số trường hợp hiếm hoi, có thể xảy ra lỗi nội bộ và quá trình hợp nhất không thể thực hiện được.
Nếu bạn rơi vào trạng thái này, cách dễ nhất để khắc phục là sao chép máy ảo và sau đó xóa bản gốc. Xem tại đây để biết thông tin về cách sao chép máy ảo.
Tuyên bố Lỗi
không thể tìm thấy máy ảo cơ sở
Nguyên nhân
Điều này xảy ra khi điểm sao lưu trước đó của máy ảo không thể được tìm thấy hoặc không bình thường. Sao lưu được thực hiện bằng cách hợp nhất các khác biệt từ bản sao lưu trước đó, vì vậy nếu bản sao lưu trước không thể được tìm thấy, sao lưu sẽ thất bại.
Người Phản hồi Đầu tiên
người dùng
Giải pháp
Từ danh sách chụp nhanh, xóa điểm sao lưu trước đó [XO Backup dp4-xenpool…]. Điều này sẽ khiến sao lưu của máy ảo đó bắt đầu đồng bộ hóa toàn bộ thay vì đồng bộ hóa khác biệt. Kết quả là, thông báo “Lỗi: công việc (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX) đang chạy” có thể xảy ra trong một thời gian. Điều này cũng có thể xảy ra khi có nhiều bản chụp nhanh. Trong trường hợp đó, cần xóa các bản chụp nhanh không cần thiết. Vui lòng tham khảo tại đây để biết thông tin về cách xóa.