Giới thiệu
Các doanh nghiệp hiện nay đang chứng kiến mức tăng trưởng dữ liệu trung bình 30% mỗi năm, dẫn đến tổng lượng dữ liệu tăng gấp đôi sau mỗi 2,5 năm. Trước đây, các tổ chức có hai cách tiếp cận để đối phó với sự gia tăng dữ liệu sao lưu:
- Mua dư thừa một máy chủ lưu trữ hoặc bộ điều khiển với hy vọng sẽ tận dụng hết dung lượng trong tương lai—một phương pháp tốn kém và lãng phí.
- Sử dụng phương pháp lưu trữ tiêu chuẩn—mua một giải pháp đáp ứng nhu cầu lưu trữ hiện tại, sau đó bổ sung thêm dung lượng khi cần. Cách tiếp cận này được gọi là Scale-Up.
Kiến trúc Scale-Up và Hạn chế
Với Scale-Up, bộ điều khiển đóng vai trò là điểm truy cập chính với một lượng tài nguyên cố định (mạng, bộ nhớ, CPU). Khi thêm ổ đĩa vật lý vào hệ thống lưu trữ hiện tại, chỉ có dung lượng lưu trữ tăng lên, nhưng tài nguyên tính toán (networking, CPU, bộ nhớ) vẫn giữ nguyên. Điều này gây ra vấn đề lớn đối với các tổ chức:
- Khi dữ liệu sao lưu vượt 50TB đến petabyte, hoặc
- Khi cần lưu trữ dữ liệu lâu dài, khử trùng lặp (data deduplication) trở thành yếu tố quan trọng để giảm chi phí lưu trữ.
Tuy nhiên, khi dung lượng dữ liệu tăng lên, tải khử trùng lặp cũng tăng theo, đòi hỏi thêm tài nguyên mạng, CPU và bộ nhớ. Các thiết bị khử trùng lặp truyền thống như Dell Data Domain và HPE StoreOnce sử dụng kiến trúc Scale-Up, nên chúng không thể mở rộng tài nguyên tính toán theo dung lượng lưu trữ. Điều này dẫn đến tình trạng quá tải xử lý, làm suy giảm hiệu suất sao lưu và cuối cùng hệ thống sẽ thất bại.
Giải pháp Scale-Out
Gần đây, một phương pháp hiệu quả hơn đã xuất hiện: Scale-Out – bổ sung cả dung lượng lưu trữ và tài nguyên tính toán theo cách linh hoạt và tiết kiệm chi phí.
Với Scale-Out, thay vì chỉ thêm ổ cứng, tổ chức có thể thêm toàn bộ thiết bị lưu trữ mới vào hệ thống. Điều này giúp:
- Tăng cả lưu trữ, CPU, bộ nhớ và băng thông mạng.
- Tích hợp thông minh để hoạt động như một hệ thống duy nhất (bao gồm cân bằng tải, khử trùng lặp trên nhiều thiết bị, và tăng khả năng xử lý).
- Loại bỏ tắc nghẽn của bộ điều khiển trung tâm trong kiến trúc Scale-Up.
Giải pháp này có thể được tìm thấy trong các hệ thống Tiered Backup Storage như ExaGrid.
Tại sao cần Scale-Out?
Để hiểu tại sao Scale-Out là cần thiết, chúng ta cần xem xét tác động của sự gia tăng dữ liệu đối với từng phương pháp triển khai.
Tác động của Sự Gia Tăng Dữ Liệu Sao Lưu Không Chỉ Dừng Lại Ở Lưu Trữ Ổ Đĩa
Sự gia tăng dữ liệu sao lưu không chỉ đơn thuần là vấn đề về dung lượng lưu trữ. Để hỗ trợ sự phát triển này, các đội ngũ IT cần đảm bảo rằng:
- Cơ sở hạ tầng lưu trữ sao lưu có thể đáp ứng đủ dung lượng theo chính sách lưu trữ dữ liệu.
- Khả năng xử lý sao lưu có thể mở rộng để tiếp nhận lượng dữ liệu ngày càng lớn mà không ảnh hưởng đến hiệu suất sao lưu.
Nếu quá trình sao lưu bị ảnh hưởng, nó có thể tạo ra hiệu ứng dây chuyền, dẫn đến nhiều sự chậm trễ và khiến sao lưu bị vượt quá thời gian cho phép (backup window).
Xử Lý Dữ Liệu Sao Lưu trong Hệ Thống Lưu Trữ Sao Lưu
Lượng dữ liệu có thể được tiếp nhận vào một hệ thống lưu trữ sao lưu phụ thuộc vào khả năng xử lý dữ liệu của hệ thống trong khoảng thời gian mà quá trình sao lưu không gây gián đoạn cho doanh nghiệp. Đây là một yếu tố cực kỳ quan trọng.
Cửa sổ sao lưu (Backup Window) là khoảng thời gian ngoài giờ làm việc dành riêng cho các tác vụ sao lưu. Ví dụ, nếu một hệ thống có thể tiếp nhận dữ liệu với tốc độ 50TB/giờ, thì trong cửa sổ sao lưu 6 giờ, hệ thống có thể xử lý 300TB dữ liệu. Trong thực tế, cửa sổ sao lưu thường kéo dài từ 6 đến 8 giờ.
Hạn chế của Kiến Trúc Scale-Up
Trong các hệ thống Scale-Up, con số tốc độ tiếp nhận dữ liệu này chỉ mang tính lý thuyết tối đa. Khi dung lượng dữ liệu tiếp tục tăng, hiệu suất thực tế sẽ giảm dần do nhiều yếu tố:
- Khử trùng lặp (Deduplication)
- Khôi phục dữ liệu (Recoveries)
- Sao chép dữ liệu (Replication Processing)
Những tác vụ này có thể làm chậm hoặc giảm lượng dữ liệu có thể được xử lý trong một khoảng thời gian nhất định. Do đó, hiệu suất thực tế của hệ thống Scale-Up thường thấp hơn rất nhiều so với con số được công bố.
Vấn đề nghiêm trọng:
- Khi khối lượng dữ liệu vượt quá giới hạn của cửa sổ sao lưu, doanh nghiệp không thể hoàn tất sao lưu đúng thời gian.
- Nguyên nhân không phải do thiếu ổ đĩa lưu trữ, mà là bộ điều khiển bị quá tải.
- Thêm ổ đĩa không giải quyết được vấn đề vì bộ điều khiển vẫn là điểm nghẽn chính.
Giải pháp trong Kiến Trúc Scale-Up: “Rip-and-Replace”
Do các hạn chế trên, người dùng kiến trúc Scale-Up thường phải đối mặt với lựa chọn khó khăn:
- Họ không thể tiếp tục mở rộng bằng cách thêm ổ đĩa vì bộ điều khiển bị giới hạn.
- Họ phải nâng cấp lên một hệ thống lớn hơn, đồng nghĩa với việc di chuyển toàn bộ dữ liệu từ hệ thống cũ sang hệ thống mới.
- Quá trình này được gọi là “Rip-and-Replace” hoặc “Forklift Upgrade”, gây tốn kém, mất thời gian và gián đoạn hoạt động kinh doanh.
Do đó, với sự gia tăng không ngừng của dữ liệu sao lưu, các doanh nghiệp cần một giải pháp linh hoạt hơn thay vì phải liên tục nâng cấp toàn bộ hệ thống như cách mà Scale-Up yêu cầu.
Tại Sao Kiến Trúc Scale-Out Không Gặp Phải Vấn Đề Này?
Không giống như kiến trúc Scale-Up, nơi bạn phải dự đoán kích thước bộ điều khiển phù hợp ngay từ đầu, kiến trúc Scale-Out cho phép bạn mở rộng linh hoạt bằng cách thêm các thiết bị phù hợp khi dữ liệu tăng lên.
Hệ thống Scale-Out bao gồm các thiết bị hoàn chỉnh (bộ xử lý, bộ nhớ, băng thông và ổ đĩa) có thể kết nối với nhau trong một mạng lưu trữ sao lưu. Khi dữ liệu tăng, tất cả tài nguyên cần thiết đều được mở rộng, bao gồm:
- Dung lượng lưu trữ chính
- Băng thông mạng
- Bộ xử lý (CPU) & bộ nhớ (RAM)
- Dung lượng ổ đĩa
Điều này giúp cửa sổ sao lưu luôn giữ nguyên, bất kể dữ liệu tăng bao nhiêu, đồng thời loại bỏ nhu cầu nâng cấp hệ thống tốn kém (“forklift upgrade”).
Lợi Ích của Scale-Out so với Scale-Up
- Không cần đoán trước kích thước bộ điều khiển: Với Scale-Up, nếu chọn sai bộ điều khiển ngay từ đầu, bạn có thể phải thay thế toàn bộ hệ thống sau này. Scale-Out giúp bạn mở rộng từng bước theo nhu cầu thực tế.
- Hỗ trợ nhiều thiết bị với kích thước và tuổi đời khác nhau: Một hệ thống Scale-Out có thể kết hợp nhiều thiết bị với cấu hình khác nhau, giúp các đội IT mua và bổ sung tài nguyên theo đúng nhu cầu.
- Không lỗi thời, không cần nâng cấp lớn: Mô hình này giúp tránh tình trạng sản phẩm bị lỗi thời và giảm nhu cầu thay thế toàn bộ hệ thống.
Nên Chọn Scale-Up hay Scale-Out?
Scale-Up phù hợp nếu:
- Dữ liệu sao lưu của bạn nhỏ.
- Tốc độ tăng trưởng dữ liệu thấp trong 3-5 năm.
Scale-Out là lựa chọn tối ưu nếu:
- Dữ liệu sao lưu lớn (từ 50TB đến petabyte).
- Dữ liệu có tốc độ tăng trưởng trung bình đến cao.
- Bạn muốn giảm thời gian sao lưu và tiết kiệm chi phí trong dài hạn.
Những doanh nghiệp có nhu cầu sao lưu lớn nên cân nhắc các giải pháp Scale-Out như ExaGrid, giúp rút ngắn thời gian sao lưu và tối ưu chi phí ngay từ đầu và trong suốt vòng đời hệ thống.