ExaGrid Giải quyết mọi thách thức của việc loại bỏ dữ liệu trùng lặp
Tìm hiểu về Data Deduplication
Data deduplication (khử trùng lặp dữ liệu) là một yếu tố bắt buộc đối với hệ thống backup, vì backup yêu cầu lưu trữ dữ liệu trong thời gian dài theo tuần, tháng và năm. Thời gian lưu trữ càng lâu thì càng cần nhiều dung lượng đĩa, kéo theo chi phí lưu trữ càng cao.
Deduplication sẽ so sánh các bản backup với nhau và, ở mức độ rất nhỏ trong từng phần của file, xác định dữ liệu nào đã thay đổi và chỉ lưu lại phần thay đổi đó. Sau bản backup đầu tiên, lượng dữ liệu thay đổi thường rất nhỏ. Thay vì lưu 40 bản retention dưới dạng full backup hoặc compressed full backup, bạn chỉ cần lưu một bản đầy đủ và các phần khác biệt giữa các lần backup tiếp theo.
Có một số điểm quan trọng cần hiểu về data deduplication:
- Thứ nhất, quá trình này tiêu tốn rất nhiều tài nguyên xử lý (compute intensive), do đó ảnh hưởng lớn đến tốc độ backup (ingest) và restore. Khi dữ liệu tăng lên, thời gian backup window cũng tăng theo.
- Thứ hai, vì lý do đó, deduplication trong phần mềm backup thường ít chi tiết hơn và kém hiệu quả về lưu trữ hơn. Việc sử dụng ổ đĩa primary storage thông thường phía sau ứng dụng backup sẽ nhanh chóng trở nên đắt đỏ do tỷ lệ deduplication thấp.
Những điều cần biết để so sánh công bằng giữa các giải pháp
Một số câu hỏi quan trọng cần đặt ra cho nhà cung cấp về phương pháp data deduplication của họ:
- Họ sử dụng phương pháp deduplication nào và đạt được tỷ lệ deduplication bao nhiêu?
- Tốc độ ingest mỗi giờ là bao nhiêu? Điều này ảnh hưởng trực tiếp đến thời lượng backup window.
- Dữ liệu có chỉ được lưu dưới dạng deduplicated hay không? Nếu có, thời gian restore hoặc boot VM sẽ lâu hơn do cần quá trình rehydration dữ liệu.
- Khi tăng dung lượng lưu trữ, có đồng thời tăng compute, memory và network ports không? Nếu không, backup window sẽ ngày càng kéo dài khi dữ liệu tăng trưởng.
- Nếu compute không được thêm cùng dung lượng, thì việc bổ sung compute được thực hiện như thế nào? Có cần phải nâng cấp toàn bộ server/controller (forklift upgrade) khi backup window vượt giới hạn không?
- Recovery Point Objective (RPO) cho site dự phòng là bao nhiêu?
- Khi bật replication và encryption, hiệu suất deduplication có bị chậm đi dẫn đến backup chậm hơn không?
- Nếu sản phẩm bị ngừng phát triển (obsoleted), liệu có còn được hỗ trợ không? Chi phí maintenance có tăng mạnh không?
ExaGrid đã xem xét tất cả các vấn đề trên và nhận thấy rằng cách tiếp cận sử dụng:
- exact matching deduplication,
- front-end controller chỉ bổ sung disk shelves khi dữ liệu tăng,
- inline deduplication thực hiện trong backup window,
- và chỉ lưu dữ liệu ở dạng deduplicated,
là một cách tiếp cận chưa tối ưu.
ExaGrid giải quyết các thách thức của Data Deduplication
ExaGrid Tiered Backup Storage
Điểm nổi bật:
- Backup nhanh nhất
- Khôi phục nhanh nhất
- Scale-out hiệu quả và tiết kiệm chi phí
- Bảo mật toàn diện và khả năng phục hồi ransomware
Phương pháp Deduplication khác biệt của ExaGrid – Tiered Backup Storage
ExaGrid được thiết kế ngay từ đầu để giải quyết toàn bộ các vấn đề cố hữu của data deduplication và mang lại các lợi ích sau:
- Backup nhanh nhất nhờ ghi trực tiếp vào Landing Zone trên đĩa mà không cần xử lý inline deduplication trong quá trình backup
→ tốc độ ingest nhanh hơn 3 lần so với đối thủ gần nhất. - Giữ các bản backup gần nhất trong Landing Zone ở định dạng không deduplicated (native backup app format)
→ giúp restore, boot VM và sao chép tape offsite nhanh hơn. - Kiến trúc scale-out bổ sung compute, memory và network ports mỗi khi thêm dung lượng đĩa
→ đảm bảo backup window luôn giữ nguyên ngay cả khi dữ liệu tăng trưởng. - Repository Tier không kết nối mạng (tiered air gap)
→ hacker/threat actor không thể nhìn thấy hoặc truy cập.
Ngoài ra:- delayed delete policy đảm bảo dữ liệu chưa bị xóa ngay lập tức ở Repository Tier,
- immutable data objects giúp đảm bảo dữ liệu luôn toàn vẹn để restore/recover.
- Không cần forklift upgrades vì compute được bổ sung cùng với dung lượng lưu trữ.
- Không có kế hoạch ngừng hỗ trợ sản phẩm sớm; mọi model đều được hỗ trợ bảo trì tiêu chuẩn đến hết vòng đời.
- Adaptive Deduplication thực hiện deduplication và replication song song với backup
→ cải thiện RPO cho disaster recovery offsite và tránh bottleneck của inline deduplication. - Tự động cân bằng tải giữa tất cả các deduplication repositories để tối ưu hiệu quả lưu trữ.
- Global deduplication trên toàn bộ appliance trong hệ thống scale-out giúp tăng hiệu quả lưu trữ.
- Tích hợp với nhiều ứng dụng backup để cải thiện hiệu năng:
- NetBackup OST
- Veeam Data Mover
- Oracle RMAN Channels
→ hỗ trợ automated job management và fast synthetic fulls.
ExaGrid có thể mở rộng đến:
- 6PB full backup
- tốc độ 649.6TB/giờ
→ trở thành hệ thống backup deduplication lớn nhất và nhanh nhất trên thị trường
So sánh công nghệ Deduplication
| Giải pháp | Tỷ lệ Deduplication | Global Deduplication | Phương pháp |
| Backup application integrated deduplication | 2:1 – 5:1 | Yes | Exact Matching |
| Dell Data Domain | 20:1 | Yes | Similarity Detection |
| HPE StoreOnce | 20:1 | Yes | Variable-length Content Splitting |
| NetBackup Appliances | 20:1 | Yes | Adaptive/Inline |
Unitas cam kết đồng hành cùng doanh nghiệp, cung cấp các giải pháp và phân tích an ninh mạng tiên tiến nhất. Để nhận được tư vấn chuyên sâu hoặc hỗ trợ nhanh chóng, vui lòng liên hệ với chúng tôi qua:
Email: info@unitas.vn
Hotline: (+84) 939 586 168