Sự gia tăng của các “ốc đảo dữ liệu” (data silos) đang khiến nhiều đội ngũ CNTT đau đầu. Tuy nhiên, đó cũng là cơ hội cho những doanh nghiệp biết cách mang lại trật tự cho mớ hỗn độn trong các trung tâm dữ liệu.
KHÁM PHÁ TỪ HẬU TRƯỜNG THỊ TRƯỜNG DỮ LIỆU
Sự kiện IT Press Tour tại New York đã cho thấy: những nhà cung cấp công nghệ nhỏ hơn và ít được biết đến vẫn có chỗ đứng – miễn là họ có thể giải quyết các vấn đề mà những “ông lớn” chưa làm đủ tốt.
Từ hỗn loạn trong quản lý dữ liệu phi cấu trúc, khôi phục chậm sau ransomware, đến lỗ hổng trong sao lưu ứng dụng SaaS, đều là những “vùng trống” đầy tiềm năng.
Câu hỏi đặt ra là: lợi thế này sẽ kéo dài bao lâu, trước khi thị trường hợp nhất hoặc đối thủ bắt kịp?
KHÔNG LẠC LỐI TRONG ĐẠI DƯƠNG DỮ LIỆU
Quản lý hàng petabyte video, âm thanh và tài liệu số không hề dễ dàng – đặc biệt khi cần tìm chính xác một cảnh quay hoặc nhân vật mà không biết tên file. Đây là thách thức hằng ngày của các hãng phim và viện lưu trữ dữ liệu.
National Film and Sound Archive (NFSA) của Úc đã chọn giải pháp của Arcitecta – công ty chuyên quản lý dữ liệu phi cấu trúc (như video, ảnh, âm thanh, tài liệu y tế…).
Khoảng 80% dữ liệu của tổ chức hiện nay là phi cấu trúc, và vấn đề không chỉ ở khối lượng mà còn ở vị trí lưu trữ phân tán: trên nhiều máy chủ, hệ thống và ổ đĩa từ các nhà cung cấp khác nhau.

Theo Jason Lohrey – CEO kiêm CTO của Arcitecta, “Chúng ta đang sống trong kỷ nguyên mà mọi thứ đều được điều khiển bằng dữ liệu – nhưng điều đó chỉ đúng khi ta có thể truy cập vào chúng.”
Sứ mệnh của Arcitecta rất rõ ràng: “Quản lý tất cả dữ liệu từ một nơi, bất kể chúng nằm ở đâu.”
SỨC MẠNH CỦA METADATA
Ra đời năm 1998, Arcitecta giới thiệu hệ thống Mediaflux vào năm 2003 – giải pháp đã không ngừng phát triển suốt hơn hai thập kỷ qua.
Năm 2024, công ty được Coldago Research vinh danh là nhà lãnh đạo trong lĩnh vực quản lý dữ liệu phi cấu trúc, cùng với Komprise, Hammerspace và Data Dynamics.
Điểm khác biệt của Arcitecta nằm ở công nghệ cơ sở dữ liệu xoDB (XML-encoded Object Database) – một dạng NoSQL tiên phong từ năm 2010. Không chỉ là hệ thống chỉ mục file, xoDB là cơ sở dữ liệu metadata có khả năng xử lý quy mô khổng lồ mà các hệ thống truyền thống không thể.
Theo Eric Polet – Giám đốc Marketing sản phẩm, “Sức mạnh của chúng tôi nằm ở metadata – trái tim của Mediaflux. Một khách hàng của chúng tôi đang quản lý hơn một nghìn tỷ đối tượng trong cùng một không gian tên, trong khi mỗi bản ghi metadata chỉ chiếm trung bình 75 byte.”
Arcitecta cũng đã đạt bước tiến lớn trong việc tăng gấp đôi mật độ lưu trữ dữ liệu, tối ưu hiệu suất và giảm lãng phí không gian đĩa – điều mà Jason Lohrey gọi là “chén thánh” của ngành cơ sở dữ liệu.
KHI AI GẶP GỠ DỮ LIỆU
Bước phát triển tiếp theo của Arcitecta là cơ sở dữ liệu vector tích hợp với xoDB, cho phép tìm kiếm ngữ nghĩa (semantic search).
Mediaflux không trực tiếp tạo vector mà phối hợp với các dịch vụ AI (như Wasabi AIR) để nhận diện khuôn mặt, phát hiện vật thể, trích xuất văn bản (OCR) và phân tích giọng nói.
Tất cả thông tin sau đó được lưu lại cùng metadata trong một hệ thống duy nhất, giúp người dùng tìm kiếm thông minh hơn – ví dụ: “Hiển thị các đoạn video có người X đang nói về chủ đề Y.”

Giải pháp này hiện đang được thử nghiệm tại NFSA Australia, nơi lưu trữ hàng petabyte nội dung số.
“Chúng tôi không chạy theo những tuyên bố lớn – điều quan trọng là hành động. Giờ là lúc biến tầm nhìn về AI thành hiện thực,” Eric Polet chia sẻ.
DỮ LIỆU THỜI GIAN THỰC VÀ NGÀNH TRUYỀN THÔNG
Một điểm nhấn khác là MediaFlux Real-Time, được giới thiệu tại NAB Show ở Las Vegas.
Giải pháp này cho phép ghi và đọc cùng một file tại nhiều địa điểm khác nhau với độ trễ chỉ 10–100 mili giây.
Điều đó nghĩa là một ekip ở Warszawa có thể chỉnh sửa video đang quay tại Sydney trong thời gian thực, không cần chờ tải file hay đồng bộ.
Ngoài ngành truyền thông, Arcitecta còn phục vụ bảo tàng, viện nghiên cứu, trường đại học và bệnh viện – nhiều đơn vị trong số đó đang rút khỏi các dịch vụ đám mây công cộng.
KHI KHÁCH HÀNG “RỜI BỎ” ĐÁM MÂY
Một ví dụ điển hình là Dana-Farber Cancer Institute (Mỹ). Ban đầu, họ chuyển dữ liệu lên AWS để tận dụng tính linh hoạt và khả năng mở rộng. Nhưng sau đó, các chi phí ẩn – đặc biệt là phí API – đã khiến tổng chi phí tăng vọt.
Kết quả, viện đã chuyển 95% dữ liệu trở lại môi trường on-premises.
Giờ đây, họ sử dụng Wasabi nhờ mô hình giá minh bạch hơn và kết hợp với Mediaflux để quản lý tất cả file từ một không gian tên thống nhất, dù dữ liệu ở bất kỳ đâu.
XU HƯỚNG NGƯỢC DÒNG: TRỞ LẠI VỚI BĂNG TỪ
Ngạc nhiên hơn cả, nhiều tổ chức đang quay lại sử dụng băng từ. Trước đây, họ rời bỏ công nghệ này để đến với Amazon Glacier hay Azure Blob Storage. Tuy nhiên, giờ đây sự kiểm soát dữ liệu, bảo mật vật lý và chi phí minh bạch khiến băng từ trở nên hấp dẫn trở lại – đặc biệt với các tổ chức nghiên cứu, y tế và quốc phòng.
Theo Eric Polet, “Sở hữu vật lý phương tiện lưu trữ cũng có nghĩa là sở hữu quyền kiểm soát thông tin.”
KẾT LUẬN: DỮ LIỆU KHÔNG CHỈ LÀ THÁCH THỨC, MÀ LÀ CƠ HỘI
Trong thế giới dữ liệu phi cấu trúc khổng lồ, sự khác biệt không nằm ở quy mô, mà ở khả năng tổ chức và truy cập thông minh. Những công ty như Arcitecta đang chứng minh rằng: ngay cả trong một thị trường cạnh tranh cao, sáng tạo vẫn là chìa khóa để tồn tại và dẫn đầu.
Unitas cam kết đồng hành cùng doanh nghiệp, cung cấp các giải pháp và phân tích an ninh mạng tiên tiến nhất. Để nhận được tư vấn chuyên sâu hoặc hỗ trợ nhanh chóng, vui lòng liên hệ với chúng tôi qua email: info@unitas.vn hoặc Hotline: (+84) 939 586 168.