Trong kỷ nguyên TechBio đang phát triển mạnh mẽ, một công ty khoa học đời sống tiên phong đã đưa công nghệ trở thành trung tâm trong hành trình nghiên cứu và phát triển thuốc. Họ sở hữu một trong những siêu máy tính tư nhân nhanh nhất trong ngành dược, mở ra quy mô tính toán chưa từng có trong nghiên cứu sinh học.
Vận hành trên nền tảng hệ điều hành khoa học được thiết kế riêng và tích hợp AI, sứ mệnh của họ là chuyển đổi và tăng tốc quá trình phát triển thuốc bằng cách kết hợp tự động hóa, machine learning và dữ liệu sinh học quy mô lớn. Công ty hướng đến việc giải mã sinh học thông qua công cụ tính toán và thí nghiệm tốc độ cao, giúp khám phá phương pháp điều trị mới nhanh hơn và hiệu quả hơn so với các phương pháp truyền thống.

Để hiện thực hóa mục tiêu đó, họ cần một hệ thống AI Data Lakehouse hiệu năng cao, có khả năng mở rộng linh hoạt đến hàng chục petabyte và tích hợp mượt mà trong môi trường đám mây lai (hybrid cloud). Và đó chính là lúc MinIO AIStor xuất hiện.
PHÂN TÍCH MÔI TRƯỜNG HOẠT ĐỘNG
Công ty này vận hành các phòng thí nghiệm tự động, tạo ra khối lượng dữ liệu sinh học khổng lồ ghi lại cách tế bào người phản ứng với các hợp chất và biến đổi gen – một quy trình được gọi là “phenomics”.
Các nhóm khoa học dữ liệu và nghiên cứu của họ sử dụng mô hình AI để phân tích dữ liệu, nhận diện mô hình và phát hiện các ứng viên thuốc tiềm năng hoặc cơ chế bệnh học.
Điểm khác biệt của công ty nằm ở nền tảng thí nghiệm toàn diện được phát triển nội bộ và quy trình robot phòng thí nghiệm tự động hóa cao, cho phép thực hiện hơn 2,2 triệu thí nghiệm mỗi tuần. Hệ thống này tạo ra hình ảnh tế bào sinh học và dữ liệu hóa học có độ chính xác cao, được xử lý theo thời gian thực qua pipeline dữ liệu tùy chỉnh để làm sạch, gắn nhãn và chuẩn bị cho phân tích sâu hơn. Tổng cộng, công ty đang quản lý hơn 20 petabyte dữ liệu.

THÁCH THỨC: ĐỘ PHỨC TẠP, KHẢ NĂNG MỞ RỘNG VÀ CHI PHÍ
Hệ thống lưu trữ NAS cũ không thể đáp ứng nhu cầu tăng trưởng dữ liệu và hiệu suất ngày càng cao. Để bù đắp, nhóm nghiên cứu phải phụ thuộc vào hạ tầng đám mây công cộng, dẫn đến chi phí vận hành và egress tăng vọt.
Bên cạnh đó, hệ thống thiếu các tính năng linh hoạt và sự đơn giản cần thiết cho môi trường thực hiện hàng triệu thí nghiệm mỗi tuần. Với các cụm siêu máy tính và hệ thống phòng thí nghiệm tạo ra hàng terabyte hình ảnh mỗi ngày, việc truyền dữ liệu liên tục giữa hệ thống nội bộ và đám mây gây ra thiếu hiệu quả và chi phí cao.
Công ty cần một AI Data Lakehouse trên nền tảng hybrid cloud có khả năng hỗ trợ luồng dữ liệu liền mạch giữa ba môi trường trọng yếu: cụm phòng thí nghiệm, hệ thống tính toán hiệu năng cao (HPC) và hạ tầng đám mây công cộng.
Ngoài ra, các bộ dữ liệu lịch sử kéo dài nhiều năm cũng phải được truy cập dễ dàng trên cả môi trường nội bộ và đa đám mây phục vụ phân tích, huấn luyện lại mô hình. Đội ngũ còn yêu cầu khả năng độc lập với nhà cung cấp và tự do lựa chọn phần cứng phù hợp với nhu cầu phát triển.
GIẢI PHÁP: MINIO AISTOR
Sau quá trình đánh giá nghiêm ngặt, công ty đã lựa chọn MinIO AIStor làm nền tảng AI Data Lakehouse thế hệ mới, giúp giải quyết triệt để các bài toán về khả năng mở rộng, hiệu năng và chi phí.
HIỆU NĂNG Ở QUY MÔ PETABYTE
Nhờ ứng dụng AIStor, công ty có thể mở rộng quy mô lên hàng chục petabyte dữ liệu trong khi vẫn giảm độ trễ và chi phí egress trên đám mây. Kết quả là hiệu suất pipeline machine learning tăng đáng kể, đồng thời tăng tốc các khối lượng công việc AI/ML và HPC trên môi trường hybrid.
“AIStor là giải pháp duy nhất đáp ứng được yêu cầu hybrid cloud của chúng tôi, đồng thời mang lại hiệu suất hàng đầu với chi phí tối ưu cho mỗi petabyte dữ liệu.”
LƯU TRỮ ĐÁM MÂY LAI LIỀN MẠCH
AIStor tương thích hoàn toàn với chuẩn giao thức S3, giúp chuẩn hóa truy cập dữ liệu giữa các môi trường on-premise và đám mây. Nhờ đó, các nhà nghiên cứu có thể huấn luyện mô hình ở bất kỳ nơi nào có GPU khả dụng, tối ưu hiệu suất tính toán, thực hiện nhiều thí nghiệm hơn với kết quả chính xác hơn, mang lại lợi ích cả về khoa học lẫn kinh doanh.
KIẾN TRÚC LINH HOẠT, ĐỊNH NGHĨA BẰNG PHẦN MỀM
Đội ngũ đánh giá cao kiến trúc độc lập phần cứng và không phụ thuộc nhà cung cấp của AIStor, cho phép họ liên tục tích hợp công nghệ mới mà không lo bị “khóa nền tảng”.
Nhờ đó, công ty có thể mở rộng đổi mới mà không đánh đổi chi phí – đồng thời tối ưu giá trị từ nền tảng nghiên cứu nội bộ.
Hiện nay, AIStor được sử dụng để lưu trữ và quản lý dòng dữ liệu liên tục từ hình ảnh hiển vi, dữ liệu giải trình tự gen và kết quả thí nghiệm. Dữ liệu này được sao chép và di chuyển linh hoạt giữa các cụm HPC và môi trường đám mây lai, hỗ trợ quá trình học máy, nhận dạng bệnh và phát triển thuốc.
“AIStor mang đến cho chúng tôi khả năng đổi mới tối đa mà không phải hy sinh chi phí vận hành.”
AISTOR – BIẾN DỮ LIỆU THÀNH GIÁ TRỊ VỚI AI
AIStor giúp các tổ chức lưu trữ, quản lý và truy cập dữ liệu quy mô petabyte – yếu tố cốt lõi trong nghiên cứu, phân tích và khám phá khoa học. Với hiệu suất cấp doanh nghiệp và độ linh hoạt cao, AIStor loại bỏ nhu cầu xây dựng hệ thống lưu trữ phức tạp, giúp đội ngũ nghiên cứu tập trung vào đổi mới thay vì hạ tầng.
Unitas cam kết đồng hành cùng doanh nghiệp, cung cấp các giải pháp và phân tích an ninh mạng tiên tiến nhất. Để nhận được tư vấn chuyên sâu hoặc hỗ trợ nhanh chóng, vui lòng liên hệ với chúng tôi qua email: info@unitas.vn hoặc Hotline: (+84) 939 586 168.