Giá NAND từ trước đến nay vốn mang tính chu kỳ, nhưng mức độ biến động hiện tại đang trở nên gay gắt hơn, nhanh hơn và khó dự đoán hơn nhiều so với các chu kỳ trước. Sự tập trung nguồn cung, biến động nhu cầu do hạ tầng AI thúc đẩy, cùng với các chính sách kiểm soát công suất quyết liệt đã khiến bài toán kinh tế của bộ nhớ flash trở nên khó lường. Trong vòng một năm qua, giá SSD doanh nghiệp đã tăng mạnh, thường từ 75-125% tùy theo dung lượng và khả năng sẵn có, gây áp lực lớn lên các kế hoạch lưu trữ vốn được xây dựng dựa trên những giả định hoàn toàn khác.
Thách thức lớn không chỉ nằm ở việc giá tăng, mà ở chỗ nhiều kiến trúc lưu trữ AI hiện nay được thiết kế với giả định rằng chi phí phần cứng ổn định và chu kỳ mua sắm dài. Khi NAND ngày càng khó đoán, các thiết kế thuần all-flash trở nên cứng nhắc, khiến tổ chức đối mặt với rủi ro chi phí, thiếu linh hoạt trong vận hành và những đánh đổi về hiệu năng mà không thể khắc phục chỉ bằng các biện pháp tối ưu mua sắm ngắn hạn.
Sự thay đổi này đang buộc các nhà lãnh đạo hạ tầng CNTT phải nhìn xa hơn các chiến thuật mua hàng, để xem xét lại những nền tảng cốt lõi trong cách thiết kế, triển khai và mở rộng hệ thống lưu trữ trong một môi trường mà yếu tố kinh tế có thể thay đổi bất cứ lúc nào.
Điều gì đang thúc đẩy giá NAND tăng mạnh?
Câu trả lời là: khối lượng công việc AI.

Các trung tâm dữ liệu AI đang tiêu thụ lượng bộ nhớ NAND (chủ yếu thông qua SSD) lớn hơn bao giờ hết, và tốc độ tiêu thụ này đang vượt xa khả năng đáp ứng của nguồn cung. Các quy trình huấn luyện, hệ thống suy luận và việc liên tục tinh chỉnh mô hình đều phụ thuộc vào khả năng truy cập flash với thông lượng cao, khiến yếu tố từng chỉ là phụ trợ nay trở thành nút thắt thực sự. Khoảng cách giữa cung và cầu ngày càng mở rộng và chưa có dấu hiệu thu hẹp.
Vì sao biến động NAND buộc phải tư duy lại thiết kế lưu trữ AI
Trong nhiều năm, flash (SSD) đã trở thành lựa chọn mặc định cho lưu trữ AI. Khi giá NAND ổn định và nguồn cung dễ dự đoán, việc tiêu chuẩn hóa all-flash giúp giảm rủi ro và đơn giản hóa quá trình lập kế hoạch. Tuy nhiên, bối cảnh đó đã thay đổi.
Khi giá NAND tăng cao và nguồn cung thắt chặt, việc áp dụng SSD all-flash đồng loạt cho toàn bộ môi trường AI đang bộc lộ nhiều điểm kém hiệu quả, đặc biệt khi các khối lượng công việc AI đặt ra yêu cầu rất khác nhau đối với lưu trữ ở từng giai đoạn như huấn luyện, suy luận và vòng đời dữ liệu. Không phải mọi tập dữ liệu hay mọi bước xử lý đều cần cùng một mức hiệu năng của flash.
Kết quả là các đội ngũ bắt đầu thay đổi cách tư duy về thiết kế lưu trữ: giảm tập trung vào một loại phương tiện duy nhất, và chuyển sang căn chỉnh các tầng lưu trữ theo đúng yêu cầu của từng khối lượng công việc trong bối cảnh NAND không còn dồi dào hay rẻ.
Cách các đội ngũ AI hàng đầu căn chỉnh kiến trúc lưu trữ theo khối lượng công việc
Các khối lượng công việc AI không đồng nhất. Huấn luyện, suy luận, tiền xử lý và lưu checkpoint đều đặt ra những yêu cầu khác nhau đối với hệ thống lưu trữ. Việc đối xử với mọi dữ liệu như nhau đang trở nên kém hiệu quả trong thị trường NAND hiện nay.
Những đội ngũ thích ứng tốt với biến động NAND không phải là những đội hy sinh hiệu năng, cũng không phải những đội mặc định all-flash là lựa chọn an toàn duy nhất. Thay vào đó, họ thay đổi cách đưa ra quyết định lưu trữ để phản ứng với chi phí NAND tăng cao và nguồn cung hạn chế.
Các đội ngũ dẫn đầu đang thiết kế kiến trúc lưu trữ dựa trên hành vi thực tế của hệ thống AI, bao gồm:
- Căn chỉnh hiệu năng lưu trữ theo yêu cầu công việc, không theo loại phương tiện
- Tách biệt dữ liệu “nóng” cần hiệu năng cao với các luồng dữ liệu “ấm” và “lạnh”
- Chủ động sử dụng kiến trúc hybrid, trong đó SSD và HDD đảm nhiệm những vai trò rõ ràng
- Lựa chọn kiến trúc định nghĩa bằng phần mềm, độc lập phần cứng, thay vì khóa chặt vào một thiết kế cố định từ đầu
Khi lưu trữ được căn chỉnh theo hành vi của khối lượng công việc, các đội ngũ có thể duy trì hiệu năng ở mức ứng dụng trong khi giảm đáng kể mức độ phụ thuộc vào NAND biến động.
Ba lý do biến động giá NAND làm gia tăng rủi ro cho các đội AI
1. Dữ liệu AI không chậm lại mà đang tăng tốc
Khối lượng công việc AI liên tục tạo ra dữ liệu mới. Quy trình huấn luyện mở rộng tập dữ liệu, suy luận tạo ra telemetry lâu dài, và việc lặp mô hình đòi hỏi checkpoint và versioning liên tục.
Những nhu cầu này không dừng lại khi thị trường biến động.
Việc trì hoãn quyết định lưu trữ không làm giảm nhu cầu, mà chỉ đẩy vấn đề sang tương lai, thường là trong khung thời gian gấp gáp hơn và với chi phí cao hơn.
Rủi ro là GPU bị khai thác không hiệu quả và các quyết định hạ tầng mang tính vội vàng.
2. Biến động NAND là thực tế kéo dài nhiều năm
Đây không phải là một đợt tăng giá ngắn hạn. Nhu cầu hạ tầng AI tiếp tục chiếm tỷ trọng ngày càng lớn trong tổng công suất flash toàn cầu, trong khi việc mở rộng nguồn cung vẫn được thực hiện thận trọng.
Chờ đợi thị trường “bình thường trở lại” thường đồng nghĩa với việc lập kế hoạch dựa trên những giả định không bao giờ xảy ra.
Rủi ro là ít lựa chọn hơn, kém linh hoạt hơn và chi phí cao hơn khi buộc phải ra quyết định.
3. Điện toán đám mây không phải lựa chọn cho mọi khối lượng công việc AI
Lưu trữ đám mây có thể giúp đáp ứng nhu cầu bùng phát hoặc hỗ trợ giai đoạn thử nghiệm ban đầu. Tuy nhiên, với nhiều môi trường AI như các ngành bị quản lý chặt, sáng kiến AI chủ quyền hay dữ liệu nhạy cảm, đây không phải là giải pháp toàn diện.
Ngay cả khi đám mây khả thi, AI quy mô lớn vẫn đi kèm những đánh đổi như:
- Chi phí truy xuất và truyền dữ liệu ngày càng tăng
- Hiệu năng không ổn định
- Giảm quyền kiểm soát khi dữ liệu ngày càng “nặng”
Rủi ro là sự linh hoạt ngắn hạn có thể biến thành gánh nặng chi phí hoặc tuân thủ trong dài hạn.
Kiến trúc ưu tiên hiệu năng là chìa khóa trong bối cảnh NAND biến động
Điểm mấu chốt không chỉ là NAND đang đắt đỏ, mà là kiến trúc quyết định kết quả, đặc biệt khi ngân sách cố định nhưng điều kiện thị trường thì không.
DDN hỗ trợ khách hàng điều hướng biến động NAND bằng cách bắt đầu từ yêu cầu hiệu năng và hành vi khối lượng công việc, thay vì những giả định cứng nhắc về phương tiện lưu trữ. Thay vì áp đặt một mô hình duy nhất, DDN phối hợp cùng khách hàng đánh giá các cấu hình linh hoạt, bao gồm all-flash, hybrid và phần mềm thuần túy, dựa trên cách hệ thống AI thực sự vận hành.
Trong thực tế, điều này giúp các đội ngũ:
- Duy trì mức sử dụng GPU và hiệu năng ở tầng ứng dụng
- Giảm mức độ phụ thuộc không cần thiết vào NAND từ 30-70%
- Căn chỉnh các tầng lưu trữ theo đúng nhu cầu công việc
- Linh hoạt điều chỉnh cấu hình theo thời gian khi dữ liệu, mô hình và ngân sách thay đổi
Với những đội ngũ đang phải vận hành trong ngân sách cố định và đối mặt với biến động NAND kéo dài, bước đi hiệu quả nhất là xác thực quyết định kiến trúc trước khi cam kết đầu tư. DDN có thể hỗ trợ quá trình này. Hãy liên hệ với chuyên gia AI của DDN để tìm hiểu thêm.
Unitas cam kết đồng hành cùng doanh nghiệp, cung cấp các giải pháp và phân tích an ninh mạng tiên tiến nhất. Để nhận được tư vấn chuyên sâu hoặc hỗ trợ nhanh chóng, vui lòng liên hệ với chúng tôi qua email: info@unitas.vn hoặc Hotline: (+84) 939 586 168.