NVIDIA công bố GB200 NVL4

4 ngày trước
NVIDIA vừa giới thiệu giải pháp Blackwell GB200 NVL4 mới nhất của mình, với bốn GPU và hai CPU, đóng gói vào một giải pháp HPC và AI mạnh mẽ.

NVIDIA vừa giới thiệu giải pháp Blackwell GB200 NVL4 mới nhất của mình, với bốn GPU và hai CPU, đóng gói vào một giải pháp HPC và AI mạnh mẽ.

Là một phần trong các thông báo tại SC24, NVIDIA công bố hai nền tảng phần cứng hoàn toàn mới, một dựa trên kiến trúc Hopper hiện tại của công ty và một được trang bị bộ vi xử lý Blackwell mới nhất. Cả hai giải pháp này được thiết kế cho các máy chủ doanh nghiệp, phục vụ các tác vụ HPC và AI tăng tốc.

Bắt đầu với NVIDIA H200 NVL, công ty xác nhận sự có sẵn chung của các thẻ PCIe Hopper này, có thể kết nối lên đến 4 GPU qua một miền NVLINK, mang lại băng thông nhanh gấp bảy lần so với giải pháp PCIe tiêu chuẩn.

NVIDIA cho biết các giải pháp H200 NVL có thể tích hợp vào bất kỳ trung tâm dữ liệu nào và cung cấp một loạt các cấu hình máy chủ linh hoạt được tối ưu hóa cho các tác vụ HPC và AI lai.

Về mặt thông số kỹ thuật, giải pháp Hopper H200 NVL cung cấp 1,5 lần dung lượng bộ nhớ HBM, hiệu suất suy luận LLM cao hơn 1,7 lần và hiệu suất HPC cao hơn 1,3 lần. Người dùng sẽ nhận được 114 SMs với tổng cộng 14.592 lõi CUDA, 456 lõi tensor và hiệu suất lên đến 3 TFLOPs ở FP8 (FP16 tích lũy). GPU này có bộ nhớ HBM2e 80 Gb cấu hình trên giao diện 5120-bit và TDP là 350 Watt.

Chuyển sang Blackwell, chúng ta có lần đầu tiên thấy sự ra mắt của NVIDIA GB200 NVL4, một module hoàn toàn mới, là một phiên bản mở rộng mạnh mẽ của giải pháp AI GB200 Grace Blackwell Superchip ban đầu. Module GB200 NVL4 tăng gấp đôi khả năng của CPU và GPU, đồng thời bổ sung bộ nhớ lớn hơn.

Bạn sẽ có hai GPU Blackwell GB200 được cấu hình trên một bo mạch lớn với hai CPU Grace. Module này được thiết kế như một giải pháp máy chủ đơn với miền NVLINK 4 GPU và 1,3T bộ nhớ đồng nhất (Coherent memory).

Module này sẽ mang lại cải thiện 2,2 lần trong mô phỏng, và nâng cấp 1,8 lần trong hiệu suất huấn luyện và suy luận. Danh sách đối tác ngày càng lớn của NVIDIA sẽ cung cấp giải pháp NVL4 trong những tháng tới.

Về TDP, vì module Superchip có công suất khoảng 2700W, ta có thể kỳ vọng giải pháp lớn hơn GB200 NVL4 sẽ tiêu thụ gần 6KW điện. Có thể dễ dàng nhận thấy nỗ lực của NVIDIA trong việc tăng tốc phân khúc tính toán AI.

NVIDIA cũng đang đẩy nhanh lộ trình AI của mình với chu kỳ một năm, với một số cơ sở hạ tầng mới dự kiến ra mắt trong những năm tới, như Blackwell Ultra và Rubin.

./.

M.P theo Wccftech

Thảo luận bài viết

Thảo luận
NVIDIA SC24

NVIDIA công bố GB200 NVL4