NVIDIA Blackwell nhanh hơn tới 2.2 jần so với Hopper

14 tháng 11, 2024

NVIDIA vừa chia sẻ các bài kiểm tra benchmark đầu tiên của GPU Blackwell trong các tác vụ đào tạo AI của MLPerf v4.1, với mức tăng hiệu suất ấn tượng 2.2 lần so với Hopper.

Vào tháng 8 vừa qua, Blackwell của NVIDIA đã ra mắt trong các bài kiểm tra MLPerf v4.1 AI Inference, cho thấy sự cải thiện hiệu suất mạnh mẽ so với các chip Hopper thế hệ trước và đối thủ cạnh tranh. Hôm nay, NVIDIA tiếp tục chia sẻ các benchmark đầu tiên của Blackwell trong các tác vụ Đào Tạo AI của MLPerf v4.1, mang đến những kết quả đáng kinh ngạc.

NVIDIA cho biết nhu cầu tính toán trong lĩnh vực AI đang tăng trưởng theo cấp số nhân với sự ra mắt của các mô hình mới. Điều này yêu cầu khả năng huấn luyện và suy luận được tăng tốc. Các tác vụ này rất chính xác khi đánh giá thời gian huấn luyện (trong phút) và có sự hỗ trợ của hơn 125 thành viên từ các tổ chức MLCommons để đảm bảo các bài kiểm tra phù hợp với thị trường.

Các GPU H100 hiện đã nhanh hơn 1.3 lần trong hiệu suất huấn luyện LLM mỗi GPU so với lần gửi bài kiểm tra đầu tiên, và mang đến hiệu suất cao nhất trong đào tạo AI so với tất cả các chip hiện có trên các bài kiểm tra. Với Hopper, NVIDIA cũng đã thực hiện bài kiểm tra quy mô lớn nhất trong MLPerf sử dụng 11,616 GPU Hopper H100, kết nối bằng NVLink, NVSwitch, ConnectX-7 SuperNIC, và Quantum-X400 IB Switches.

Kể từ khi ra mắt, các GPU Hopper của NVIDIA đã được tối ưu hóa phần mềm, giúp tăng hiệu suất gấp 6 lần so với HGX A100 và tăng 70% so với bài kiểm tra HGX H100 trong GPT-3 (175B Training) sử dụng 512 GPU.

Trung tâm của các trung tâm dữ liệu AI thế hệ tiếp theo, NVIDIA đã công bố bảy kỷ lục mỗi bộ tăng tốc với siêu máy tính Nyx AI, được xây dựng từ các hệ thống DGX B200.

Siêu máy tính này cho thấy Blackwell nhanh hơn 2.2 lần so với Hopper H100 trong hiệu suất Llama 2 70B (Fine-Tuning), nhanh hơn gấp đôi trong GPT-3 175B (Pre-Training), và cũng vượt qua toàn bộ bộ tác vụ trong bộ kiểm tra MLPerf Training 4.1.

NVIDIA cũng tiết lộ một chút về lộ trình AI trong năm tiếp theo, không chỉ dừng lại ở việc phát triển các con chip mới mà còn xác thực chúng ở quy mô trung tâm dữ liệu và triển khai nhanh chóng ở quy mô siêu cụm.

./.

M.P theo Wccftech