Công thức AI bí mật của Apple dường như bỏ qua GPU của NVIDIA
Apple có vẻ đã chọn dựa vào các chip của Google thay vì các chip của NVIDIA. Sự thành công của NVIDIA trên thị trường được dựa trên nhu cầu mạnh mẽ đối với các GPU của họ.
Tuy nhiên, Apple cho biết mô hình Apple Foundation Model (AFM) với 2,73 tỷ tham số của họ dựa vào các cụm xử lý tensor unit (TPU) v4 và v5p thường được cung cấp bởi Google thuộc tập đoàn Alphabet Inc.
Tài liệu nghiên cứu của Apple được công bố đề cập đến cơ sở hạ tầng huấn luyện và các chi tiết khác cho các mô hình AI sẽ cung cấp các tính năng được công bố tại WWDC vào đầu năm nay. Apple đã công bố cả xử lý AI trên thiết bị và xử lý AI trên đám mây, và ở trung tâm của các tính năng AI này là Mô hình Apple Foundation, được gọi là AFM.
Đối với AFM trên máy chủ, Apple cho biết họ huấn luyện một mô hình AI 6,3 triệu tỷ token "từ đầu" trên "8192 chip TPUv4." Các chip TPUv4 của Google có sẵn trong các cụm gồm 4096 chip mỗi cụm.
Apple cũng cho biết các mô hình AFM (cả trên thiết bị và đám mây) được huấn luyện trên các chip TPUv4 và các cụm Cloud TPU v5p. v5p là một phần của 'Hypercomputer' Cloud.
Mỗi cụm v5p được cấu thành từ 8.960 chip, và theo Google, nó cung cấp gấp đôi số phép toán dấu chấm động mỗi giây (FLOPS) và gấp ba lần bộ nhớ so với TPU v4, giúp huấn luyện các mô hình nhanh gấp ba lần.
Đối với mô hình AI trên thiết bị cho các tính năng như viết và lựa chọn hình ảnh, Apple sử dụng một mô hình 6,4 tỷ tham số được "huấn luyện từ đầu bằng công thức giống như AFM-server."
Apple cũng chọn dựa vào các chip TPU v4 cũ hơn cho mô hình AFM server. Như đã nêu trên, công ty đã sử dụng 8092 chip TPU v4, nhưng đối với mô hình AFM trên thiết bị, công ty đã chọn dựa vào các chip mới hơn. Mô hình này, theo Apple, đã được huấn luyện trên 2048 chip TPU v5p.
./.
M.P theo Wccftech
Công thức AI bí mật của Apple dường như bỏ qua GPU của NVIDIA