NVIDIA A100 PCIe 80 GB vs NVIDIA H100 SXM5 94 GB

Сравнение NVIDIA A100 PCIe 80 GB с 80 Гб HBM2e и 6 912 ядрами против NVIDIA H100 SXM5 94 GB с 94 Гб HBM3 и 16 896 ядрами.

Загружаемся...

Оценка производительности

NVIDIA H100 SXM5 94 GB опережает NVIDIA A100 PCIe 80 GB на 125,32% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA A100 PCIe 80 GB

25,6

NVIDIA A100 PCIe 80 GB

25,6
RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA H100 SXM5 94 GB

57,8

NVIDIA H100 SXM5 94 GB

57,8

Экспертное сравнение

NVIDIA H100 SXM5 94 GB значительно превосходит NVIDIA A100 PCIe 80 GB по числу ядер (16896 против 6912), объему памяти (94 ГБ HBM3 против 80 ГБ HBM2e) и пропускной способности (3.36 ТБ/с против 1.94 ТБ/с). H100 также имеет более высокую производительность в FP32 (66.91 ТФЛОПС против 19.49 ТФЛОПС). Однако H100 потребляет больше энергии (700 Вт против 300 Вт) и имеет более высокий индекс производительности (57.8 против 25.6). Лучше подходит для вычислительных задач, требующих больших объемов памяти и высокой производительности.

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

80 ГБ
🔥 +18% 94 ГБ

Тип памяти

HBM2e HBM3

Пропускная способность памяти

1.94 TB/s
🔥 +73% 3.36 TB/s

Ширина шины памяти

5 120 бит 5 120 бит

ML-производительность

FP16 (half)

77,97 TFLOPS
🔥 +243% 267,6 TFLOPS

BF16

🔥 311,84 TFLOPS
Нет

TF32

🔥 155,92
Нет

Вычислительная мощность

FP32 (float)

19,49 TFLOPS
🔥 +243% 66,91 TFLOPS

FP64 (double)

9,746 TFLOPS
🔥 +243% 33,45 TFLOPS

CUDA ядра

6 912
🔥 +144% 16 896

RT ядра

Нет Нет

Архитектура и совместимость

Архитектура GPU

Ampere Hopper

SM (Streaming Multiprocessor)

108
🔥 +22% 132

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

8.0
🔥 9.0

Частоты и производительность

Base Clock

1 065
🔥 +27% 1 350

Boost Clock

1 410
🔥 +40% 1 980

Memory Clock

🔥 +15% 1 512
1 313

Энергопотребление

TDP/TGP

🔥 -57% 300 W
700 W

Рекомендуемый БП

🔥 -36% 700 W
1100 W

Разъём питания

8-pin EPS 8-pin EPS

Рендеринг

Текстурные блоки (TMU)

432
🔥 +22% 528

ROP

Нет Нет

L2 Cache

🔥 +60% 80 MB
50 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (fp8)

2 106 tokens/s

MLPerf, mixtral-8x7b (fp8)

4 714 tokens/s

Дополнительно

Слоты

Dual-slot
🔥 SXM Module

Дата выпуска

28 июня 2021 г. 21 марта 2023 г.

Дисплейные порты

No outputs
No outputs

Арендовать дешевле, чем покупать