NVIDIA RTX A40-24Q vs AMD Radeon Instinct MI325X

Мы сравнили две дискретные видеокарты: NVIDIA RTX A40-24Q с 24 Гб видеопамяти GDDR6 и 10 752 CUDA ядра против GeForce AMD Radeon Instinct MI325X 288 Гб видеопамяти HBM3e и 19 456 CUDA ядра.

Загружаемся...

Оценка производительности

AMD Radeon Instinct MI325X опережает NVIDIA RTX A40-24Q на 419,21% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA RTX A40-24Q

19,3

NVIDIA RTX A40-24Q

19,3

RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

AMD Radeon Instinct MI325X

100,0

AMD Radeon Instinct MI325X

100,0

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Физические характеристики Дополнительно

Память

Объем памяти

24 ГБ
🔥 288 ГБ

Тип памяти

GDDR6 HBM3e

Пропускная способность памяти

695.8 GB/s
🔥 10.3 TB/s

Ширина шины памяти

384 бит 8 192 бит

ML-производительность

FP16 (half)

37,42 TFLOPS
🔥 653,7 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

37,42 TFLOPS
🔥 81,72 TFLOPS

FP64 (double)

0,5846 TFLOPS
🔥 81,72 TFLOPS

CUDA ядра

10 752
🔥 19 456

RT ядра

🔥 84
Нет

Архитектура и совместимость

Архитектура GPU

Ampere CDNA 3.0

SM (Streaming Multiprocessor)

🔥 84
Нет

PCIe версия

PCIe 4.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

🔥 8.6
Нет

Частоты и производительность

Base Clock

🔥 1 305
1 000

Boost Clock

1 740
🔥 2 100

Memory Clock

1 812
🔥 2 525

Энергопотребление

TDP/TGP

300 W 1000 W

Рекомендуемый БП

700 W 1400 W

Разъём питания

8-pin EPS None

Рендеринг

Текстурные блоки (TMU)

336
🔥 1 216

ROP

🔥 84
Нет

L2 Cache

🔥 6 MB
16 MB

Физические характеристики

Слоты

Dual-slot OAM Module

Дополнительно

Дата выпуска

5 октября 2020 г. 15 октября 2024 г.

Дисплейные порты

3x DisplayPort 1.4a
No outputs

Арендовать дешевле, чем покупать

Tesla A100 (80GB)

NVIDIA

Для серьёзных продакшенов и многомодальных моделей

от 100 руб/час

RTX 3090 (24GB)

NVIDIA

Для домашних экспериментов и pet-проектов

от 29 руб/час

Quadro RTX A5000 (24GB)

NVIDIA

Оптимально для разработки и отладки

от 24 руб/час

Tesla A10 (24GB)

NVIDIA

Надёжная база для инференс-фермы

от 17 руб/час