AMD Radeon Instinct MI355X vs NVIDIA GeForce RTX 4090

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

+1 100% 288 ГБ

24 ГБ

Тип памяти

HBM3e GDDR6X

Пропускная способность памяти

+711% 8.19 TB/s

1.01 TB/s

Ширина шины памяти

8 192 бит 384 бит

ML-производительность

FP16 (half)

+662% 629,1 TFLOPS

82,58 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

78,64 TFLOPS

+5% 82,58 TFLOPS

FP64 (double)

78,64 TFLOPS

Нет

CUDA ядра

16 384 16 384

RT ядра

Нет

128

Архитектура и совместимость

Архитектура GPU

CDNA 4.0 Ada Lovelace

SM (Streaming Multiprocessor)

Нет

128

PCIe версия

PCIe 5.0 x16 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

Нет 8.9

Частоты и производительность

Base Clock

1 000

+124% 2 235

Boost Clock

2 400

+5% 2 520

Memory Clock

+52% 2 000

1 313

Энергопотребление

TDP/TGP

1400 W

-68% 450 W

Рекомендуемый БП

1800 W

-53% 850 W

Разъём питания

None 1x 16-pin

Рендеринг

Текстурные блоки (TMU)

+100% 1 024

512

ROP

Нет

128

L2 Cache

16 MB

+350% 72 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (mxfp4)

10 129 tokens/s —

MLPerf, llama3.1-405b (mxfp4)

252.4 tokens/s —

MLPerf, llama3.1-8b-edge (fp32)

— 44.7 tokens/s

llama.cpp, llama 7B Q4_0

— 154.7 tokens/s

llama.cpp, llama-2-7b-Q4_0

— 189.0 tokens/s

Geekbench AI, FP16

— 53 496 points

Geekbench AI, INT8

— 29 155 points

Geekbench AI, FP32

— 39 033 points

Дополнительно

Слоты

OAM Module Triple-slot

Дата выпуска

15 июля 2025 г. 20 сентября 2022 г.

Дисплейные порты

No outputs

1x HDMI 2.1
3x DisplayPort 1.4a

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

AMD Radeon Instinct MI355X vs NVIDIA GeForce RTX 4090

Сравнение AMD Radeon Instinct MI355X с 288 Гб HBM3e и 16 384 ядрами против NVIDIA GeForce RTX 4090 с 24 Гб GDDR6X и 16 384 ядрами.