NVIDIA L40S vs AMD Radeon Instinct MI250

Мы сравнили две дискретные видеокарты: NVIDIA L40S с 48 Гб видеопамяти GDDR6 и 18 176 CUDA ядра против GeForce AMD Radeon Instinct MI250 128 Гб видеопамяти HBM2e и 13 312 CUDA ядра.

Загружаемся...

Оценка производительности

AMD Radeon Instinct MI250 опережает NVIDIA L40S на 39,39% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA L40S

36,5

NVIDIA L40S

36,5

RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

AMD Radeon Instinct MI250

50,9

AMD Radeon Instinct MI250

50,9

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Физические характеристики Дополнительно

Память

Объем памяти

48 ГБ
🔥 128 ГБ

Тип памяти

GDDR6 HBM2e

Пропускная способность памяти

864.0 GB/s
🔥 3.28 TB/s

Ширина шины памяти

384 бит 8 192 бит

ML-производительность

FP16 (half)

91,61 TFLOPS
🔥 362,1 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

🔥 91,61 TFLOPS
45,26 TFLOPS

FP64 (double)

Нет
🔥 45,26 TFLOPS

CUDA ядра

🔥 18 176
13 312

RT ядра

🔥 142
Нет

Архитектура и совместимость

Архитектура GPU

Ada Lovelace CDNA 2.0

SM (Streaming Multiprocessor)

🔥 142
Нет

PCIe версия

PCIe 4.0 x16 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

🔥 8.9
Нет

Частоты и производительность

Base Clock

🔥 1 110
1 000

Boost Clock

🔥 2 520
1 700

Memory Clock

🔥 2 250
1 600

Энергопотребление

TDP/TGP

300 W 500 W

Рекомендуемый БП

700 W 900 W

Разъём питания

1x 16-pin 2x 8-pin

Рендеринг

Текстурные блоки (TMU)

568
🔥 832

ROP

🔥 142
Нет

L2 Cache

🔥 48 MB
16 MB

Физические характеристики

Слоты

Dual-slot Dual-slot

Дополнительно

Дата выпуска

13 октября 2022 г. 8 ноября 2021 г.

Дисплейные порты

1x HDMI 2.1
3x DisplayPort 1.4a
No outputs

Арендовать дешевле, чем покупать

Tesla A100 (80GB)

NVIDIA

Для серьёзных продакшенов и многомодальных моделей

от 100 руб/час

RTX 3090 (24GB)

NVIDIA

Для домашних экспериментов и pet-проектов

от 29 руб/час

Quadro RTX A5000 (24GB)

NVIDIA

Оптимально для разработки и отладки

от 24 руб/час

Tesla A10 (24GB)

NVIDIA

Надёжная база для инференс-фермы

от 17 руб/час