NVIDIA L40-2Q vs NVIDIA A100 PCIe 80 GB

Мы сравнили две дискретные видеокарты: NVIDIA L40-2Q с 2 Гб видеопамяти GDDR6 и 18 176 CUDA ядра против GeForce NVIDIA A100 PCIe 80 GB 80 Гб видеопамяти HBM2e и 6 912 CUDA ядра.

Загружаемся...

Оценка производительности

NVIDIA A100 PCIe 80 GB опережает NVIDIA L40-2Q на 13,81% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA L40-2Q

22,5

NVIDIA L40-2Q

22,5

RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

NVIDIA A100 PCIe 80 GB

25,6

NVIDIA A100 PCIe 80 GB

25,6

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Физические характеристики Дополнительно

Память

Объем памяти

2 ГБ
🔥 80 ГБ

Тип памяти

GDDR6 HBM2e

Пропускная способность памяти

864.0 GB/s
🔥 1.94 TB/s

Ширина шины памяти

384 бит 5 120 бит

ML-производительность

FP16 (half)

🔥 90,52 TFLOPS
77,97 TFLOPS

BF16

Нет
🔥 311,84 TFLOPS

TF32

Нет
🔥 155,92

Вычислительная мощность

FP32 (float)

🔥 90,52 TFLOPS
19,49 TFLOPS

FP64 (double)

Нет
🔥 9,746 TFLOPS

CUDA ядра

🔥 18 176
6 912

RT ядра

🔥 142
Нет

Архитектура и совместимость

Архитектура GPU

Ada Lovelace Ampere

SM (Streaming Multiprocessor)

🔥 142
108

PCIe версия

PCIe 4.0 x16 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

🔥 8.9
8.0

Частоты и производительность

Base Clock

735
🔥 1 065

Boost Clock

🔥 2 490
1 410

Memory Clock

🔥 2 250
1 512

Энергопотребление

TDP/TGP

300 W 300 W

Рекомендуемый БП

700 W 700 W

Разъём питания

1x 16-pin 8-pin EPS

Рендеринг

Текстурные блоки (TMU)

🔥 568
432

ROP

🔥 142
Нет

L2 Cache

🔥 96 MB
80 MB

Физические характеристики

Слоты

Dual-slot Dual-slot

Дополнительно

Дата выпуска

13 октября 2022 г. 28 июня 2021 г.

Дисплейные порты

4x DisplayPort 1.4a
No outputs

Арендовать дешевле, чем покупать

Tesla A100 (80GB)

NVIDIA

Для серьёзных продакшенов и многомодальных моделей

от 100 руб/час

RTX 3090 (24GB)

NVIDIA

Для домашних экспериментов и pet-проектов

от 29 руб/час

Quadro RTX A5000 (24GB)

NVIDIA

Оптимально для разработки и отладки

от 24 руб/час

Tesla A10 (24GB)

NVIDIA

Надёжная база для инференс-фермы

от 17 руб/час