NVIDIA P102-100 vs AMD Radeon Instinct MI250

Мы сравнили две дискретные видеокарты: NVIDIA P102-100 с 5 Гб видеопамяти GDDR5X и 3 200 CUDA ядра против GeForce AMD Radeon Instinct MI250 128 Гб видеопамяти HBM2e и 13 312 CUDA ядра.

Загружаемся...

Оценка производительности

AMD Radeon Instinct MI250 опережает NVIDIA P102-100 на 640,76% в суммарном рейтинге производительности GPU ARK

A100 A100
H200 H200
MI325X MI325X

NVIDIA P102-100

6,9

NVIDIA P102-100

6,9

RX 7900 XTX RX 7900 XTX
MI250 MI250
Instinct MI300X Instinct MI300X

AMD Radeon Instinct MI250

50,9

AMD Radeon Instinct MI250

50,9

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Физические характеристики Дополнительно

Память

Объем памяти

5 ГБ
🔥 128 ГБ

Тип памяти

GDDR5X HBM2e

Пропускная способность памяти

440.3 GB/s
🔥 3.28 TB/s

Ширина шины памяти

320 бит 8 192 бит

ML-производительность

FP16 (half)

168,3 TFLOPS
🔥 362,1 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

10,77 TFLOPS
🔥 45,26 TFLOPS

FP64 (double)

0,3366 TFLOPS
🔥 45,26 TFLOPS

CUDA ядра

3 200
🔥 13 312

RT ядра

Нет Нет

Архитектура и совместимость

Архитектура GPU

Pascal CDNA 2.0

SM (Streaming Multiprocessor)

25 Нет

PCIe версия

PCIe 1.0 x4 PCIe 4.0 x16

Программная поддержка ML

CUDA версия

6.1 Нет

Частоты и производительность

Base Clock

1 582
🔥 1 000

Boost Clock

1 683
🔥 1 700

Memory Clock

1 376
🔥 1 600

Энергопотребление

TDP/TGP

250 W 500 W

Рекомендуемый БП

600 W 900 W

Разъём питания

2x 8-pin 2x 8-pin

Рендеринг

Текстурные блоки (TMU)

200
🔥 832

ROP

Нет Нет

L2 Cache

2.5 MB
🔥 16 MB

Физические характеристики

Слоты

Dual-slot Dual-slot

Дополнительно

Дата выпуска

12 февраля 2018 г. 8 ноября 2021 г.

Дисплейные порты

No outputs
No outputs

Арендовать дешевле, чем покупать

Tesla A100 (80GB)

NVIDIA

Для серьёзных продакшенов и многомодальных моделей

от 100 руб/час

RTX 3090 (24GB)

NVIDIA

Для домашних экспериментов и pet-проектов

от 29 руб/час

Quadro RTX A5000 (24GB)

NVIDIA

Оптимально для разработки и отладки

от 24 руб/час

Tesla A10 (24GB)

NVIDIA

Надёжная база для инференс-фермы

от 17 руб/час