NVIDIA B100 vs NVIDIA RTX PRO 6000 Blackwell Server

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

96 ГБ ×2 (192 ГБ) 96 ГБ

Тип памяти

HBM3e GDDR7

Пропускная способность памяти

4.10 TB/s ×2 (8.2 TB/s)

1.79 TB/s

Ширина шины памяти

4 096 бит ×2 (8192 бит) 512 бит

ML-производительность

FP16 (half)

+97% 248,3 TFLOPS

126,0 TFLOPS

BF16

Нет Нет

TF32

Нет Нет

Вычислительная мощность

FP32 (float)

62,08 TFLOPS

+103% 126,0 TFLOPS

FP64 (double)

+1 477% 31,04 TFLOPS

1,968 TFLOPS

CUDA ядра

16 896 ×2 (33792)

+42% 24 064

RT ядра

Нет

188

Архитектура и совместимость

Архитектура GPU

Blackwell Blackwell 2.0

SM (Streaming Multiprocessor)

132

+42% 188

PCIe версия

PCIe 5.0 x16 PCIe 5.0 x16

Программная поддержка ML

CUDA версия

10.1

12.0

Частоты и производительность

Base Clock

+5% 1 665

1 590

Boost Clock

1 837

+42% 2 617

Memory Clock

+14% 2 000

1 750

Энергопотребление

TDP/TGP

1000 W

-40% 600 W

Рекомендуемый БП

1400 W

-29% 1000 W

Разъём питания

Нет 1x 16-pin

Рендеринг

Текстурные блоки (TMU)

528 ×2 (1056)

+42% 752

ROP

Нет

188

L2 Cache

50 MB

128 MB

Бенчмарки

MLPerf, llama2-70b-99.9 (fp4)

— 3 250 tokens/s

MLPerf, llama3.1-8b (fp4)

— 5 758 tokens/s

Geekbench AI, FP16

— 53 322 points

Geekbench AI, INT8

— 28 264 points

Geekbench AI, FP32

— 37 299 points

MLPerf, mixtral-8x7b (fp8)

— 3 767 tokens/s

Дополнительно

Слоты

SXM Module

Dual-slot

Дата выпуска

17 ноября 2024 г. 18 марта 2025 г.

Дисплейные порты

No outputs

4x DisplayPort 2.1b

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

NVIDIA B100 vs NVIDIA RTX PRO 6000 Blackwell Server

Сравнение NVIDIA B100 с 96 Гб HBM3e и 16 896 ядрами против NVIDIA RTX PRO 6000 Blackwell Server с 96 Гб GDDR7 и 24 064 ядрами.