NVIDIA A800 SXM4 80 GB vs NVIDIA Tesla T4

Содержание:

Память ML-производительность Вычислительная мощность Архитектура и совместимость Программная поддержка ML Частоты и производительность Энергопотребление Рендеринг Бенчмарки Дополнительно

Память

Объем памяти

+400% 80 ГБ

16 ГБ

Тип памяти

HBM2e GDDR6

Пропускная способность памяти

2.04 TB/s

320.0 GB/s

Ширина шины памяти

5 120 бит 256 бит

ML-производительность

FP16 (half)

+20% 77,97 TFLOPS

65,13 TFLOPS

BF16

311,84 TFLOPS

Нет

TF32

155,92

Нет

Вычислительная мощность

FP32 (float)

+139% 19,49 TFLOPS

8,141 TFLOPS

FP64 (double)

+3 731% 9,746 TFLOPS

0,2544 TFLOPS

CUDA ядра

+170% 6 912

2 560

RT ядра

Нет 40

Архитектура и совместимость

Архитектура GPU

Ampere Turing

SM (Streaming Multiprocessor)

+170% 108

PCIe версия

PCIe 4.0 x16 PCIe 3.0 x16

Программная поддержка ML

CUDA версия

8.0

7.5

Частоты и производительность

Base Clock

+97% 1 155

585

Boost Clock

1 410

1 590

Memory Clock

+27% 1 593

1 250

Энергопотребление

TDP/TGP

400 W

-82% 70 W

Рекомендуемый БП

800 W

-69% 250 W

Разъём питания

None None

Рендеринг

Текстурные блоки (TMU)

+170% 432

160

ROP

Нет 40

L2 Cache

+900% 40 MB

4 MB

Бенчмарки

LLM Perf, Llama-2-7b-hf (bnb)

— 8.55 tokens/s

LLM Perf, Llama-2-7b-hf (gptq)

— 33.6 tokens/s

LLM Perf, Llama-2-7b-hf (unquantized)

— 16.7 tokens/s

LLM Perf, Llama-3.1-8B-Instruct (awq)

— 22.0 tokens/s

LLM Perf, Llama-3.1-8B-Instruct (bnb)

— 7.68 tokens/s

LLM Perf, Llama-3.1-8B-Instruct (gptq)

— 28.8 tokens/s

LLM Perf, Meta-Llama-3-8B (awq)

— 22.4 tokens/s

LLM Perf, Meta-Llama-3-8B (bnb)

— 7.96 tokens/s

LLM Perf, Meta-Llama-3-8B (gptq)

— 28.8 tokens/s

LLM Perf, Meta-Llama-3-8B-Instruct (awq)

— 22.3 tokens/s

LLM Perf, Meta-Llama-3-8B-Instruct (bnb)

— 7.76 tokens/s

LLM Perf, Meta-Llama-3-8B-Instruct (gptq)

— 29.1 tokens/s

llama.cpp, llama-2-7b-Q4_0

— 46.4 tokens/s

LLM Perf, Mistral-7B-Instruct-v0.2 (gptq)

— 26.4 tokens/s

LLM Perf, Mistral-7B-v0.1 (bnb)

— 8.01 tokens/s

LLM Perf, Mistral-7B-v0.1 (gptq)

— 25.7 tokens/s

LLM Perf, Mistral-7B-v0.1 (unquantized)

— 15.5 tokens/s

Дополнительно

Слоты

SXM Module

Single-slot

Дата выпуска

11 августа 2022 г. 13 сентября 2018 г.

Дисплейные порты

No outputs

Арендовать дешевле, чем покупать

H200 (141GB)

NVIDIA

Первая GPU с памятью HBM3e (141 ГБ) на архитектуре Hopper. Создана для генеративного ИИ и HPC задач. До 2X быстрее для LLM inference по сравнению с H100. Поддерживает FP8, FP16, TF32 и другие форматы точности.

от 375,0 руб/час

Арендовать

Подробнее

H100 80Gb PCIe (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

H100 80Gb SXM (80GB)

NVIDIA

Флагманская GPU на архитектуре Hopper с 80 ГБ памяти HBM3 в форм-факторе SXM. Создана для обучения и инференса больших языковых моделей, HPC задач. Поддерживает FP64, FP32, TF32, FP16, BF16, FP8 и INT8 вычисления с Tensor Cores 4-го поколения.

от 299,11 руб/час

Арендовать

Подробнее

Tesla A100 (80GB)

NVIDIA

Видеокарта для исследований на пике современных алгоритмов LLM, CV и пр. Создана специально для ML вычислений.

от 200,89 руб/час

Арендовать

Подробнее

RTX 4090 (48GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS 3.5, кодеками H.264/H.265/AV1 и увеличенной видеопамятью 48 ГБ GDDR6X.

от 81,85 руб/час

Арендовать

Подробнее

RTX 3090 (24GB)

NVIDIA

Десктопная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 34,23 руб/час

Арендовать

Подробнее

RTX A5000 (24GB)

NVIDIA

Создана для обработки видеопотоков, готова к виртуализации. Профессиональная карта с аппаратной поддержкой Ray Tracing, DLSS, H.264, H.265

от 31,25 руб/час

Арендовать

Подробнее

Tesla A10 (24GB)

NVIDIA

Видеокарта идеальная для инференса ИИ, обработки видео, CAD и BIM проектирования, CAE исследований, поддерживающих вычисления на GPU.

от 26,79 руб/час

Арендовать

Подробнее

NVIDIA A800 SXM4 80 GB vs NVIDIA Tesla T4

Сравнение NVIDIA A800 SXM4 80 GB с 80 Гб HBM2e и 6 912 ядрами против NVIDIA Tesla T4 с 16 Гб GDDR6 и 2 560 ядрами.