Загружаемся...

Сравнение NVIDIA Tesla P100 PCIe 16 GB и NVIDIA Tesla T4

Общая информация

Название NVIDIA Tesla P100 PCIe 16 GB NVIDIA Tesla T4
Процессор NVIDIA GP100 (архитектура Pascal) NVIDIA TU104 (архитектура Turing)
Дата выпуска карты 20 июня 2016 г. 13 сентября 2018 г.
Процессорное производство TSMC TSMC

Поддержка API

CUDA Compute Capability 6.0 (compute_60, sm_60) 7.5 (compute_75, sm_75)
Архитектура помечена устаревшей CUDA Toolkit 12 -
DirectX 12 (12_1) 12 Ultimate (12_2)
OpenGL 4.6 4.6
OpenCL 3.0 3.0
Vulkan 1.3 1.3
Shader Model 6.0 6.8

Характеристики

Количество графических процессоров 1 1
Количество потоковых процессоров (ядер) 3 584 ядра CUDA 2 560 ядер CUDA
Текстурные блоки (TMU)

Texture Mapping Units

224 160
Блоки растеризации (ROP)

Render Output Units

96 64
Техпроцесс 16 nm 12 nm
Количество транзисторов 15,300 million 13,600 million
Площадь кристалла 610 mm² 545 mm²
Шейдерные блоки 3 584 2 560
Количество SM

Streaming Multiprocessors

56 40
Тензорные ядра - 320
RT ядра

Raytracing Cores

- 40
L1 кэш 24 KB (per SM) 64 KB (per SM)
L2 кэш 4 MB 4 MB
Скорость заполнения пикселей

Pixel fillrate

127.6 GPixel/s 101.8 GPixel/s
Скорость текстурирования

Texture fillrate

297.7 GTexel/s 254.4 GTexel/s

Видеопамять

ОЗУ 16 Гб 16 Гб
Тип ОЗУ HBM2 GDDR6
Ширина шины 4 096 бит 256 бит
Скорость передачи данных 732.2 GB/s 320.0 GB/s

Видеовыходы и питание

Выходы
No outputs
No outputs
Ширина слота Dual-slot Single-slot
Энергопотребление (TDP)

Thermal Design Power

250 W 70 W
Рекомендуемый блок питания 600 W 250 W
Питание 1x 8-pin None

Теоретическая производительность

Оценка производительности по операциям с числами с плавающей запятой.

FP16, числа размером в 16 бит

IEEE half-precision 16-bit float

19,05 TFLOPS 65,13 TFLOPS
FP32, числа размером в 32 бита

IEEE single-precision 32-bit float

9,53 TFLOPS 8,14 TFLOPS
FP64, числа размером в 64 бита

IEEE double-precision 64-bit float

4,76 TFLOPS 254 400 TFLOPS