Общая информация |
||
Название | NVIDIA Tesla P100 PCIe 16 GB | NVIDIA Tesla T4 |
Процессор | NVIDIA GP100 (архитектура Pascal) | NVIDIA TU104 (архитектура Turing) |
Дата выпуска карты | 20 июня 2016 г. | 13 сентября 2018 г. |
Процессорное производство | TSMC | TSMC |
Поддержка API |
||
CUDA Compute Capability | 6.0 (compute_60, sm_60) | 7.5 (compute_75, sm_75) |
Архитектура помечена устаревшей | CUDA Toolkit 12 | - |
DirectX | 12 (12_1) | 12 Ultimate (12_2) |
OpenGL | 4.6 | 4.6 |
OpenCL | 3.0 | 3.0 |
Vulkan | 1.3 | 1.3 |
Shader Model | 6.0 | 6.8 |
Характеристики |
||
Количество графических процессоров | 1 | 1 |
Количество потоковых процессоров (ядер) | 3 584 ядра CUDA | 2 560 ядер CUDA |
Текстурные блоки (TMU)
Texture Mapping Units |
224 | 160 |
Блоки растеризации (ROP)
Render Output Units |
96 | 64 |
Техпроцесс | 16 nm | 12 nm |
Количество транзисторов | 15,300 million | 13,600 million |
Площадь кристалла | 610 mm² | 545 mm² |
Шейдерные блоки | 3 584 | 2 560 |
Количество SM
Streaming Multiprocessors |
56 | 40 |
Тензорные ядра | - | 320 |
RT ядра
Raytracing Cores |
- | 40 |
L1 кэш | 24 KB (per SM) | 64 KB (per SM) |
L2 кэш | 4 MB | 4 MB |
Скорость заполнения пикселей
Pixel fillrate |
127.6 GPixel/s | 101.8 GPixel/s |
Скорость текстурирования
Texture fillrate |
297.7 GTexel/s | 254.4 GTexel/s |
Видеопамять |
||
ОЗУ | 16 Гб | 16 Гб |
Тип ОЗУ | HBM2 | GDDR6 |
Ширина шины | 4 096 бит | 256 бит |
Скорость передачи данных | 732.2 GB/s | 320.0 GB/s |
Видеовыходы и питание |
||
Выходы | ||
Ширина слота | Dual-slot | Single-slot |
Энергопотребление (TDP)
Thermal Design Power |
250 W | 70 W |
Рекомендуемый блок питания | 600 W | 250 W |
Питание | 1x 8-pin | None |
Теоретическая производительностьОценка производительности по операциям с числами с плавающей запятой. |
||
FP16, числа размером в 16 бит
IEEE half-precision 16-bit float |
19,05 TFLOPS | 65,13 TFLOPS |
FP32, числа размером в 32 бита
IEEE single-precision 32-bit float |
9,53 TFLOPS | 8,14 TFLOPS |
FP64, числа размером в 64 бита
IEEE double-precision 64-bit float |
4,76 TFLOPS | 254 400 TFLOPS |