Загружаемся...

Сравнение NVIDIA A10 PCIe и NVIDIA GeForce RTX 3090 Ti

Общая информация

Название NVIDIA A10 PCIe NVIDIA GeForce RTX 3090 Ti
Процессор NVIDIA GA102 (архитектура Ampere) NVIDIA GA102 (архитектура Ampere)
Дата выпуска карты 12 апреля 2021 г. 27 января 2022 г.
Процессорное производство Samsung Samsung

Поддержка API

CUDA Compute Capability 8.6 (compute_86, sm_86) 8.6 (compute_86, sm_86)
DirectX 12 Ultimate (12_2) 12 Ultimate (12_2)
OpenGL 4.6 4.6
OpenCL 3.0 3.0
Vulkan 1.3 1.3
Shader Model 6.7 6.7

Характеристики

Количество графических процессоров 1 1
Количество потоковых процессоров (ядер) 9 216 ядер CUDA 10 752 ядра CUDA
Текстурные блоки (TMU)

Texture Mapping Units

288 336
Блоки растеризации (ROP)

Render Output Units

96 112
Техпроцесс 8 nm 8 nm
Количество транзисторов 28,300 million 28,300 million
Площадь кристалла 628 mm² 628 mm²
Шейдерные блоки 9 216 10 752
Количество SM

Streaming Multiprocessors

72 84
Тензорные ядра 288 336
RT ядра

Raytracing Cores

72 84
L1 кэш 128 KB (per SM) 128 KB (per SM)
L2 кэш 6 MB 6 MB
Скорость заполнения пикселей

Pixel fillrate

162.7 GPixel/s 208.3 GPixel/s
Скорость текстурирования

Texture fillrate

488.2 GTexel/s 625.0 GTexel/s

Видеопамять

ОЗУ 24 Гб 24 Гб
Тип ОЗУ GDDR6 GDDR6X
Ширина шины 384 бит 384 бит
Скорость передачи данных 600.2 GB/s 1,008 GB/s

Видеовыходы и питание

Выходы
No outputs
1x HDMI 2.1
3x DisplayPort 1.4a
Ширина слота Single-slot Triple-slot
Энергопотребление (TDP)

Thermal Design Power

150 W 450 W
Рекомендуемый блок питания 450 W 850 W
Питание 1x 8-pin 1x 16-pin

Теоретическая производительность

Оценка производительности по операциям с числами с плавающей запятой.

FP16, числа размером в 16 бит

IEEE half-precision 16-bit float

31,24 TFLOPS 40 TFLOPS
FP32, числа размером в 32 бита

IEEE single-precision 32-bit float

31,24 TFLOPS 40 TFLOPS
FP64, числа размером в 64 бита

IEEE double-precision 64-bit float

976 300 TFLOPS 625 000 TFLOPS

* с опцией разреженности (sparcity).