Сегодня мы поговорим об уникальной видеокарте. Это модель NVIDIA A16 с четырьмя графическими процессорами на борту, предназначенная для дата-центров. Карты такого типа обычно используются для создания сред VDI. Многие пользователи никогда не видели таких карт, и сегодня мы покажем ее вам со всех сторон.
NVIDIA A16 – это карта двойной ширины (толщины). Спереди она выглядит непримечательно: просто плоская поверхность для лучшего обтекания карты воздушным потоком.
На рисунке ниже показано расположение четырех графических процессоров (GPU), чтобы было понятно, что находится под этим массивным радиатором.
Это обратная сторона карты A16. Нам нравится такая прочная подложка от NVIDIA, защищающая электронные компоненты карты.
Это сторона коннектора PCIe. Обратите внимание на выемку, которая удерживает карту в слоте PCIe x16.
Форм-фактор двойной толщины обусловлен в основном размерами кулера (радиатора). Печатная плата (PCB) с микросхемами GPU занимает только небольшую часть от общего объема карты. Также сразу заметно отсутствие дисплейных выходов, что является типовой особенностью карт этой серии NVIDIA.
Это торцевая сторона карты. Здесь мы видим 8-пиновый коннектор питания, стандартный для видеокарт для дата-центров, и монтажные отверстия для поддерживающего приспособления.
Прошло много времени с тех пор, как мы впервые увидели карты NVIDIA GRID M40: лет семь назад мы заполучили несколько штук с машин HPE, которые списал Facebook.
За почти десять лет общая компоновка карты практически не изменилась.
Теперь давайте посмотрим на основные спецификации этой карты.
Характеристика | Значение |
Архитектура GPU | NVIDIA Ampere |
Графическая память | 4x 16 ГБ GDDR6 |
Пропускная способность памяти | 4x 200 ГБ/с |
Поддержка ECC | Да |
Кол-во ядер NVIDIA Ampere CUDA | 4х 1280 |
Кол-во ядер NVIDIA Tensor 3-го поколения | 4х 40 |
Кол-во ядер NVIDIA RT 2-го поколения | 4х 10 |
FP32 | TF32 | TF321 (TFLOPS) | 4x 4.5 | 4x 9 | 4x 18 |
FP16 | FP161 (TFLOPS) | 4x 17.9 | 4x 35.9 |
INT8 | INT81 (TOPS) | 4x 35.9 | 4x 71.8 |
Системный интерфейс | PCIe Gen4 (x16) |
Максимальное энергопотребление | 250 Вт |
Охлаждение | Пассивное |
Форм-фактор | FHFL (Full Height, Full Length) Dual Slot – полная высота, полная длина, ширина 2 слота |
Коннектор питания | 8-pin CPU |
Блоки кодирования/ декодирования | 4х NVENC/ 8х NVDEC (включая декодирование AV1) |
Безопасная загрузка Measured Boot с использованием аппаратного Root-of-Trust для GPU | Да (опционально) |
Поддержка программной виртуализации GPU | NVIDIA Virtual PC (vPC), NVIDIA Virtual Applications (vApps), NVIDIA RTX Virtual Workstation (vWS), NVIDIA AI Enterprise, NVIDIA Virtual Compute Server (vCS) |
Графические API | DirectX 12.072, Shader Model 5.172, OpenGL 4.683, Vulkan 1.183 |
Вычислительные API | CUDA, DirectCompute, OpenCL, OpenACC |
Поддержка MIG | Нет |
В таблице спецификаций для многих характеристик указана 4-кратность значения (4x ), а в случае NVDEC – (8x ). Потому что, хотя карта является единичным устройством PCIe, она содержит четыре графических чипа поколения Ampere. Это несколько усложняет ее описание. Например, кто-то может сказать, что это 64-гигабайтная карта PCIe, однако каждый графический процессор имеет доступ только к 16 ГБ памяти.
Также стоит отметить отсутствие поддержки MIG. MIG – это технология, позволяющая выделить в составе, например, одной карты NVIDIA A100 до семи кластеров GPU. Мы рассказывали об этом в нескольких статьях. А эта карта фактически представляет собой опцию анти-MIG, поскольку содержит несколько физически отдельных чипов GPU.
Возьмем для примера однопроцессорный сервер Supermicro ARS-210M-NR на базе 128 ядер Arm, в котором установлены четыре видеокарты NVIDIA A16. В отчете о топологии сервера графические процессоры карт A16 представлены как сгруппированные по четыре устройства PCIe, каждое из которых содержит 10 вычислительных блоков и 14 ГБ памяти (хотя физически там по 16 ГБ).
Ниже приведен результат выполнения команды nvidia-smi. С четырьмя установленными картами PCIe двойной ширины мы имеем 16 графических процессоров поколения Ampere и общее количество видеопамяти 256 ГБ.
С точки зрения производительности, каждлый из четырех GPU в A16 примерно эквивалентен одному графическому ускорителю NVIDIA A2: подсистема памяти из 16 ГБ GDDR6 6.25 ГГц на 128-разрядной шине дает пропускную способность 200 ГБ/с, которая умножается на четыре графических чипа GA107-890 Ampere. Хотя карта A2 рассчитана на более низкий TDP, она все-таки занимает целый слот PCIe. Карта NVIDIA A16 разработана с целью поместить в одну карту больше ускорителей и, таким образом, повысить плотность сервера.
Карта NVIDIA A16 во многих отношениях противоположна тому, что NVIDIA продвигает многие годы. Она предлагает четыре графических чипа вместо технологии MIG, позволяющей сегментировать один графический чип большего размера. Тем не менее, для сред VDI и тех приложений, которым нужна более высокая плотность NVENC/ NVDEC, это очень полезный компонент.
Вообще, NVIDIA A16 – интересная карта. Она напоминает о тех “древних временах”, когда такая компоновка карт была новым оригинальным решением. Сегодня NVIDIA A16 представляет собой проверенное временем решение увеличения производительности путем использования нескольких GPU на одной печатной плате, что положительно сказывается на производительности виртуальных машин.
Источник: www.servethehome.com