NVIDIA объявила о намерении интегрировать высокоскоростной интерфейс, под названием NVIDIA NVLink, в свои будущие GPU, позволив ускорить обмен данными между графическим процессором (GPU – Graphics Processing Unit) и центральным процессором (CPU – Central Processing Unit) от 5 до 12 раз в сравнении с днём сегодняшним. Такое решение позволит решить давнюю проблему узкого горлышка, проложив путь к созданию нового поколения суперкомпьютеров в рамках концепции Exascale Computing, от 50 до 100 раз более мощных по сравнению с самыми высокопроизводительными
компьютерами современности.
NVIDIA добавит поддержку технологии NVLink в свои
GPU на базе архитектуры Pascal, планируемые к выпуску в 2016 году в качестве преемников GPU поколения Maxwell этого года. Новая интерфейсная технология – плод совместных усилий инженеров NVIDIA и IBM, предполагающий использование в будущих версиях процессоров IBM POWER.
«Технология NVLink позволит в полной мере задействовать потенциал GPU путём резкого улучшения процесса обмена данными между CPU и GPU с минимизацией времени на ожидание GPU-компонентом обрабатываемых данных», – говорит старший вице-президент NVIDIA по техническим вопросам в области GPU Брайэн Келлехер (Brian Kelleher). «NVLink обеспечивает быстрый обмен данными между CPU и GPU, способствуя увеличению пропускной способности канала передачи данных для всей системы, позволяя обойти ключевую проблему узкого горлышка в современных системах с возможностью ускорения вычислений за счёт ресурсов GPU, – отметил Бредли МакКеди (Bradley McCredie) вице-президент и старший научный сотрудник компании IBM. – NVLink упрощает модификацию приложений, требующих высокопроизводительных ресурсов, и приложений в области
анализа данных с учётом возможности использования преимуществ CPU-систем с ускорением расчетов средствами GPU. Полагаем, эта технология представляет собой очередной большой шаг вперёд в развитии нашей экосистемы OpenPOWER».
Благодаря технологии NVLink, тесно связывающей CPU IBM POWER с GPU
NVIDIA Tesla, экосистема дата-центров на базе процессоров POWER сможет в полном объёме использовать преимущества ускорения расчётов на базе GPU для широкого спектра применений, включая ресурсоёмкие вычисления, анализ данных и системы машинного обучения.
Преимущества перед PCI Express 3.0
В современных условиях взаимодействие x86-совместимого
процессора с
видеокартой осуществляется посредством шины
PCI Express (PCIe), которая ограничивает способность GPU обращаться к памяти CPU, работая в 5-6 раз медленнее типичных систем, где с оперативной памятью общается только CPU. Проблема узкого горлышка в виде PCIe усложняется для конфигурации с использованием GPU и процессоров IBM POWER, обеспечивающих большую, чем x86 процессоры, пропускную способность. Так как NVLink позволит реализовать интерфейсные возможности, сопоставимые с таковыми в типичных CPU-системах, GPU сможет обращаться к памяти CPU с задействованием всего скоростного потенциала памяти CPU.
Высокоскоростной интерфейс позволит резко повысить быстродействие в применениях на базе
программного обеспечения с использованием аппаратного ускорения обсчётов средствами GPU. Различие в системах памяти – быстрая, но небольшая память GPU (специализированная видеопамять) и медленная, но объёмная память CPU (оперативная память) – типично вызывает необходимость таких приложений перемещать данные в память CPU с
сетевого хранилища либо внешнего хранилища данных с прямым подключением с последующим копированием данных в память GPU до начала обработки средствами GPU. Благодаря NVLink обмен данными между оперативной памятью и видеопамятью значительно ускоряется – как и сами приложения такого класса.
Общая память
Ускоренный обмен данными вкупе с другой функцией, известной как «общая память» (Unified Memory), позволит упростить написание кода, использующего ускорение вычислений средствами GPU. Благодаря концепции общей памяти программист оперирует памятью CPU и GPU как одним блоком, не озадачиваясь тем, в какой именно памяти этих двух типов «живут» данные.
Хотя в будущем графические решения NVIDIA не лишатся поддержки PCIe, технология NVLink получит применение как средство для связи видеокарт и процессоров с поддержкой NVLink, а также для создания высокоскоростного канала обмена данными напрямую между несколькими GPU. Также, несмотря на сильно возросшую пропускную способность, NVLink обеспечит существенно лучшую энергоэффективность в пересчёте на бит данных в сравнении с PCIe.
NVIDIA разработала и показала модуль для размещения графических процессоров на базе архитектуры Pascal с использованием NVLink. Размеры
нового GPU-модуля составляют треть от стандартной карты расширения, используемой в качестве основы для создания современных графических карт. Блок коннекторов в нижней части модуля Pascal позволяет подключаться к
материнской плате, улучшая дизайн системы и повышая надёжность передачи сигналов. Появление высокоскоростного интерфейса NVLink позволит создавать системы высокой степени интеграции, способные проложить путь к легкомасштабируемым суперкомпьютерам в рамках инициативы Exascale Computing с высокой энергоэффективностью и производительностью, равной 1000 петафлопс, что в 50-100 раз быстрее самых быстрых современных систем.