Сегодня Nvidia анонсировала два новых графических процессора Tesla P4 и P40, которые смогут стать частью самообучаемых платформ. Чипы, сделанные на архитектуре Pascal, выйдут вместе с новым программным обеспечением, которое позволит в разы увеличить эффективность обучения нейронных сетей в сервисах, активно использующих искусственный интеллект (ИИ).
Современные сервисы ИИ, такие, как голосовые помощники, спам фильтры и рекомендательные системы интернет-магазинов, постоянно усложняются, требуя в десять раз больших аппаратных мощностей по сравнению с предыдущим годом. Современные CPU не в состоянии обеспечить быструю работу таких сервисов, а это всегда приводит к недовольству пользователей.
Графические процессоры Tesla P4 и P40 созданы специально для работы с обучаемыми алгоритмами, которые используют нейронные сети для распознания речи, картинок или текста в ответ на запросы пользователей. Обучаемые алгоритмы основаны на логических операциях, которые могут рассчитываться с помощью специальных инструкций (INT8). Новые GPU Nvidia поддерживают эти инструкции. Они позволяют увеличить скорость работы упомянутых сервисов почти в 45 раз.
Tesla P4 обладает лучшей для дата-центров энергоэффективностью. Графический адаптер очень компактен и легко устанавливается в любые корпуса, а его потребляемая мощность немногим больше 50 Вт. Один сервер с одним GPU Tesla P4 может заменить 13 серверов с обычными CPU при работе с нейронными сетями, позволяя сильно сэкономить на стоимости системы.
С показателем по количеству логических операций в 47 TOPS, сервер с 8 графическими процессорами Tesla P40 сможет заменить 140 серверов, использующих обычные CPU. При средней стоимости сервера в $5000, GPU от Nvidia позволяет сэкономить более $650000.
Вместе с Tesla P4 и P40 вышли два новых инновационных программных продукта для работы с нейронными сетями: Nvidia TensorRT и Nvidia DeepStream SDK.
Библиотека TensorRT создана для оптимизации моделей обучаемых алгоритмов перед их применением в сервисах. Для увеличения эффективности сервисов TensorRT использует тренированные нейросети, которые определены в виде 32-битных или 16-битных операций, и конвертирует их в 8-битные операции INT8.
Nvidia DeepStream SDK позволяет декодировать и анализировать до 93 видеопотоков разрешения HD с помощью графических процессоров Pascal. Данное ПО решает одну из ключевых проблем ИИ, которая заключается в распознании видеопотока. Это применимо для автономных автомобилей, интерактивных роботов, фильтров и средств размещения рекламы. Внедрение самообучаемых алгоритмов позволит видеосервисам предлагать умные и инновационные решения, которые были невозможны ранее.
Источник: www.videocardz.com