Платформа CUDA 6 делает параллельное программирование простым, как никогда раньше, позволяя разработчикам программного обеспечения существенно снизить время и силы, затрачиваемые на оптимизацию научных, инженерных, корпоративных и других приложений.
Платформа предлагает новые улучшения производительности, которые позволяют разработчикам добиться ускорения своих приложений до 8 (!) раз путем простой замены библиотек, предназначенных исключительно для центрального процессора. Ключевыми особенностями
CUDA 6 являются:
- Объединенная память – упрощает процесс программирования, предоставляя возможность приложению получать доступ непосредственно к памяти видеокарты без необходимости копировать информацию из оперативной памяти и обратно, что облегчает внедрение вычислений на GPU для большого числа языков программирования.
- Заменяемые библиотеки – автоматически ускоряют вычисления типа BLAS (базовые подпрограммы линейной алгебры) и FFTW (быстрых преобразований Фурье) в любых приложениях, путем простой замены существующих процессорных библиотек на новые, с поддержкой GPU-ускорения.
- Автоматическое масштабирование на несколько GPU – переработанные библиотеки BLAS и FFTW автоматически распределяют производительность между видеокартами (до 8 графических процессоров в одном узле), что позволяет получать невиданную ранее производительность в операциях с двойной точностью – до девяти терафлопс. Такое масштабирование может быть использовано совместно с заменяемой библиотекой BLAS.
«Автоматическое управление потоками данных в технологии Unified Memory (объединенная память), позволяет нам быстрее создавать прототипы ядер, исполняемых на графическом процессоре и снизить сложность кода, что в итоге уменьшает время разработки примерно на 50%», - сказал Роб Хокстра (Rob Hoekstra), менеджер отдела масштабируемых алгоритмов в Sandia National Laboratories. «Наличие этой технологии будет чрезвычайно полезным и важным в дальнейшем, когда мы разработаем будущую модель программирования и начнем исполнять все более сложный код и объемный код на графических процессорах».
«Наши технологии помогли большим студиям, разработчикам игр и аниматорам создавать визуально потрясающие трехмерные анимации и эффекты», - рассказал Пол Дойл (Paul Doyle), исполнительный директор Fabric Engine, Inc. «Они [разработчики] давно просили нас добавить поддержку графического ускорения для графических процессоров NVIDIA, но управление памятью в комплексных задачах производства контента оказалось слишком сложным. С внедрением технологии Unified Memory этот процесс автоматизирован, что позволило компилятору Fabric использовать
видеокарты NVIDIA и ускорить выполнение приложений до 10 раз».
В дополнение к новым функциям, платформа CUDA 6 предлагает полный набор инструментов программирования, математических библиотек с поддержкой GPU-ускорения, документацию и учебники по программированию.
Шестая версия CUDA Toolkit (перечисленного набора) ожидается в свободном доступе для разработчиков в начале 2014 года. Члены CUDA-GPU Computing Registered Developer Program (программы разработчиков CUDA-GPU) получат уведомление о том, что пакет доступен для загрузки.
Для получения более подробной информации о платформе CUDA 6 можно посетить официальный сайт NVIDIA.