Четверг, 4 апреля 2019 18:43
Обзор видеокарты NVIDIA Quadro RTX 4000
Видеокарта NVIDIA Quadro RTX 4000 с графической архитектурой Turing позиционируется как супербыстрое профессиональное решение, цена которого – $900 – оправдана высокими показателями производительности, но здесь есть свои тонкости. В частности, такие специфические особенности семейства RTX, как ядра Tensor и RT, являются дополнением к сугубо архитектурным решениям, которые уже выводят карту RTX 4000 на гораздо более высокий уровень производительности по сравнению с предшествующей моделью P4000.
Введение
В августе прошлого года в Ванкувере на конференции SIGGRAPH трудно было обойти вниманием технологию NVIDIA RTX. Практически невозможно было пройти мимо стендов NVIDIA, а также других компаний, демонстрировавших возможности применения RTX-технологий. В том числе компании HP, которая на примере распознавания стилей показала пример практического применения технологий искусственного интеллекта от NVIDIA. А многообещающие демонстрации возможностей рейтрейсинга в реальном времени сделали это шоу воистину потрясающим.
Включение в видеопроцессоры Quadro RTX ядер Tensor и RT позволило значительно ускорить вычисления. Это актуально для алгоритмов глубокого обучения и других ИИ-технологий, а преимущества рейтрейсинга в реальном времени могут использоваться приложениями, поддерживающими последнюю версию движка NVIDIA OptiX.
Доступность видеокарт Quadro RTX с самого начала, т.е. с момента выхода первых трех моделей, оставляла желать лучшего. Многие наши читатели сообщали о том, что им приходилось ожидать свой заказ дольше указанного продавцом срока, и мы, по правде сказать, не уверены, что с тех пор ситуация сильно улучшилась. Возможно, она улучшится с появлением карты RTX 4000, но делать выводы пока рано.
Модель RTX 4000, как можно понять из данной статьи, стала нашей первой видеокартой из серии Quadro RTX. Она обладает реальным преимуществом по сравнению с картами предыдущего поколения Pascal, которые вышли еще до начала серийного применения ядер Tensor и RT. Одни только Tensor’ы способны резко увеличить производительность 16-разрядных вычислений с плавающей точкой, что особенно актуально в задачах с глубоким обучением. В этой статье мы сравним производительность RTX 4000 и постепенно устаревающей карты Quadro P4000, которая вышла два года назад и находится в одной ценовой группе с RTX 4000.
Характеристики профессиональных видеокарт NVIDIA Quadro | |||||||||
Видеокарта | Число ядер | Базовая частота, МГц |
Максимальная вычислительная мощность FP32, TFLOPS |
Объем памяти, ГБ | Пропускная способность памяти, ГБ/с |
TDP, Вт | Цена, $ | ||
GV100 | 5120 | 1200 | 14.9 | 328 | 870 | 185 | 8999 | ||
RTX 8000 | 4608 | 1440 | 16.3 | 485 | 624 | ? | 10000 | ||
RTX 6000 | 4608 | 1440 | 16.3 | 245 | 624 | 295 | 6300 | ||
RTX 5000 | 3072 | 1350 | 11.2 | 165 | 448 | 265 | 2300 | ||
RTX 4000 | 2304 | ? | 7.1 | 81 | 416 | 160 | 900 | ||
TITAN V | 5120 | 1200 | 14.9 | 124 | 653 | 250 | 2999 | ||
P6000 | 3840 | 1417 | 11.8 | 246 | 432 | 250 | 4999 | ||
P5000 | 2560 | 1607 | 8.9 | 166 | 288 | 180 | 1999 | ||
P4000 | 1792 | 1227 | 5.3 | 83 | 243 | 105 | 799 | ||
P2000 | 1024 | 1370 | 3.0 | 53 | 140 | 75 | 399 | ||
P1000 | 640 | 1354 | 1.9 | 43 | 80 | 47 | 299 | ||
P620 | 512 | 1354 | 1.4 | 23 | 80 | 40 | 199 | ||
P600 | 384 | 1354 | 1.2 | 23 | 64 | 40 | 179 | ||
P400 | 256 | 1070 | 0.6 | 23 | 32 | 30 | 139 | ||
Примечания |
Память: 1 GDDR6; 2 GDDR5X; 3 GDDR5; 4 HBM2; 5 GDDR6 (ECC);
6 GDDR5X (ECC); 7 GDDR5 (ECC); 8 HBM2 (ECC)
Архитектура: P = Pascal; V = Volta; RTX = Turing |
Мы не располагаем точными данными о базовой тактовой частоте карты RTX 4000, но нам известна ее максимальная вычислительная мощность при выполнении 32-разрядных операций с плавающей точкой – 7.1 TFLOPS, что означает уровень производительности, соответствующий уровню GeForce RTX 2070 в игровом сегменте. Из этого следует, что GPU RTX 4000 может обеспечить отличный геймплей на разрешениях 1080p и 1440p, а в некоторых играх – и на разрешении 4K.
Карты Quadro RTX с большими номерами предлагают еще более высокую производительность, но и стоят дороже; апофеозом этого является карта RTX 8000 за 10 тысяч долларов с умопомрачительным объемом памяти GDDR6 ECC – 48 ГБ. Если у вас повышенные требования к быстродействию и объему памяти или нужна производительность выше среднего уровня, то вам стоит присмотреться к RTX 5000 – если позволяет бюджет.
Карта Quadro P4000 имеет вычислительную мощность 5.3 TFLOPS, и только по этому показателю новая карта RTX 4000 оказывается на 34% быстрее и при этом не намного дороже. Правда, за прибавку к производительности приходится расплачиваться несколько большим энергопотреблением, но TDP 160 Вт позволяет новой карте 4000-й серии оставаться в категории однослотовых. Коннектор питания располагается сзади в торце (не сверху), что делает эту карту подходящей для сравнительно небольших корпусов.
В отличие от предыдущих смен поколений видеокарт в серии Quadro RTX переход от архитектуры Pascal к архитектуре Turing не просто означает заметное увеличение скорости (и эффективности), но, благодаря включению в состав GPU ядер Tensor и RT, по сути переводит модели RTX в отдельную лигу на рынке видеокарт. Как мы уже упоминали, ядра Tensor имеют большое практическое значение для развития технологий ИИ и глубокого обучения, а ядра RT дают значительные преимущества в реализации метода трассировки лучей в режиме реального времени в тех приложениях, которые используют эту технологию.
В таблице ниже приведены характеристики производительности доступных на сегодняшний день моделей Quadro RTX. Для процессоров Turing компания NVIDIA ввела новый параметр – RTX-OPS: чем выше его значение, тем выше потенциальные возможности видеокарты.
Параметры производительности видеокарт NVIDIA Quadro RTX | ||||||
Видеокарта | Число ядер RT | RTX-OPS | Rays Cast (кол-во лучей в секунду) |
FP16 | INT8 | DL (глубокое обучение) |
RTX 8000 | 72 | 84 T | 10 Giga Rays/s | 32.6 TFLOPS | 206.1 TOPS | 130.5 TFLOPS |
RTX 6000 | 72 | 84 T | 10 Giga Rays/s | 32.6 TFLOPS | 206.1 TOPS | 130.5 TFLOPS |
RTX 5000 | 48 | 62 T | 8 Giga Ray/s | 22.3 TFLOPS | 178.4 TOPS | 89.2 TFLOPS |
RTX 4000 | 36 | 43 T | 6 Giga Rays/s | 14.2 TFLOPS | 28.5 TOPS | 57 TFLOPS |
Все видеокарты Pascal, за исключением GP100, испытывают проблемы с половинной (FP16) и двойной (FP64) точностью вычислений: производительность здесь совершенно не отвечает тому уровню, который требуется в задачах, опирающихся на эти виды вычислений. Карты Turing, даже самого высокого класса, в части двойной точности тоже имеют ограниченную вычислительную мощность, но по показателям FP16 они вышли на качественно новый уровень: 14.2 TFLOPS карты RTX 4000 уже дают заметное преимущество в соответствующих задачах.
Видеокарты AMD Vega уже два года предлагают высокопроизводительные вычисления с половинной точностью, но в задачах с глубоким обучением из-за отсутствия ядер Tensor или какого-либо их аналога им трудно конкурировать с картами RTX. В AMD говорят, что в их будущих GPU тоже будут реализованы подобные технологии, так что ждем – чем ответит команда «красных».
На данный момент технологию NVIDIA RTX поддерживает ряд программных пакетов, к которым мы только начинаем подступаться. Этот обзор включает бенчмарки, показывающие преимущества самой архитектуры Turing, но что касается возможностей собственно ядер Tensor и RT, то они будут проанализированы позднее в наших следующих обзорах.
Тестовая конфигурация ПК и набор тестов
Далее мы рассмотрим результаты тестирования видеокарт. Наша тестовая подборка включает в себя самые разнообразные сценарии – от рендеринга до вычислительных задач – и содержит как синтетические бенчмарки, так и тесты с реальными приложениями, например, от Adobe и Autodesk.
Для этого обзора мы отобрали семь видеокарт, но основное внимание будет уделено сравнению карт Quadro двух соседних поколений: P4000 и RTX 4000. Также будет интересно сравнить их с видеокартой AMD Radeon Pro WX 8200, которая поступила в продажу прошлой осенью по сопоставимой цене ($999).
Тестовая конфигурация
Процессор | Intel Core i9-7980XE (18 ядер; 2.6 ГГц) |
Материнская плата | ASUS ROG STRIX X299-E GAMING |
Память | HyperX FURY (4x 16 ГБ; DDR4-2666 16-18-18) |
Графика |
AMD Radeon VII (16 ГБ; Press Driver от 22.01) AMD Radeon Pro WX 8200 (8 ГБ; 18.Q4.1) NVIDIA GeForce RTX 2080 Ti (11 ГБ; 417.71) NVIDIA TITAN Xp (12 ГБ; 417.71) NVIDIA Quadro RTX 4000 (8 ГБ; 412.16) NVIDIA Quadro P6000 (24 ГБ; 412.16) NVIDIA Quadro P4000 (8 ГБ; 412.16) |
Аудиосистема | Встроенная |
Накопитель | SSD Kingston KC1000 960 ГБ M.2 |
Блок питания | Corsair 80 Plus Gold AX1200 |
Корпус | Corsair Carbide 600C Inverted Full-Tower |
Система охлаждения | Жидкостный кулер «всё в одном» NZXT Kraken X62 |
Операционная система | Windows 10 Pro версия 17763 (1809) |
Все наши бенчмарки можно разделить на три большие группы. В первую входят тесты из пакетов Adobe Premiere Pro и MAGIX Vegas Pro на перекодирование видеофайлов с использованием кодеков AVC и HEVC, а также тесты из пакета Sandra, показывающие производительность в финансовых и научных расчетах и в криптографических задачах.
Во вторую группу входят рендеры: популярный открытый дизайнерский пакет Blender, а также LuxMark, Radeon ProRender и специально для видеокарт NVIDIA – Redshift, V-Ray и OctaneRender.
Третья группа включает в себя тесты из пакета SPECviewperf на визуализацию моделируемых объектов, а также задачи из популярных приложений для проектирования – CATIA, SolidWorks, Siemens NX, Creo и 3ds Max и Maya от Autodesk.
Итак, поехали.
Adobe Premiere Pro и MAGIX Vegas
Результаты Premiere Pro и Vegas требуют некоторых дополнительных пояснений: они взяты из обзора видеокарты Radeon VII, и к ним мы собирались быстренько добавить результаты P4000 – пока аналогичные результаты не опубликовали где-нибудь еще. Однако мы этого не сделали, и этот момент нужно прояснить.
В нашем последнем тестировании по программе Premiere Pro участвовали только карты высшей категории, и все результаты располагаются примерно на одном уровне. Это делает последующие результаты предсказуемыми, но не очень интересными, поэтому на будущее мы решили пересмотреть методику тестирования.
К программе тестирования в Premiere Pro мы планируем добавить тест на воспроизведение видеоролика (который занимает достаточно много времени); такой тест будет более показателен, чем простое перекодирование. А пока перед GPU ставится задача перекодирования видео в более низкое разрешение, результаты видеокарт класса high-end будут примерно одинаковыми (сравните, например, RTX 4000 vs. P4000 vs. TITAN Xp vs. WX 8200).
Один из важных аспектов сравнения профессиональных и игровых видеокарт: профессиональные приложения (что оптимизированные под «железо» AMD, что под NVIDIA) часто подразумевают 10-битную глубину цветопередачи, которую гарантированно обеспечивают только профессиональные видеокарты. Например, для работы в Photoshop с 10-битной глубиной цвета требуется профессиональная карта, хотя многие другие приложения хорошо идут и на игровых картах. Требование 10-битной глубины цвета относится и к Premiere Pro, но оно не абсолютно. И вообще найти достоверную информацию о поддержке 10-битной глубины цвета игровыми и профессиональными картами практически невозможно. Наверное, так и задумано.
В MAGIX Vegas проблем с различимостью результатов не было, но на стороне NVIDIA что-то пошло не так (возможно, это связано с драйверами). После публикации обзора Radeon VII мы потратили некоторое время на доработку программы тестирования, включив в нее тест на воспроизведение видеоролика. Однако в этот раз мы не смогли его провести по причине того, что MAGIX Vegas не может корректно работать на видеокартах NVIDIA с использованием общих FX-фильтров, например, Median и LUT, причем эта проблема имеет место и при перекодировании, и при воспроизведении видеофайлов.
Ниже представлены результаты простого перекодирования без использования фильтров. Они могут показаться результатами вчерашнего дня, но нужно учесть, что мы не использовали FX-фильтры. В будущем результаты этого теста покажут более актуальную производительность.
Карта Radeon VII в Vegas проявляет себя настолько хорошо, что кажется – это однозначно лучший выбор в данной категории видеокарт. Но такой результат достигнут на фоне не самого удачного выступления карт NVIDIA. Вообще, Vegas – одна из тех программ, где никогда не знаешь, что получится в итоге с производительностью. Раньше, по результатам предыдущих версий, лидировали видеокарты NVIDIA, а теперь NVIDIA и AMD поменялись местами.
В следующих обзорах здесь будет гораздо больше информации. В настоящий момент напрашивается вывод, что основная проблема – в том, что «железо» NVIDIA в Vegas почему-то работает не лучшим образом; кроме того, нам нужно модернизировать программу и методику тестирования в Premiere Pro. Конечно, это займет достаточно много времени, но мы планируем заняться этим при ближайшей возможности.
Sandra: криптография, финансовые и научные расчеты
Тех, кто использует процессоры в шифровании данных, должен радовать тот факт, что каждое новое поколение – как CPU, так и GPU – делает это все быстрее. Приведенные выше результаты наглядно показывают, что видеокарты NVIDIA Turing имеют здесь реальное преимущество, а возглавляет хит-парад карта 2080 Ti.
Quadro RTX 4000 на фоне Radeon VII выглядит довольно скромно, особенно в части хэширования. Но по сравнению с картой предыдущего поколения Quadro P4000 новая карта NVIDIA предлагает значительно большую производительность. Однако, если вы серьезно занимаетесь шифрованием, лучшим на сегодня решением для вас будет VII.
В тесте на финансово-экономические расчеты архитектура NVIDIA Turing снова показывает свою силу, опережая Radeon VII примерно на 45%. Здесь стоит заметить, что VII предлагает очень хорошую производительность в вычислениях с двойной точностью (FP64), позволяющую производить в том числе и финансовые расчеты, но я готов поспорить, что те, кто использует GPU для решения таких серьезных задач, предпочитают специально для этого разработанные видеокарты (Instinct, Tesla).
И закрывает эту группу тест, в котором свою суперсилу еще раз демонстрирует Radeon VII. Мы все прекрасно помним, как AMD пыталась позиционировать эту карту как игровую. Однако очевидно, что она идеально подходит для решения вычислительных задач – иногда даже лучше, чем карты NVIDIA, и в ходе данного обзора у нас еще будет возможность в этом убедиться.
V-Ray, Redshift, OctaneRender, Blender, LuxMark и Radeon ProRender
V-Ray от Chaos Group
Поскольку наш проект V-Ray не предназначен для карт Radeon и Radeon Pro, по этой программе мы тестируем только видеокарты Quadro и GeForce.
Карта NVIDIA Quadro RTX 4000 демонстрирует гигантский прогресс относительно P4000, сокращая время рендеринга почти в два раза. Я не думаю, что ядра RT, предназначенные для рейтрейсинга, могут как-либо использоваться в традиционном рендеринге, так что это достижение следует записать исключительно на счет новой архитектуры NVIDIA Turing. Что же касается RTX, то ядра RT фактически могут использоваться для решения задач шумоподавления с использованием алгоритмов машинного обучения, но в настоящее время это применяется только в интерактивном дизайне, а не в конечно-элементном рендеринге.
Что RTX 4000 быстрее P4000 – это неудивительно, интересно другое: RTX 4000 превосходит и топовую видеокарту предыдущего поколения Quadro P6000. У GPU P6000 объем видеопамяти в три раза больше, и это делает прогресс RTX 4000 в части чистой производительности еще более впечатляющим. Результат RTX 2080 Ti дает нам некоторое представление о том, чего можно ожидать от Quadro RTX 6000.
Redshift
В V-Ray преимущества видеокарт RTX выявляются благодаря встроенному алгоритму подавления шумов, которого пока нет в Redshift (встроенная поддержка шумоподавления должна появиться в версии 3.0). И, в то время как результаты V-Ray подчеркивают колоссальное преимущество карт Turing над картами Pascal, в Redshift этот прогресс не столь очевиден.
Результат RTX 4000 близок к результату RTX 2080 Ti, и мы считаем это признаком того, что наш тест, возможно, не обеспечивает ту нагрузку, которая нужна для тестирования таких видеокарт. Однако разница между этими мощными картами и титаном предыдущего поколения TITAN Xp вполне очевидна. И в нашем основном соревновании – RTX 4000 vs. P4000 – новая карта демонстрирует значительно большую скорость.
Octane от OTOY
Как и в Redshift, в тестах OTOY специализированная поддержка RTX пока отсутствует. Точнее, она появится в версии Octane 2019, дата выхода которой пока не определена. И, когда бы это ни произошло, этот бенчмарк OTOY будет определять показатели производительности видеокарт как в режиме RTX, так и в «обычном» режиме. Когда он выйдет и попадет на платформы, удовлетворяющие соответствующим системным требованиям, результаты Octane с поддержкой RTX должны показать существенное ускорение процесса рендеринга.
Но даже в отсутствие опции RTX видеокарты Turing демонстрируют очень неплохие показатели: RTX 4000 не намного отстает от топ-карты предыдущего поколения P6000 и значительно опережает P4000.
Blender
В отличие от рендеринга, производительность при визуализации объектов моделирования в Blender качественно зависит от разрешения: при переключении на более высокое разрешение она резко снижается. С разрешением 1080p карта RTX 4000 справляется хорошо, занимая второе место после игровой карты 2080 Ti, которая снабжена большим количеством ядер CUDA (не говоря уже о большем объеме VRAM). И этой же скорости RTX 4000 хватило для того, чтобы опередить TITAN Xp.
А на разрешении 4K возникли трудности, причем у всех видеокарт: даже 2080 Ti показала полуприемлемый уровень производительности. Впрочем, здесь нужно заметить, что режим LookDev не относится к числу часто используемых, поэтому низкая частота кадров не должна никого пугать. Если бы такая производительность наблюдалась в режиме каркасного или сплошного объемного моделирования объекта, то это было бы проблемой. Но с этими режимами все видеокарты справились, то есть смогли обеспечить частоту кадров в районе 60 FPS даже на разрешении 4K.
В задачах рендеринга результат достигается тем быстрее, чем мощнее видеокарта. Неудивительно, что первое место занимает 2080 Ti. И вообще, итоговое распределение результатов здесь в точности соответствуют тому, которое можно было бы предположить априори, основываясь только на технических характеристиках видеокарт.
Отметим еще раз, что RTX 4000 снова превосходит карту предыдущего поколения P4000, причем с очень большим отрывом.
LuxMark
Выпуская карту Radeon VII, компания AMD заявляла об увеличении производительности конкретно в LuxMark. Странно, что об этом редко вспоминают, потому что полученные результаты наглядно объясняют, почему AMD рекламировала этот тест: VII занимает здесь первое место, хотя чемпионство и не абсолютное.
С более сложной отельной сценой 2080 Ti справилась лучше, чем VII; это намекает на то, что преимущество карты Radeon гарантировано не во всех случаях. Этот результат тем более интересен, что у AMD уже наблюдался подобный расклад – когда процессоры Ryzen в KeyShot отлично справились с отрисовкой автомобиля (сравнительно простого объекта), но в рендеринге сцены с интерьером заметно отстали от Intel. Что-то в наших интерьерах у процессоров AMD не вытанцовывается.
Radeon ProRender
В Radeon ProRender, к великому сожалению AMD, видеокарты NVIDIA продемонстрировали просто отличные результаты. Если судить только по ним, то в рендеринге архитектура Turing обеспечивает безоговорочное лидерство: карта RTX 4000 оказывается быстрее технически более мощной Radeon VII.
Мы не хотим сказать, что на основании этих результатов нужно отказаться от карт AMD, поскольку производительность в рендеринге – это еще не всё. Но если вы планируете применять интерактивный рендеринг, то вам нужна максимально быстрая видеокарта – насколько позволяет ваш бюджет.
Визуализация: SolidWorks, CATIA, Siemens NX, PTC Creo, 3ds Max и Maya
SolidWorks
Итак, мы приступаем к группе тестов с труднопредсказуемыми результатами. В игровом тестировании соотношение результатов тестируемых видеокарт от игры к игре по большому счету не изменяется, за исключением особых случаев оптимизации конкретных игр под «железо» конкретного производителя. Геймерам по большому счету не нужно беспокоиться о том, что какая-то из фирм-производителей видеокарт может не поддерживать какую-то из новейших игр класса AAA, но с приложениями для проектирования дело обстоит совсем иначе.
Выше приведены результаты моделирования работы SolidWorks в SPECviewperf, и здесь RTX 4000 вклинивается между Quadro P6000 и Radeon Pro WX 8200. До этого момента по ходу обзора мы наблюдали гигантские отрывы RTX 4000 от старшей модели P4000, но здесь эти две карты в итоговом протоколе располагаются довольно близко друг к другу. То есть любая профессиональная видеокарта здесь будет работать достаточно хорошо.
SolidWorks RealView Off
SolidWorks RealView On
В феврале нам перепал кусок пирога в виде лицензии на SolidWorks, и мы смогли провести более глубокое тестирование – в реальном приложении. Мы в общем-то хотели посмотреть, как соотносятся «натурные» результаты с результатами, полученными в SPECviewperf, и, честно говоря, не ожидали, что в реальном приложении между картами NVIDIA и AMD будет такой разрыв:
Эта первая таблица показывает результаты работы в SolidWorks с включенной опцией RealView. Использование этой опции дает более реалистичное изображение (более полное представление о моделируемом объекте); это достигается благодаря улучшенной визуализации теней и отражений (примеры приведены выше). Так как наша лицензия на SolidWorks имела ограниченный срок действия, у нас не было возможности углубиться в проблему и выяснить, почему же карты Radeon здесь настолько отстали от карт NVIDIA – разница в результатах просто поразительная.
Я буду не совсем точен, если скажу, что карты Radeon демонстрируют здесь совсем плохую производительность, потому что WX 8200 все-таки выдает в среднем 69 FPS. Просто, если ее при этом обгоняет даже такой катафалк, как Quadro P2000, это значит, что карты NVIDIA имеют здесь явное преимущество.
Примерно такое же соотношение результатов мы получаем и в режиме с выключенной опцией RealView, но абсолютные показатели производительности здесь оказываются вполне приемлемыми даже у наименее мощных карт Radeon. Интересно, что графический процессор TITAN Xp, который NVIDIA адресовала рабочим станциям, в SolidWorks работает из рук вон плохо. Но на нем все-таки можно запустить режим RealView, а игровые карты и этого не могут.
Если в будущем у нас опять появится возможность провести тестирование в лицензионном SolidWorks, мы исследуем возникшие здесь вопросы более глубоко.
CATIA
Пакет CATIA не содержит никаких специфических оптимизаций, предназначенных для профессиональных видеокарт, поэтому тут все просто: чем быстрее (мощнее) видеокарта, тем лучше производительность. Конечно, CATIA – это одно из тех приложений, которые по умолчанию предполагают использование видеокарты класса «про», гарантирующей максимальную стабильность, но студентов, сидящих на игровых видеокартах, это не смущает.
Siemens NX
Возможно, Siemens NX – самый интересный тест в этой подборке, потому что он отправил игровые видеокарты на самое дно турнирной таблицы. Даже быстрейшая игровая карта NVIDIA здесь провалилась. Карта AMD Radeon VII по какой-то причине выступила заметно лучше, но по сравнению с профессиональными видеокартами это все равно нулевой уровень.
Все профессиональные карты показали очень приличные результаты, а карта NVIDIA RTX 4000, как и следовало ожидать, существенно превзошла свой предшествующий аналог P4000.
Creo от PTC
Creo – это еще одно приложение, в котором визуализация оптимизирована под профессиональные видеокарты; благодаря этому такая карта, как WX 8200, здесь опережает технически более быструю Radeon VII. Что касается «зеленых», то RTX 4000 занимает место сразу за P6000, причем проигрывает не так уж и много. Кроме того, эта карта нового поколения снова демонстрирует значительную прибавку в производительности относительно своей прямой предшественницы P4000.
3ds Max и Maya
И AMD, и NVIDIA придают большое значение 3ds Max и Maya как популярным программным пакетам для проектирования, и к счастью – игровые видеокарты от обеих компании здесь практически не уступают в производительности профессиональным GPU. Профессиональные карты лучше приспособлены для выполнения ряда специализированных функций и гарантируют высокую стабильность, но в целом для данных приложений оба вида GPU можно считать эквивалентными.
Даже со сложными сценами любая из этих видеокарт справляется без особого труда; но где более высокий уровень (номер) видеокарты дает ощутимое преимущество, так это в интерактивном рендеринге с визуализацией. Построение каркасных и сплошных объемных моделей не всегда предъявляет настолько высокие требования к GPU, но если вы собираетесь использовать интерактивный рендеринг, то чем быстрее будет работать видеокарта, тем здоровее будет ваша нервная система.
Визуализация в Medical и Energy
Результаты теста Energy в очередной раз подтверждают превосходство RTX 4000 над предшествующим аналогом, выявляя те специфические преимущества, которые дают соответствующие архитектурные решения NVIDIA, составляющие только часть всех инноваций проекта Turing. Тем не менее, всего этого оказалось недостаточно для того, чтобы победить Radeon VII в тесте Medical – даже силами 2080 Ti. Возможно, такой успех Radeon VII обусловлен наличием у этой карты супербыстрой памяти с пропускной способностью 1 ТБ/с.
Заключение
Карта NVIDIA Quadro RTX 4000 подтвердила свой статус быстрой однослотовой видеокарты, которая существенно превосходит предшествующую модель Quadro P4000. В большинстве тестов RTX 4000 опережает P4000 с большим отрывом, в ряде случаев обеспечивая примерно двукратное увеличение производительности – например, в хэшировании.
В тестах с визуализацией моделируемых объектов в некоторых случаях также наблюдается очень большая прибавка в скорости. В приложении SolidWorks карта RTX 4000 была одной из самых быстрых и даже самой быстрой, опередив топ-карту предыдущего поколения с архитектурой Pascal Quadro P6000. Интересно, что по результатам SolidWorks-моделирования в SPECviewperf карта P6000 заняла первое место, показав, что фреймбуфер объемом 24 ГБ тоже иногда бывает полезен.
Явный прогресс наблюдается и в тестах PTC Creo и Siemens NX: полученные здесь результаты могут послужить веским основанием для замены карты предыдущего поколения P4000 (не говоря уже о более старых) на RTX 4000. Даже в тесте Energy в SPECviewperf мы видим существенное улучшение показателей, и, хотя для многих пользователей ProViz это может не иметь решающего значения, тем не менее счет на табло – архитектура Turing дает реальные преимущества.
Для профессиональных карт чистая производительность – это еще не всё, но в серии Quadro RTX даже самые продвинутые функции тесно связаны с производительностью. Функционал RTX существенно ускоряет такие сложные и ресурсоемкие процессы, как шумоподавление с применением ИИ и, конечно, рейтрейсинг. Причем эти две задачи технически могут решаться одновременно. Для разработчиков программного обеспечения это означает большую вариативность при использовании тех потенциальных возможностей, которые предлагает новое «железо». Мы не просто вышли за рамки стандартных вычислений FP32. Новым картам в полной мере доступны вычисления с половинной точностью FP16, и ядра Tensor значительно ускоряют вычисления в той области, где уже не хватает мощности ядер CUDA.
Еще несколько слов на тему специфических «фишек» RTX: мы уже говорили, что OTOY и Redshift в ближайшем будущем дополнят свои рендеры встроенной поддержкой RTX, а Solid Angle планирует сделать то же самое в Arnold. SolidWorks и SolidWorks Visualize тоже получат RTX-версии, и это должно на глазах ускорить процесс рендеринга в последнем приложении.
Однако нас смущает одна вещь: если ориентироваться на использование преимуществ рейтрейсинга и искусственноинтеллектуального шумоподавления по полной программе, то карта RTX 4000-й серии – это не самый подходящий вариант для больших проектов. В том числе из-за сравнительно небольшого объема фреймбуфера – 8 ГБ. В качестве альтернативы здесь следует рассмотреть модель RTX 5000, которая имеет на треть большее число ядер и вдвое больший объем памяти. Но, конечно, только в том случае, если вас не останавливает значительно более высокая цена RTX 5000. Для типовых проектов в таких приложениях, как SolidWorks Visualize (см. рисунок ниже), объем фреймбуфера RTX 4000 скорей всего не будет большим препятствием, но, конечно, на сегодняшний день 8 ГБ – это только самый необходимый минимум.
SolidWorks Visualize будет поддерживать технологию NVIDIA RTX
Если говорить о ближайшем конкурирующем аналоге, Radeon Pro WX 8200, то RTX 4000 превосходит его в большинстве тестов, но в ряде случаев и карта AMD демонстрирует солидное преимущество, и это снова приводит нас к уже знакомому выводу, что определяющим фактором здесь является конкретная нагрузка. В нашем тесте GEMM с перемножением матриц карта AMD показала очень хорошую производительность, актуальную для научных расчетов, но карта NVIDIA Turing взяла убедительный реванш в тесте с быстрым преобразованием Фурье. В криптографии эти карты соревнуются с попеременным успехом, причем карта NVIDIA быстрее справляется с шифрованием по более сильному алгоритму SHA-512.
В некоторых тестах карты NVIDIA побеждают по умолчанию – это Redshift, Octane и V-Ray, которые были разработаны в расчете на ядра CUDA и в ряде случаев поддерживают только CUDA. Исключением здесь является V-Ray, который можно запускать и на картах AMD благодаря поддержке OpenCL, но помимо этого мы собираемся сделать для карт AMD аналогичный тест-рендер, который будет так же (или почти так же) работать и с картами NVIDIA. Поэтому мы просим пользователей V-Ray и карт AMD поделиться с нами своим опытом.
Еще один интересный момент – отличные результаты карт NVIDIA RTX в Radeon ProRender, настолько хорошие, что просто удивительно, как такое возможно: RTX 4000 оставила далеко позади карты AMD WX 8200 и Radeon VII. Так как мы уже давно подсели на ProRender, то будем и дальше использовать уже новые версии этого программного пакета для тестирования видеокарт и отслеживать все изменения.
В итоге можно сказать, что модель NVIDIA Quadro RTX 4000 – это продвинутая, сбалансированная и очень быстрая профессиональная видеокарта. Поскольку NVIDIA выпустила эту карту еще и с целью подрезать AMD, то неудивительно, что RTX 4000 стоит всего $900, тогда как WX 8200 стоит все $999. По цене RTX 4000 побеждает, но опять же, выбор видеокарты во многом зависит от вида основной рабочей нагрузки. Высокие результаты в тестах и приложениях, с которыми вы не работаете, не должны служить решающим фактором при выборе конкретной модели видеокарты.
Обзор игровой производительности видеокарты NVIDIA GeForce RTX 2060 на разрешениях 1080p и 1440p
Новая видеокарта NVIDIA GeForce RTX 2060, оцененная производителем в $349, стала наиболее доступной моделью этой серии, оснащенной ядрами Tensor и RT.
Обзор видеокарты Nvidia GeForce GTX 1660 Ti
Последний всплеск геймерского интереса к видеокартам Nvidia связан с выходом новой видеокарты среднего ценового диапазона без встроенной поддержки технологии RTX.
Обзор видеокарты Nvidia GeForce RTX 2060 для ноутбуков
Учитывая популярность и широкое применение в игровых ноутбуках видеокарты GeForce GTX 1060, логично предположить, что столь же популярным предложением из последней серии Nvidia должна стать новая карта RTX 2060.
Источник: techgage.com