Вторник, 18 октября 2022 17:10
Производительность видеокарты NVIDIA GeForce RTX 4090 на различных конфигурациях PCI-Express
На прошлой неделе NVIDIA выпустила флагманскую видеокарту нового поколения GeForce RTX 4090 "Ada". Уже опубликовано несколько обзоров этой карты (точнее сказать – девять, включая Founders Edition). И по традиции, при выходе каждого нового поколения видеокарт один из обзоров мы посвящаем исследованию фактической производительности GPU в зависимости от пропускной способности предлагаемой конфигурации интерфейса PCI-Express – чтобы выяснить, как флагманские видеокарты используют доступный потенциал интерфейса и снижается ли заметно их производительность при использовании старших версий PCIe или шины PCIe с меньшим количеством линий. Сегодня этот вопрос особенно актуален для тех, кто собирает машину на платформе 13-го поколения Intel Core и при этом планирует использовать NVMe SSD с PCIe 5-го поколения.
Видеокарта NVIDIA GeForce RTX 4090 "Ada" имеет хост-интерфейс PCI-Express 4.0 x16, хотя сама графическая архитектура этой карты в принципе может поддерживать стандарт следующего поколения PCIe 5.0. Конфигурация Gen4 x16 обладает пропускной способностью 32 ГБ/с в каждом направлении. Эта карта также поддерживает технологию PCI Resizable BAR, которая позволяет центральному процессору обращаться ко всем 24 гигабайтам видеопамяти как к единому блоку, а не тянуть данные через окошко с апертурой 256 МБ. Решение NVIDIA сделать здесь хост-интерфейс PCIe 4-поколения выглядит немного странным, с учетом того, что новейшие платформы и Intel, и AMD перешли на 5-е поколение. Intel поддерживает PCIe 5.0 с 2021 года, начиная с 12-го поколения процессоров Core "Alder Lake"; AMD совсем недавно выпустила линейку процессоров Ryzen 7000 "Zen 4", которые тоже поддерживают PCIe 5.0. Ситуация становится еще интересней, если вспомнить, что в ноябре этого года выходят серии NVMe SSD также с PCIe 5.0.
Процессоры Ryzen 7000 "Zen 4" предлагают PCIe Gen5 и на 16 линиях PEG, и на четырех линиях подключенных к CPU слотов NVMe. Что касается Intel, то у них и в 12-м, и в грядущем 13-м поколении Core "Raptor Lake" поддержка 5-го поколения PCIe предусмотрена только в слоте x16 PEG, а подключенные к CPU слоты NVMe предлагают все-таки версию 4.0. Чтобы не терять преимущества перед AMD, Intel сегодня разрешает разработчикам материнских плат оснащать грядущие платы 700-й серии дополнительными слотами M.2 NVMe с поддержкой Gen5, но под это забирается часть линий PCIe, идущих от слота x16 PEG. Это значит, что если пользователь платформы 13-го поколения Core установит SSD в такой слот M.2, он переключит на этот слот восемь линий PCIe от графического слота x16. Таким образом, те, кто будет собирать ультрасовременные игровые ПК с процессором Core i9-13900K, видеокартой RTX 4090 и NVMe SSD Gen5, будут вынуждены оставить для графического контента с RTX 4090 канал с пропускной способностью PCI-Express x8. На платформе Ryzen 7000 эта проблема отсутствует: подключенные к CPU слоты NVMe уже предлагают Gen5, как на платах с чипсетами X670/B650 "E", так и не-E, что избавляет от необходимости перетягивать сюда линии с графической конфигурации PCI-Express.
Вот здесь и становится актуальным вопрос о том, будет ли GeForce RTX 4090 существенно терять в производительности при использовании конфигурации PCI-Express 4.0 x8. Хотя это и маловероятно, но некоторые пользователи RTX 4090 могут устанавливать ее на платформы с PCIe Gen3, например, в машины на процессорах 10-го поколения Core "Comet Lake" или серии Ryzen 2000. Версия PCIe Gen 4.0, как правило, поддерживается процессорами 11-го поколения Intel Core и серии Ryzen 3000 "Zen 2". Есть и несколько исключений, например, APU Ryzen 5000G, которые поддерживают только PCIe Gen3. Результаты конфигураций PCIe Gen2 x16 и Gen 1.1 x16 актуальны для тех, кто планирует использовать RTX 4090 с внешними док-станциями для GPU, так как опции подключения этих док-станций Thunderbolt/USB4 с пропускной способностью 40 или 80 Гбит/с, по существу, определяют доступную пропускную способность интерфейса установленных в них видеокарт.
В этом обзоре мы рассмотрим производительность RTX 4090 с хост-конфигурацией PCI-Express 4.0 x16 и сравним эти результаты с результатами, полученными на 16-линейной конфигурации PCI-Express версии 3.0 (которая по пропускной способности эквивалентна конфигурации PCI-Express 4.0 x8) и – из академических соображений – на более ранних версиях PCIe. Старшие версии PCIe мы устанавливали в настройках UEFI материнской платы.
Результаты тестирования
(полную версию обзора см. на www.techpowerup.com)
Заключение
GeForce RTX 4090 "Ada" – это мощнейшая видеокарта, обладающая значительно большей производительностью по сравнению с предыдущим аналогом (RTX 3090). Приступая к этому обзору, мы, прежде всего, хотели посмотреть, как поведет себя карта RTX 4090 при сокращении пропускной способности интерфейса PCIe вдвое относительно ее собственной конфигурации PCI-Express 4.0 x16. Для этого в настройках материнской платы мы ограничили пропускную способность PEG-интерфейса процессора – до версии Gen3 (т.е. PCI-Express 3.0 x16). Конфигурация Gen3 x16 по пропускной способности идентична Gen4 x8, которая нас и интересует. Этот режим PCIe актуален для тех, кто собирается использовать RTX 4090 вместе с процессором 13-го поколения Intel Core "Raptor Lake" и NVMe SSD с версией PCIe Gen5. Мы общаемся с различными производителями материнских плат, и они говорят, что большинство премиальных моделей на чипсете Intel Z790 оснащаются слотами M.2 NVMe Gen5, при использовании которых от основного PEG-интерфейса будет забираться восемь линий PCIe Gen5. Если вы не будете устанавливать в слот Gen5 никакие M.2 SSD, тогда видеокарта будет использовать полную конфигурацию PCIe 4.0 x16, но при установке в этот слот любого SSD-накопителя пропускная способность слота GPU сократится в два раза – до PCI-Express 4.0 x8 (что эквивалентно PCI-Express 3.0 x16).
Но, как показывают результаты, сборщики и пользователи "Raptor Lake" могут выдохнуть с облегчением – мы рады сообщить, что при переходе на PCI-Express 3.0 x16 (что то же самое, что и Gen 4 x8) карта GeForce RTX 4090 теряет в производительности ничтожно мало. На разрешении 4K Ultra HD эти потери в среднем составляют всего 2%, и даже на более низких, CPU-зависимых разрешениях не превышают 2-3%. Если говорить об отдельных тестах, то мы можем отметить только одну игру, в которой потери в скорости были существенными: это Metro: Exodus, где на разрешении 4K UHD частота кадров упала на 15%; на других разрешениях потери были примерно такими же.
Раньше правило "ниже разрешение – выше частота кадров – больше потери от сокращения пропускной способности PCIe" работало всегда, но сегодняшние результаты показывают, что в некоторых играх дело обстоит иначе. Например, в Elden Ring, Far Cry 6 и Guardians of the Galaxy явно прослеживается тенденция к более существенным потерям в скорости на более высоком разрешении. Все эти игры довольно новые и работают на современных движках с DX12, и, по-видимому, имеют какие-то отличия в алгоритмах. Мы предполагаем, что, в то время как другие игры передают для каждого кадра примерно одно и то же количество данных и поэтому более чувствительны к пропускной способности интерфейса на высокой частоте кадров, в этих новых играх передаваемое количество данных определяется главным образом оригинальным разрешением рендеринга. Поэтому, когда вы переходите с разрешения 1080p (8 МБ/ кадр) на 1440p (14 МБ/ кадр) и далее на 4K (32 МБ/ кадр), посекундное увеличение объема трафика за счет роста количества данных в каждом кадре оказывается больше, чем его уменьшение за счет снижения частоты (количества) кадров.
Мы также протестировали RTX 4090 с конфигурацией PCI-Express 2.0 x16. Эквивалентную пропускную способность вы получите, если установите эту карту на старую платформу с PCIe Gen3 x8 (например, в компьютер с APU AMD Ryzen 3000G) или случайно подключите ее к одному из электрических слотов PCIe Gen4 x4 вашей материнской платы (этим вы не перегрузите шину чипсета, которую на платах Intel Z690 и Z790 расширили до DMI 4.0 x8). И такую же пропускную способность будут обеспечивать док-станции для eGPU с портами Thunderbolt или USB4: скорость 80 Гбит/с соответствует конфигурации PCI-Express 4.0 x4. Здесь потери в производительности немного существеннее: на разрешении 4K UHD в среднем 8% и целых 18% в Metro: Exodus.
Больше из научного интереса, но мы протестировали еще и конфигурацию PCI-Express 1.1 x16: такую пропускную способность видеокарты использовали примерно 16 лет назад. Эту пропускную способность вы получите со старой графической док-станцией, когда подключите ее через Thunderbolt3 40 Гбит/с к слоту PCI-Express 3.0 x4. Некоторые игры на такой конфигурации пошли хорошо, но в целом потери в производительности здесь достаточно весомые: в среднем 19% на разрешении 4K UHD. В некоторых случаях они могут доходить до 30% – тогда вы теряете почти треть производительности и оказываетесь на уровне RTX 3090 Ti с Gen4 x16.
Итак, если вы счастливый обладатель процессора Ryzen 7000 "Zen 4" – можете смело собирать машину. Независимо от модели материнской платы и чипсета вы получите всю пропускную способность, обеспечиваемую интерфейсом Gen4 x16 вашей видеокарты, и при этом сможете воспользоваться преимуществами слота NVMe Gen5 x4 для новейших SSD, который не будет забирать линии PCIe от графического слота x16. Если же вас вдохновляет 13-е поколение Core "Raptor Lake" и при этом вы собираетесь пользоваться только NVMe SSD Gen4, подключайте эти накопители к слоту M.2, соединенному с чипсетом, или к слоту M.2, соединенному с процессором через интерфейс NVMe Gen4 x4, но избегайте использовать слот Gen5, потому что он заберет половину линий PEG-слота x16 и вы потеряете пару процентов в частоте кадров (ни за что ни про что). Но если через несколько месяцев у вас будет NVMe SSD Gen5, тогда стоит использовать слот Gen5 и на платформе 13-го поколения Intel Core: минус 2% в скорости графики – вполне приемлемая плата за дополнительные 10 ГБ/с к скорости накопителя, которые могут пригодиться в работе с медиаприложениями и т.д.
Если вы используете графические док-станции, обратите внимание на пропускную способность предлагаемых ими опций подключений. Порт Thunderbolt3 обеспечивает 40 Гбит/с, что соответствует конфигурации PCI-Express 1.1 x16, так что здесь готовьтесь потерять треть производительности видеокарты. Более новые модели док-станций предлагают интерфейсы Thunderbolt4 или USB4, которые поддерживают скорости до 80 Гбит/с – это уровень PCI-Express 2.0 x16 или 3.0 x8. Здесь потери в частоте кадров будут в пределах 15-20%, что более-менее приемлемо.
Источник: www.techpowerup.com