Каталог
Еще о технологиях GDDR5: коррекция ошибок памяти и температурная компенсацияКак мы сообщали ранее, контроллер памяти GDDR5 в AMD Cypress отныне поддерживает большинство возможностей, предусмотренных спецификациями GDDR5. Речь идет не только о возросшей энергетической эффективности. В AMD поработали и над тем, чтобы платы могли достигать более высоких частот по памяти, а значит, и иметь большую пропускную способность. Главное из усовершенствований связано с механизмом коррекции ошибок. Одна из самых больших проблем, с которой приходится сталкиваться разработчикам при проектировании устройств с поддержкой столь скоростного типа памяти, как GDDR5, является необходимость в одновременно быстрой и широкой шине. Обычно эти параметры лежат по разные чаши весов, но в случае с пятым поколение GDDR их необходимо сочетать. Каждый чип GDDR5 на Radeon HD 5870 использует 32 контактные площадки для соединения с GPU и работает на базовой частоте в 1.2 ГГц. Это значит, что шина должна иметь чрезвычайно маленькие допуски и высокую точность. А ведь таких чипов, расположенных на многослойном текстолите карты, целых восемь, и общая разрядность составляет 256 бит. На таких частотах особенно при высокой плотности контактов и сложном алгоритме работы (ведь 1.2 ГГц соответствуют 4.8 эффективных гигагерц) очень тяжело избежать взаимных помех и наводок. Из-за подобных сложностей, связанных с созданием такой шины, именно она является слабым местом видеокарт с GDDR5. Сам контроллер памяти в кристалле графического процессора способен на большее, чипы памяти также могут достигать повышенной частоты, а «бутылочным горлышком» является именно способ соединения чипов и контроллера. Для того, чтобы справляться с негативными последствиями описанных выше причин, КП производят базовые операции по нахождению ошибок, как при чтении, так и при записи, с помощью встроенной функции хэширования CRC-8. Когда эта функция активна, то для каждых 64 бит переданных данных через специализированные выделенные 4 EDC контакта высчитывается и передается 8 бит хэша Cyclic Redundancy Check. Затем значение CRC используется для сверки хэша переданного контента на выходе, и на входе, чтобы определить, не произошло ли при передаче ошибок. Для GDDR5 точность определения CRC функцией ошибок в 1 и 2 битах составляет 100%. Чем больше битов передано с ошибками, тем ниже точность их распознавания. Это обусловлено используемым алгоритмом создания хэша, конкретной реализации CRC. По сути, это означает, что теоретически возможно такое совпадение, что хэш для выходных данных совпадет с хэшем некорректно переданных входных, и ошибка не будет найдена. Тем не менее, по статистике именно 1 и 2 битовые ошибки встречаются чаще всего. Если ошибка будет определена, контроллер GDDR5 запросит повторную передачу неверно принятых данных, и, пока информация не будет доставлена корректно, процесс будет повторяться. Также запрос на повторную передачу реинициализирует связь контроллера с чипами (это происходит в новой реализации GDDR5 у AMD довольно быстро), для того, чтобы исправить потенциально возникшие по вине внешних факторов проблемы. Это делается без каких-либо дополнительных операций вроде понижения частоты. Однако, если ошибки продолжают появляться и отслеживаться на установленных частотах, постоянные повторные запросы на передачу данных снизят итоговую производительность платы. Об этом стоит помнить при разгоне. Наконец, следует акцентировать внимание на том, что данная схема работает только для определения ошибок, возникших по вине самой шины. Ошибки в самих чипах GDDR5, или же в контроллере, не распознаются, таким образом, отсутствие проблем во время самого процесса передачи еще не гарантирует корректности данных. Кроме того, как вы уже поняли, схема только лишь находит ошибки и не способна исправлять их на лету; при обнаружении неверных битов они просто передаются еще раз. То есть, оценивая данный алгоритм здраво, сложно признать его эффективным. Оказывается, что, несмотря на все трудности создания и работы высокоскоростной шины для соединения модулей и контроллером, стандартом не предусмотрено обязательное наличие механизма определения ошибок, он может быть отключаемым (именно это свойство использовано в состоянии покоя). По словам AMD, карты в любом случае должны быть до запуска в массовое производство отлажены так, чтобы никаких ошибок ни на номинальных, ни на разумно повышенных частотах, не наблюдалось. Иными словами, описанный выше механизм определения ошибок является скорее страховочным средством, нежели необходимым для достижения высоких частот механизмом. Так, крупный производитель памяти Qimonda в своих инструкциях дает лишь рекомендательный характер к использованию, говоря о возможных проблемах из-за хранения в памяти частей исполняемого кода. Ведь ошибки при работе с ним чреваты более серьезными последствиями (вроде вылета программы), нежели просто пикселем неверного цвета. Так что при нормальном режиме функционирования видеокарты, механизм попросту простаивает, осуществляя пассивный мониторинг. Кроме того, AMD были предприняты меры по улучшению разводки PCB, и, хотя число слоев платы осталось неизменным по сравнению с RV770, референсная карта Cypress должна достигать более высоких частот по памяти без появления ошибок. Кстати, как и в случае с новым блоком, на аппаратном уровне отслеживающим состояние VRM, изменения в механизме работы памяти должны ощутить на себе оверклокеры. Ранее при переразгоне карт, в тестах и играх просто начинали сыпаться ошибки и артефакты изображения. При первых признаках появления таких недугов следовало откатываться на предыдущее оттестированное стабильное значение. Теперь же, благодаря внедренному механизму коррекции ошибок, традиционный способ перестает быть работоспособным. Отныне вместо некорректного рендеринга изображения следствием переразгона будет служить падение производительности. Значит, при оверклокинге, помимо стандартных отслеживаемых параметров, необходимо будет постоянно тестировать и производительность карты. В идеальном варианте AMD могла бы предоставить пользователям фирменную утилиту, которая выдавала бы статистику по активности внедренного механизма коррекции ошибок памяти. На основании ее показателей можно было бы точно определить предел стабильных частот. Однако пока что это лишь наши фантазии. Итак, мы уже выяснили, что теперь контроллер памяти GPU способен снижать частоты во время простоя, задействовать механизм коррекции ошибок под нагрузкой, отключать его при необходимости; что инженеры AMD провели редизайн печатной платы с целью повышения порога стабильности работы. Однако, как оказывается, это еще не все. Помимо уже описанных функций механизма отлавливания ошибок он дополнительно способен следить за температурой чипов и при необходимости вновь мгновенно инициализировать связь GPU с чипами. Дело в том, что GDDR5 намного более чувствительна к перегреву, чем прошлые реализации Graphics Double Data Rate памяти. При нормальных условиях эта чувствительность ограничивала бы максимальные частоты работы, потому что постоянные изменения в скорости работы модулей при скачках температур делали бы невозможным сохранение стабильного соединения между памятью и КП GPU. Теперь же соединение может с минимальной задержкой реинициализироваться, как только наблюдается тепературный сдвиг, и более высокие тактовые частоты становятся достижимыми благодаря оперативному предотвращению сбоев шины. Хотя описание этой возможности звучит довольно просто, это не означает, что функция не важна. Мы уже несколько раз повторяли, что именно шина в прямом и переносном смысле является узким местом между чипами памяти и контроллером, а значит, малейшие усовершенствования (хотя и они дают довольно трудно) могут способствовать улучшению ситуации и достижению более высоких тактовых частот, а значит, и пропускной способности. [N14-Новый алгоритм анизотропной фильтрации] Уже несколько лет подряд можно наблюдать постоянное, но довольно медленное улучшения качества анизотропной фильтрации. Первые реализации алгоритмов как ATI, так и nVidia очень сильно зависели от угла наклона текстур. Многие издания даже проводили точные сравнения карт обоих производителей для того, чтобы определить, какие плоскости лучше удаются конкурирующим изделиям. В любом случае, какие бы сравнения не проводились, было очевидно, что была приемлема лишь анизотропная фильтрация высоких уровней. Однако время шло, и уже на прошлом поколении видеокарт качество анизотропии можно было назвать очень хорошим. NVIDIA почти вплотную приблизилась к созданию независимой от углов наклона фильтрации, AMD отставала ненамного. Тем не менее, ни одну из них нельзя было считать идеальной, хотя обе были хороши.
Видно, что у обоих производителей было, что улучшить. И AMD смогла достичь, казалось бы, еще недавно невозможного – с серией HD 5000 компания внедряет практически совершенный алгоритм, по-настоящему и полностью независящий от углов наклона. В прошлом остались различные трюки по улучшению качества и оптимизации. Взгляните сами:
Как хорошо видно, MIP уровни в нашем матером D3D AF тестере расположены по идеальным окружностям, что и является признаком независимой от угла наклона анизотропной фильтрации. С таким алгоритмом AF AMD однозначно побеждает NVIDIA на данный момент. Естественно, грядущий конкурент от калифорнийской корпорации наверняка обзаведется не менее эффективным и качественным алгоритмом анизотропии, но первой здесь все-таки, как и в случае с битмтриммингом DTS-HD MA или Dolby True HD, стала именно AMD. Лирическое отступление. Описывая многогранные изменения, которые произошли в RV870 по сравнению со своим предшественником, просто поражаешься, насколько был улучшен и без того удачный чип. Причем улучшен не только с точки зрения увеличения производительности (а ведь изначально Cypress многие воспринимали как удвоенный RV770), но и по множеству дополнительных, незаметных на первый взгляд мелочей. Именно такое внимание к деталям формирует мнение о продукте, и видеокарты здесь не исключение. Интересно, что AMD говорит о том, что скорость фильтрации при возросшем качестве осталась на прежнем с серией HD 4000 уровне; значит, существенного влияния на производительность активация AF производить не должна. При этом, однако, в реальных приложениях довольно сложно увидеть разницу между фильтрацией старого и нового поколений. Но это, естественно, не является недостатком HD 5870 и сходных карт – просто и старый алгоритм был очень эффективным, а новый доведен до совершенства. [N15-Возвращение Supersample AA] За годы существования различных техник сглаживания, методы антиалиасинга на видеокартах претерпели многочисленные изменения. На ускорителях первых поколений, таких как 3Dfx Voodoo 4/5, или решений ATI и NVIDIA с поддержкой DirectX 7, существовал по сути лишь один тип сглаживания – суперсемплинг. Его принцип был чрезвычайно прост. Картинка рендерилась в более высоком, чем у дисплея, разрешении, и затем масштабировалась до нужных размеров. Качество таких трансформаций было очень высоким – не только исчезали режущие глаза лесенки алиасинга, но и само изображение в целом становилась чуть более качественным благодаря тому факту, что изначально создавалась в более высоком разрешении. Однако суперсемплинг слишком сильно ударял по производительности, особенно на картах тех лет и не мог найти широкого применения из-за слишком сильной потери в скорости. Требовался новый, более совершенный алгоритм, и им стал мультисемплинг. Вместо того чтобы отрисовывать всю сцену в более высоком разрешении, обрабатывались лишь края полигонов для нахождения, и последующего устранения эффекта алиасинга. Общий уровень качества был не столь высок, однако скорость работы MSAA в разы превосходила суперсемплинг, причем разрыв только увеличивался с усовершенствованием технологии. Со временем стало понятно, что MSAA не слишком качественно выполняет свою работу на фоне улучшения прочих характеристик видеокарт, требовалась переработка мультисемплинга. Здесь суперсемплинг пережил свое второе рождение в виде новых адаптивных технологий ATI и NVIDIA, затрагивающих только определенные части кадра, Adaptive Anti-Aliasing(AAA) и Supersample Transparency Anti-Aliasing(SSTr) соответственно. В таком случае, SSAA использовался для сглаживания полупрозрачных текстур, ведь они были источником артефактов алиасинга, а MSAA не мог их обрабатывать потому, что они не являлись полигоном (AA мог применяться на краях объектов, для этого и был нужен дополнительный режим). Это все еще не полностью исправило все недостатки MSAA, но хотя бы проблем с прозрачными текстурами более не наблюдалось. Например, MSAA была не способна сглаживать шейдерные эффекты, что, скажем, выливалось в невозможность включения HDR+AA на GF седьмой серии. Словом, пертурбаций на пути развития AA было много. Чего только стоит крайне неудачный перенос функций сглаживания в R600 со стандартных ROP на шейдерные процессоры, из-за чего случались заметные потери производительности при включенном сглаживании на картах серий Radeon HD 2000 и 3000. Затем, правда, в AMD одумались, вернув базовый MSAA антиалиасинг на ROP, и задействовав потоковые процессоры только для прогрессивной постобработки картинки методом CFAA с фильтрами типа edge-detect. Стоит отметить, что в серии HD 5800, последние описанные алгоритмы сглаживания, которые, к слову, разумно жертвовали производительностью в угоду высокому качеству, были дополнены самым настоящим суперсемплинговым антиалиасингом, давно исчезнувшем из современных карт. Теперь у продвинутых геймеров вновь есть выбор между более быстрым сочетанием MSAA+AAA (в его различных вариациях), или же старый добрый полноэкранный SSAA антиалиасинг. В AMD посчитали данное действие разумным потому, что в действительности у карты огромная вычислительная мощность, которой можно позволить себе даже несколько поразбрасываться. К тому же, если производительности в самых новых, графически сложных играх и будет не хватать для этого режима, можно воспользоваться более легкой, но менее качественной техникой, которая была разработана еще для RV770. А в играх прошлых поколение SSAA хотя и скажется на производительности серьезно, но вряд ли непрофессиональные геймеры почувствуют разницу между 300 и 150 FPS на средних ЖК мониторах с частотой развертки в 60 Гц. Тогда как на глаз разница между CFAA и MSAA все же заметна. К тому же, MSAA попросту заблокирован для DirectX 10 и 11 игр, так что «старые игры» здесь ключевое слово. Тем не менее, ограничение сферы использования суперсемплинга DirectX 9 и OpenGL оправдано и закономерно – в играх с более новыми движками падение скорости было бы слишком серьезным. Запуск DX10 или DX11 игры с активированным SSAA автоматически вызовет переключение драйвера на одну из разновидностей MSAA. К тому же не стоит забывать, что в среде DirectX 10 и 11 у разработчиков есть более тонкие инструменты для сглаживания изображения, нежели способен дать драйвер. Ни для кого не секрет, что, например, в играх с использованием отложенного рендеринга, выставляемое из драйверов карт сглаживание вообще на деле не применяется. Для того чтобы таких несовместимостей было как можно меньше, AMD заблокировали SSAA для RV870. Тем не менее, компания обещает в будущем искать возможности активации этого режима для тайтлов DX10/11, но не стоит ждать такого нововведения в скором времени. К сожалению, наше тестирование показало, что режим SSAA на RV870 требует доработки. Для сравнения качества мы решили использовать одну из начальных сцен второго эпизода Half Life 2, насыщенную предметами, на которых хорошо виден алиасинг, - металлическими бочками, машинами и деревьями. Хотя, как это хорошо видно на паре нижних скриншотов, SSAA на HD 5870 полностью избавил картинку от лесенок, он ее к тому же довольно серьезно замылил. Это является в прямом смысле недоработкой – хотя суперсемплинг действительно должен придавать изображению мягкости, убирая алиасинг на всех сложных объектах, он никак не предназначен для создания дополнительного неуместного блюра.
После более подробного исследования проблемы оказалось, что дело здесь в баге движка Source, на котором базируются игры из используемого нами The Orange Box, а не в реализации SSAA в последней версии Catalyst. AMD надеется в скорейшем времени выпустить баг-фикс, устраняющий данное недоразумение, но сам факт не идеальной работы SSAA в первом же выбранном тесте говорит о несовершенстве технологии. К тому же игры на базе Source ограничены мощностью CPU, а не видеоподсистемы, а значит являются отличным кандидатом для использования суперсемплинга. «Но стойте!» - Скажете вы. - «Разве у NVIDIA нет реализаций SSAA? Как работают они?» По большому счету, замечание верное. Хотя официально SSAA не поддерживается уже на протяжении нескольких лет, из драйверов данная возможность полностью вырезана не была, и ее можно активировать в Direct3D играх посредством различных утилит вроде nHancer. На деле же SSAA от NVIDIA не может быть сравним по качеству с имеющейся у ATI, и вот почему. На верхней схеме показан DX9 FSAA вид реализации режима 4x SSAA. Обратите внимание, что сетка с четырьмя геометрическими (красными) и четырьмя (зелеными) текстурными семплами повернута под углом. Чуть ниже – 4x MSAA от NVIDIA на GeForce GTX 280 с четырьмя геометрическими, и одним текстурным семплами. Наконец, на третьем рисунке – ровная сетка из четырех геометрических и текстурных семплов. Не будем углубляться в причины, почему уже давно используются повернутые сетки, но качество стандартной ровной матрицы будет однозначно хуже. Скриншоты подтвердят это теоретическое утверждение. На самом деле, запустив HL2: Episode 2 на карте NVIDIA в режиме SSAA, мы столкнулись с еще большем ухудшением качества изображения, чем у официально поддерживаемого SSAA у ATI. Сложно сказать, вызвано ли это именно стандартным расположением семплов, не использующимся уже давно, но вероятность этого велика, что бы ее игнорировать. Если сравнить эти два скриншота, видно, что картинка с MSAA 4x практически идеальна, за исключением малозаметных артефактов в нижней/боковой частях вагончика. Если переключиться на 4x SSAA, эта лесенка исчезнет, однако появится другая проблема – ухудшившееся сглаживание прицела, и, что хуже, попросту исчезнувшие ветви деревьев. Тогда как MSAA аккуратно сгладил контрастные переходы, убрав все артефакты, SSAA попросту удалил их с изображения. По этой причине мы не рассматриваем SSAA сглаживание у NVIDIA и не сравниваем его с вариантом AMD. Во-первых, такой режим официально не поддерживается, а во-вторых, качество сглаживания при его активации страдает. Скажем больше – хотя мы и не приводим прочих скриншотов, нам встретились игры, в которых FSAA NVIDIA вызывал еще большие проблемы, чем в HL2. Таким образом, этот заблокированный режим вряд ли подходит для нормального использования. Возможно, ситуация изменится позже с выходом Fermi, но на данный момент SSAA – дополнительный микроплюс новинки от ATI, которому у NV на данный момент нечего противопоставить. [N16-Качество антиалиасинга и скорость его работы] Так как мы выяснили, что HL2 несколько некорректно работает с SSAA, для подробного исследования качества во всех режимах мы выбрали Crysis: Warhead, у которого никаких проблем ни с одним типом сглаживания не наблюдалось. Графика Warhead не только сложна для рендеринга, но и насыщена объектами, на которых эффект алиасинга хорошо заметен. На нашем конкретном примере стоит обратить внимание на листья слева и справа от ветрового стекла автомобиля, на установленную на крыше турель, а так же на боковое стекло в двери и зеркало заднего вида. Помните, что, так как текущая реализация AMD SSAA не работает с DX10 играми, в Crysis мы использовали DirectX 9 режим. Radeon HD 5870: Radeon HD 4890: GeForce GTX 280: С точки зрения качества изображения трудно увидеть серьезную разницу между AMD Radeon HD 4890 и 5870 в соответствующих режимах. На наш взгляд, с включенным MSAA+AAA качество полностью одинаковое (что и логично – ведь никаких заявлений о переработке алгоритмов AA в RV870 относительно RV770 сделано не было). И, хотя карты разных вендоров несколько иначе отображают картинку (яркость неба разнится), работу по антиалиасингу все платы проводят образцово. Для AMD негативной стороной проведенного теста качества картинки является тот факт, что сложно говорить о превосходстве SSAA над MSAA+AAA. Ранее мы утверждали, что SSAA является превосходным (несмотря на свою «грубую силу») методом сглаживания, однако нам не удалось найти ни единой сцены из игры, где это утверждение было бы доказано на практике. Никаких бонусов от изначального рендиринга в более высоком разрешении в Crysis: Warhead попросту не было обнаружено. Можно утверждать, что пара MSAA+AAA (или в случае с NVIDIA – MSAA+SSTr) работает в подавляющем большинстве случаев так же хорошо, как и FSAA. Как и в случае с разными алгоритмами анизотропной фильтрации, независящий от углов наклона текстур принцип AF теоретически должен обеспечивать лучшую фильтрацию, однако увидеть это вживую порой сложно. При этом не стоит забывать, что та же самая angle-independent анизотропная фильтрация не роняет производительность так сильно, как это делает SSAA по сравнению с MSAA+AAA. Может быть, суперсэмплинговый антиалиасинг станет панацеей от артефактов в низких разрешениях? Тогда его использование будет определенно оправдано в тех играх, где движок не поддерживает установку современных высоких разрешений. Что касается замеров производительности, вашему вниманию предлагаются две диаграммы. На первой – результаты одной только лишь HD 5870 в HL2, которые мы получили еще до того, как узнали о существовании бага в Source, ухудшающего визуальное качество SSAA. Хотя мы уже говорили об артефактах изображения в играх, построенных на базе Source, похоже, что цифры производительности в обоих режимах верны, и могут служить ориентиром для относительно старых игр. В качестве подтверждения теоретически огромной мощности 5870, даже в 2560x1600 с 8x SSAA карта была способна обеспечивать играбельный фреймрейт в HL2. Только представьте – в таком режиме карта отрисовывает каждый кадр в 32 Мп разрешении, а это даже больше, чем максимально возможное разрешение для шестерки самых крупных дисплеев, объединенных в Eyefinity! Второй наш тест производительности был проведен в DirectX 9 режиме Warhead и разрешении 1920x1200. Так как тест посвящен не конкретному исследованию производительности различных плат с AA, а именно разнице между архитектурами, мы ограничили число участников до Radeon HD 5870, HD 4890 и GeForce GTX 280. Цель данной диаграммы – наглядно представить соотношение производительности и качества AA, а так же показать, как теряют в скорости различные чипы при включении сглаживания. Больше всего нас, конечно же, интересуют результаты 5870. Итак, при переходе от 0x AA к 4x MSAA теряется лишь 20% производительности, что является более чем приемлемой величиной. А вот активация 8x MSAA существеннее осаживает скорость – на 35% (80% от производительности карты с 4x MSAA). Интересно, что, хотя выбранная нами для сравнения сцена очень насыщена, разницы в скорости работы адаптивного AA и MSAA практически нет. Конечно, SSAA серьезно проигрывает здесь в скорости работы, играть в таком режиме невозможно (и это притом, что разницы в качестве между SSAA и MSAA+AAA мы не смогли уловить). Переходя к Radeon HD 4890, мы видим несколько иную картину. Хотя RV790 выдает меньшее количество кадров в секунды в любых режимах, при активации MSAA сглаживания теряется лишь 17% производительности для 4x MSAA и 25% для 8x MSAA (92% относительно 4x). Опять же, изменения от включения AAA минимальны, лишь около 1 FPS. Наконец, GTX 280. На этой карте относительное падение производительности при использовании сглаживания примерно повторяет картину на HD 5870; 20% для 4x MSAA, 36% для 8x MSAA (на 20% медленнее 4x MSAA). Как и в случае с AAA на 5870, активация SSTr снижает фреймрейт всего на один кадр в секунду. Такое положение дел достаточно удивительно. В процентном соотношении HD 5870 выглядит не лучше GTX 280, но в этом ничего иррационального нет. Странно другое – при схожей архитектуре потери производительности новинки сильнее при активации сглаживания, чем у HD 4890. У нас нет четкого объяснения этому явлению на данный момент. Возможно, виноваты ранние версии драйверов. Посмотрим, как проявят себя карты с AA в будущих тестированиях. Подытоживая данный раздел, говорить столь позитивных слов о Cypress, как в случае с улучшением энергетической эффективности, или же новыми мультимедийными возможностями, не хочется. К сожалению, новая реализация SSAA не стала чем-то грандиозным и впечатляющим, да и в старых режимах сглаживания RV870 почему-то теряет больше производительности, чем предшественник. Особенно это странно на фоне того, что на презентации HD 5870 AMD приводила данные, согласно которым благодаря увеличению внутренних кэшей GPU скорость работы AA должна была, наоборот, возрасти. В любом случае перед тем, как делать окончательные выводы, стоит посмотреть на результаты новинки в прочих играх, не ограничиваясь Crysis: Warhead, и подождать обновленных версий драйверов. [N17-Тестовая конфигурация и программы]
Согласно официальным слайдам с конференции AMD, Radeon HD 5870 способен побить двухчиповую GTX 295. В этом тесте карты оказываются крайне близки, однако небольшое превосходство остается за двухчиповым флагманом NVIDIA. К сожалению, чтобы по-настоящему комфортно играть в Warhead в разрешении 2560x1600 с выкрученными на максимум ползунками, до сих пор недостаточно даже пары high-end карт вроде GTX 280 SLI, или 5870 CrossFire! Ведь используемый нами бенчмарк Frost – записанная скриптованная сцена, а сочетание настроек графики Gamer + Enthusiast – не высший уровень для Crysis. Естественно, с понижением разрешения ситуация меняется, число FPS возрастает до вполне приемлемого уровня. Тем не менее, пара GT200b все же несколько быстрее RV870. [N19-Far Cry 2] Еще один насыщенный тяжелой графикой шутер. К счастью, его требования не столь высоки, как у Warhead (хотя изображение впечатляет порой так же сильно), и с одиночными картами даже в самом высоком разрешении и максимальными настройками можно достичь отличных показателей. В отличие от Crysis, Far Cry 2 демонстрирует нам некоторые интересные моменты касательно 5870. Во-первых, карте удается обойти GTX 295. Во-вторых, в сражении с другим многочиповым GPU прошлого поколения, 4870X2, последний оказывается сильнее. Никакие другие одночиповые карты сравнения с HD 5870 не выдерживают. Ближайшего соперника GTX 285 Cypress опережает более чем на 40%. Интересно, что второй раз подряд CrossFire из пары HD 5870 оказывается вне конкуренции. Похоже, начинает формироваться четкая тенденция. На наш взгляд, для игры, на которую AMD тратит так много маркетинговых сил и средств, в Battleforge RV870 выглядит не самым лучшим образом. Так, 5870 несколько проигрывает Radeon HD 4870X2 и заметнее отстает от GTX 295. Даже GTX 285 повержен без тотального превосходства – 5870 лишь на 20% быстрее него. В тоже время, 5870 CF вновь оказывается «царем горы». Игра качественно оптимизирована под многочиповые конфигурации, и эффект от CrossFire и SLI хорошо заметен. Одно из лучших выступлений HD 5870! Карте удается обойти не только GTX 295 и 4870X2, но и потенциально более производительную связку из GTX 275 в SLI. Только лишь SLI из двух GTX 285 и пара 5870 оказываются в WoW сильнее одиночной платы с RV870 на борту. В тоже время, 5870 CF подтверждает свой титул чемпиона и самого быстрого графического тандема на сегодняшний момент. Остается только догадываться, насколько мощной окажется готовящаяся к выходу 5870X2... [N22-HAWX] HAWX является еще одной игрой, не сильно упирающейся в мощные GPU, так что можно ожидать высоких результатов. В данном тесте 5870 обходит все одиночные карты, однако снова испытывает некоторые проблемы в конкуренции с двухчиповыми платами. Так, 4870X2 и GTX 295 оказываются примерно на 15% быстрее Cypress. Если же посмотреть на ситуацию с другой точки зрения, с 68 FPS проигрыш 5870 многочиповым GPU из прошлого поколения становится чисто номинальным. На первой строчке чарта уже ожидаемо располагается CrossFire из Radeon HD 5870. Здесь, как и в World of Warcraft, HD 5870 раскрывается в полную силу. Результаты нового Radeon существенно лучше, чем у 4870X2. В то же время, оказывается поверженным и GTX 295. К сожалению, DoW II очень плохо реагирует на наличие нескольких видеокарт в системе, независимо от того, используется ли CF или SLI. Так что фактически результаты соревнования в данной игре для multi-GPU некорректны. Так, для CF AMD в лучшем случае наблюдается минимальный выигрыш, а в худшем – даже потеря производительности. К слову – это единственная игра из нашего тестирования, в которой 5870 CF не оказался самым быстрым. Вновь находит подтверждение уже сложившаяся в предыдущих тестах картина. С текущими версиями драйверов, Radeon HD 5870 с легкостью обходит любую из существующих одночиповых карт. Однако справится с многочиповыми решениями на базе GT200 и RV770 карте удается не всегда. Так, в Resident Evil 5 GTX 285 отстает от RV870 как минимум на 33%, однако 4870X2 оказывается быстрее Cypress на 10%. В тоже время, 5870 CF вновь достигает поразительных высот, на этот раз превосходя ближайшего конкурента на ощутимые 36 FPS. NVIDIA вложила много сил в продвижение этой игры на PC под брендом своей программы The Way It’s Meant to Be Played, что выразилось в поддержке PhysX и 3D Vision (кстати, вторая технология доступна и в RE5). К сожалению, маркетинг распространился не только на фирменные технологии, но и на доступные режимы сглаживания. Антиалиасингом можно управлять только из внутриигрового меню, при этом карты AMD не поддерживаются. Даже при форсировании сглаживания через драйвер можно выбрать только полноэкранное суперсэмплинговое сглаживание, а оно, как мы знаем, намного менее эффективно, чем MSAA с дополнительными надстройками. По этой причине, Batman: AA – единственная игра, в которая тестировалась без использования сглаживания. С выключенным антиалиасингом производительность в данном бенчмарке оказалась просто умопомрачительной. 5870 оказался способен выдать 102 кадра в секунду, а CrossFire практически удвоил это достижение с 196 FPS. Тем не менее, побить двухчиповые карты RV870 вновь не удалось. Вновь 5870 подтверждает свой королевский титул среди одночиповых видеокарт, обходя GTX 285 на 36%. Даже 4870X2 оказывается поверженным. Чего, правда, не скажешь о GTX 295, который на 8% превосходит новинку ATI. Опять же, в абсолютных величинах разница совершенно незначительная, так как все эти карты выдают более 100 FPS. Интересно, что 5870 в CrossFire не удается достичь своего обыкновенно более впечатляющего превосходства – GTX 285 SLI лишь на 9% медленнее пары Radeon HD 5870. Согласно результатам нашего тестирования, энергопотребление всей системы с 5870 без нагрузки составило 141 Вт, что на существенные 42 Вт меньше чем у 4870 или 4890. Разница становится еще более ощутимой, если сопоставить энергопотребление карт, которые соответствуют друг другу по производительности. В этом случае 5870 оказывается на целых 63 Вт менее горячей, чем 4870X2. Фактически лишь куда более медленные карты вроде GTS 250 или Radeon HD 3870 потребляют меньше энергии, чем 5870. Находят подтверждения и заявления AMD о проделанной работе над энергопотреблением в CrossFire режиме. По официальным данным, вторая карта CF в покое добавляет системе 20 Вт относительно лишь одной платы с RV870, по нашим замерам этот показатель составил 23.5 Вт. С учетом погрешности измерений можно признать обещание выполненным. Переходя к показателям энергопотребления под нагрузкой, мы приводим результаты двух тестов. И первый из них – OCCT. Внимательные читатели наверняка возразят: «Ведь OCCT блокируется драйверами для RV770, да и у RV870 может вызвать при опасности VRM троттлинг!» Да, это действительно так, но факт состоит в том, что даже при активном троттлинге на картах 4000 и 3000 серии посредством драйверов и наличии аппаратной защиты от перегрева на HD 5000 именно в OCCT нам удалось зафиксировать самые высокие цифры энергопотребления. Оценивая их, следует помнить, что в среднем даже в тяжелых графических режимах RV870 будет потреблять меньше энергии, однако в теории аппетиты карты могут возрасти даже выше представленных показателей. Несмотря на наличие троттлинга для 4000 серии Radeon HD, 4870X2 и 4890 мгновенно начинают вести себя нестабильно при запуске OCCT; поэтому их результаты не присутствуют на диаграммах. Если вы ранее не доверяли нашим словам о необходимости аппаратного решения проблемы с чересчур высокими токами, на которые не рассчитаны системы VRM плат, вряд ли можно получить более наглядное доказательство. Конечно, по OCCT не следует делать точных и однозначных прогнозов, однако похоже, что 5870 потребляет чуть больше энергии, чем прочие мощные однопроцессорные карты. Система с RV870, показав потребление в 401 Вт, стала наиболее прожорливой изо всех протестированных нами конфигураций. Это ставит ее по аппетитам чуть выше GTX 285, хотя и заметно ниже систем с двухчиповыми платами. В то же время, подтверждая свою самую высокую производительность, CF 5870 оказывается самым жадным до питания с максимальной зафиксированной нагрузкой в 664 Вт. Так что, если вы собираетесь эксплуатировать систему с парой HD 5870, стоит обязательно задуматься о качественном блоке питания. Тоже, в общем-то, справедливо и для одинарного RV870, но в меньшей степени. В подтверждение слов, что OCCT действительно является стресс-тестом, подавая на видеокарты чрезмерную нагрузку, приведем замеры потребления энергии в World of Warcraft: Нетрудно заметить, насколько меньше энергии потребляется любой из рассматриваемых карт в реальных условиях. При этом наиболее требовательными картами среди одно- и многочиповых решений стали GTX 285 и GTX 285 SLI соответственно. 5870 в таком режиме необходимо меньше энергии, чем GTX 275, и лишь немного больше, чем 4870. Теперь обратимся к температурному режиму карт. Все показатели были сняты со встроенных в чипы термодатчиков. С хорошим кулером и низким энергопотреблением в покое результаты HD 5870 должны быть лучше, чем у предшественников. Эта теоретическая выкладка находит свое подтверждение на практике. 5870 охлаждается на 3 градуса лучше, чем 4870. Этого же достаточно, чтобы побить всю линейку GTX от NVIDIA. Стоит заметить, что меньшая температура систем в SLI обусловлена большей частотой вращения вентиляторов в покое, а значит – большим шумом. Все производители карт стремятся не выпускать температуру своих карт за 90 градусов под нагрузкой. При таких высоких температурах речь идет о сохранности и стабильности функционирования чипов, поэтому при достижении критического значения вентилятора всех испытуемых раскручивались на полную мощность. Отрадно, что, хотя слот для выдува горячего воздуха из корпуса на 5870 наполовину перегорожен слотом DVI, это никак не повлияло на качество охлаждения. Наконец, измерим уровни шума видеокарт. Сама система без вращающегося вентилятора на видеокарте генерирует 40.4 дБ. В покое за единственным исключением виде GTX 295 карты производят одинаковый уровень шума. Его характер несколько изменяется в зависимости от применяемой модели вентилятора, но ни один из них нельзя назвать раздражающим. Принимая во внимания пониженное энергопотребление HD 5870 в покое, мы ожидали несколько более тихой работы, но этому ожиданию не суждено было сбыться. Под нагрузкой картина совершенно меняется. Чем производительнее видеокарта, тем громче работает ее вентилятор, и 5870 здесь – не исключение. С 64 дБ под нагрузкой одиночный RV870 является самой громкой платой, уступая лишь GTX 295 и паре 5870 в CF. Надеемся, что в будущем производители смогут несколько улучшить положение дел в данной сфере с помощью кулеров другой конструкции. Нельзя сказать, что 64 дБ это чрезмерно много, шум от карты в реальности сопоставим с той же 4870X2, однако назвать комфортным такой акустический режим вряд ли возможно. [N28-Финальные слова и выводы] Проще всего для любого автора дать заключение по продукту, который является однозначно превосходным по сравнению с конкурентами. Сложнее – когда впечатления от тестирования остались неоднозначными. В случае с 5870 обзор попадает во вторую категорию. Поймите правильно: 5870 является самым быстрым одночиповым GPU, который когда-либо тестировался в нашей лаборатории, причем превосходство ощутимо реально, а не номинально. Если посмотреть на существующий порядок цен (рекомендуемые 379 евро за HD 5870), по своей цене GTX 285 становится совершенно непривлекательной покупкой. Даже серьезное снижение в цене не позволит GTX 285 остаться длительное время на плаву, ведь у AMD в наличии еще и более дешевая карта Radeon HD 5850, которая фактически быстрее GTX 285 при цене в 259 евро. Это вполне нормальная ситуация при смене поколений графических процессоров, и NVIDIA, пытаясь здраво реагировать на конкуренцию, по последней информации, начинает сворачивать производство GT200b, концентрируя все силы на выпуске GF100 и Fermi. Другое дело, что само по себе однозначное превосходство над одиночными картами прошлых поколений не позволяет назвать Radeon HD 5870 лидером. Во-первых, потому, что AMD планировала победу RV870 над GTX 295, а в наших тестах этого не произошло. Карты действительно близки, однако флагман NVIDIA в целом несколько быстрее. Хотя, вряд ли разница в стоимости в 100 евро соответствует 10% разнице в производительности. Во-вторых, потому, что ответа на HD 5870 у NVIDIA пока попросту нет. Безусловно, пока что неизвестно, когда появится Fermi, и какой производительностью в реальных играх он будет обладать, но уже сейчас понятно, что при существующем отрыве RV870 от RV770 HD 5870 будет серьёзным соперником в настоящей конкурентной борьбе. Похоже, что на данный момент HD 5870 просто не раскрывает весь свой потенциал. Происходит это, судя по всему, по вине «сырых» драйверов. Слишком много небольших «но» возникало во время тестирования, обусловленных, скорее всего, именно программными недоработками. Ведь по результатам в некоторых играх видно, что у RV870 огромная вычислительная мощь, которая при правильном использовании и распределении выливается в почти что двухкратное превосходство Cypress над RV770. Но пока что других драйверов, кроме тех, с которыми проводилось тестирование, нет, и это лишь наши догадки, что со временем производительность карты заметно подрастет. Правда, догадки основаны на том факте, что с первым релизом Catalyst Radeon HD 4870 и 4850 также не блистали. Но лишь время покажет, действительно ли софт является сдерживающим фактором для RV870, или же существующая архитектура действительно исчерпала себя, и двухкартное масштабирование RV770 в RV870 произошло с не слишком высоким КПД. В то же время AMD снимает с производства 4870X2, который, по результатам нашего тестирования, оказался способным на равных конкурировать с 5870. Эта фраза, в первую очередь, относится к владельцам «двойного» RV770 – не стоит опрометчиво переходить с двухчиповой видеокарты прошлого поколения на одночиповую HD 5870. Выбирая плату для нового PC, конечно, стоит отдать предпочтение именно Radeon HD 5870. К тому же 4870X2 в скором времени просто невозможно будет купить. Что касается текущих многочиповых решений, здесь все довольно очевидно. Так как 5870 является самый быстрой одиночной картой, тандем из пары RV870 в CrossFire является самой быстрой графической связкой. Это подтверждается и мировыми рекордами, недавно установленными на Radeon HD 5870 в 3D Mark различных версий. Возможно, в каких-то приложениях Quad-SLI из двух GTX 295 и будет быстрее, но это скорее исключение, нежели правило. Все предыдущие выводы подводят нас к основному вопросу: если двухчиповые GPU в текущем виде (не берем во внимание потенциальное улучшение ситуации с выходом новых версий Catalyst) быстрее, чем HD 5870, делает ли это их лучшим выбором? Пожалуй, нет. Несмотря на то, что игры последних поколений научились отменно работать с многочиповыми конфигурациями видеокарт, до 100% поддержки SLI и CF очень далеко. Тому пример – Dawn of War II из нашего набора тестовых игр. Стоит ли говорить, что в более старых играх превосходство будет на стороне одиночной видеокарты. Так что, даже принимая во внимание небольшое отставание в производительности, выбирая между 4870X2/GTX 295 и 5870, мы бы отдали предпочтение последнему, как обладающему лучшим соотношением цены и качества. К тому же не только лишь производительностью важна видеокарта. У AMD в копилке есть важнейшее (в отличие от аморфного DX10.1) функциональное преимущество – полноценная поддержка DirectX 11, так что HD 5870 долгое время будет служить владельцу верой и правдой. Здесь можно провести однозначную параллель с 8800GTX – потребовалось порядка трех лет, чтобы действительно превзойти эту плату по производительности и возможностям (да и сегодня G80 обладает более чем достойной для своего возраста производительностью). По нашим расчетам для AMD Radeon HD 5870 должен стать таким же сильным оружием, как в свое время стал 8800GTX для NVIDIA. Хотя, конечно, для того, чтобы воспользоваться всеми дополнительными DX11 возможностями карты, придется немного подождать выхода полноценных игр, написанных с использованием этого API. А чего стоит возможность вывода сжатого звукового HD потока через HDMI! Пока что ни у одной конкурирующей карты такой функции нет. Фанаты HTPC определенно будут довольны. Как и обеспеченные игроки, которые получат с приобретением RV870 новейшую технологию Eyefinity, которая может обеспечить совершенно иной уровень погружения в виртуальную реальность. Да, зачастую придется повозиться, чтобы заставить полноценно работать Eyefinity, но оно того стоит. Подытоживая все вышесказанное, хочется отметить, что для тех, кто ожидал от 5870 некоторой встряски рынка, покупка нового GPU полностью оправдана. Для тех же, кто предполагал обостренную конкуренцию вместе с быстрым падением цен, как было в случае с RV770/GT200, RV870 не станет откровением. Несмотря на все свои плюсы, HD 5870 не является картой с принципиально новым уровнем производительности или с уникальными возможностями. Справедливости ради стоит отметить, что против Eyefinity и аудио-битстримминга у NVIDIA есть PhysX и 3D Vision, а скоростные характеристики Cypress вряд ли заставят владельцев недавних топовых решений поменять карту. Пожалуй, самое интересное действо начнется, когда на мировой рынок выйдут Radeon HD 5870X2 и младшие HD 5770 и 5750. А пока мы в скором времени рассмотрим и HD 5850 – возможно именно она сможет завоевать наши сердца, улучшив некоторые из потребительских характеристик HD 5870. |
Источник: www.anandtech.com/