Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Понедельник, 28 февраля 2011 13:08

Sandy Bridge — следующий этап в развитии процессоров Intel. Тестирование Core i7 2600K, i5 2500K и Core i3 2100

короткая ссылка на новость:

Разгон, особенности серии «K»



Следящие за индустрией читатели, без сомнения, не раз отмечали, что технический прогресс в отрасли стал чуть ли не синонимом интеграции. Взять хотя бы современные смартфоны — SoC, лежащие в их базе, обеспечивают практически все потребности устройств. По похожему вектору развиваются и центральные процессоры. Когда-то AMD выступила с революционным на тот момент решением по интеграции контроллера памяти на кристалл процессора, а недавно Intel практически перенесла весь северный мост чипсета в классическом понимании этого слова, включая контроллер PCI-Express, в Lynnfield. Sandy Bridge делает следующий логический шаг в этом направлении с переносом на кристалл процессора GPU; ход, который когда-то так хотела сделать первой AMD.

В погоне за интеграцией инженеры Intel сделали еще одно важнейшее изменение в платформе LGA1155: отныне тактовый генератор располагается в чипсетах 6 серии. Еще совсем недавно PLL был частью материнской платы, теперь же и он находится на кристаллах чипсетов. Встроенный генератор задает частоты буквально для всего, от SATA в самом PCH, до PCIe в SNB. Зависимость множества устройств от этой базовой частоты заставила Intel заблокировать значение BCLK, тем самым сделав разгон посредством повышения данного значения невозможным.

BCLK


В случае с Nehalem и Westmere, для оверклокинга достаточно было увеличивать BCLK со 133 МГц до необходимой величины, и иногда «играться» с множителями на понижение для достижения оптимального результата. В Sandy Bridge получить стабильно работающий на более высокой частоте процессор путем изменений стандартной 100 МГц частоты PLL не удастся.

По статистике, максимум, на который можно рассчитывать, это 115 МГц. На практике, в нашем тестировании ни один экземпляр CPU не заработал при установке частоты выше 103-105 МГц. Другими словами, мы только подтвердили теоретические сведения, ведь установка 105 МГц BCLK для i7 2600 дает «головокружительные» 3.57 ГГц вместо стандартных 3.4 ГГц. Так что, способ, к которому нас приучили предыдущие Core i, можно спокойно забывать.

Говорят, что история движется по спирали, и разгон Sandy Bridge тому доказательство. Обратившись к эпохе, предшествующей Pentium II, можно вспомнить, что на тактовую частоту BCLK (или FSB в то время) оверклокеры полагались отнюдь не всегда. В то время, при желании поднять результирующую частоту ЦП, первым делом увеличивали множитель процессора. Позже он был заблокирован на повышение для массовых процессоров на долгие годы, но недавно, с релизом таких CPU, как Core i7 875K, Intel напомнила о прежних методах увеличения производительности. Как вы теперь понимаете, отныне Sandy Bridge с суффиксом «K» будут особенно важны для энтузиастов разгона.

Компания разработала следующую схему. Все процессоры, которые лишены технологии Turbo (например, Core i3 2100), полностью заблокированы. Поднять их частоты не представляется возможным никаким образом. Это плохие новости для потенциальных покупателей, желающих получить как можно больше за меньшие деньги, и хорошие для AMD, так как бюджетные предложения компании будут выглядеть в таком свете более интересно.

Если же вы приобретете процессор, поддерживающий Turbo (например, Core i5 2400), то множитель окажется ограниченно разблокированным, то есть повысить его будет можно, но лишь на четыре единицы относительно максимального Turbo-режима. Следующая таблица поможет лучше понять принцип ограничений:

Limited Unlocked Core


Рассмотрим Core i5 2500. Штатная тактовая частота этого процессора равняется 3.3 ГГц. Когда загружено только одно ядро, чип может повышать частоту до 3.7 ГГц. Получается, что максимальный доступный разгон ограничивается 4.1 ГГц (в том случае, если нет проблем с питанием и охлаждением, а процессор физически способен работать в таком режиме).

Правда, оверклокинг таких чипов целиком и полностью зависит от технологии Turbo. В приведенном выше случае ваш процессор будет работать на 4.1 ГГц только при единственном активном ядре. Если же работой будут загружены все четыре вычислительных модуля, CPU будет ограничен 3.8 ГГц. По имеющимся данным можно судить, что до таких частот будет разгоняться без каких-либо проблем большинство SNB.

Наконец, существует и третий класс Sandy Bridge: полностью разблокированные процессоры серии «K». На момент написания статьи доступно лишь два подобных процессора: Core i5 2500K и Core i7 2600K. Значения их множителей можно свободно варьировать от 16x до 57x. Таким образом, покупатели получают в свое распоряжение единственный доступный для SNB полноценный инструмент разгона, не так давно доступный только на Extreme Edition SKU.

CPU-Z Core i7 2600K


Эти чипы разгоняются очень хорошо. Оба имеющихся у нас Core i5 2500K и Core i7 2600K без труда достигли полностью стабильных 4.4 ГГц, используя штатный низкопрофильный кулер.

Все, что требуется для покорения 4.4 ГГц
Все, что требуется для покорения 4.4 ГГц


Чуть больше усилий, установка производительного воздушного кулера, и оказывается доступен диапазон в 4.6-5.0 ГГц:

Чуть больше усилий, установка производительного воздушного кулера, и оказывается доступен диапазон в


Пока что не накоплена массовая статистика по разгону до таких частот, и говорить о легком повсеместном достижении 5 ГГц мы повременим, но проблем с оверклокингом SNB до 4.5 ГГц быть точно не должно.

За разблокированный множитель, естественно, придется доплатить. Версия 2500K стоит на $11 дороже равночастотного 2500, а 2600K оценивается на $23 дороже i7 2600. В случае с младшей моделью 2500K, мы считаем подобную доплату совершенно оправданной, ведь всего за $11 вы получаете CPU с заделом на будущее и прекрасным разгонным потенциалом, который очень и очень легко реализовать. Да и переплату за 2600K назвать большой нельзя.

Модель Стандартный вариант K-вариант Переплата
Intel Core i7 2600 $294 $317 +$23
Intel Core i5 2500 $205 $216 +$11


В качестве бонуса покупатели процессоров «K» получают более высокопроизводительное графическое ядро Intel HD Graphics 3000 против 2000 версии GPU у стандартных моделей.

По сравнению с Lynnfield, вы платите на $11 больше, чем за Core i7 760, и получаете примерно на 10-45% более высокую производительность даже без учета разгона. В идеальном мире мы бы предпочли видеть все Sandy Bridge разблокированными; чуть менее утопично было бы получить K-серию без наценки относительно стандартных вариантов; однако если отбросить мечты в сторону и посмотреть на вещи разумно, Intel поступила вполне честно, дифференцировав CPU таким образом. Кроме того, если воспринять ситуацию с улыбкой, упрощается рекомендация процессоров для энтузиастов: покупайте любую модель с индексом «K»!

Так как теперь весь разгон зависит исключительно от повышения множителя, теперь не надо заботиться о различных соотношениях, возможностях материнской платы и памяти. На P67/H67 множители памяти полностью разблокированы, а устанавливать их можно без какой-либо зависимости от скорости CPU. Даже частоту GPU можно свободно контролировать без оглядки на связные компоненты. [N5-Новая платформа и чипсеты 6-ой серии] На момент выпуска платформы Sandy Bridge Intel предлагает два типа чипсетов для новых процессоров: P-серии, и H-серии. Как и в случае с Lynnfield, разница между ними состоит в том, что H поддерживает встроенную в процессор графику, тогда как P такой возможностью не наделен.

На этом различия не заканчиваются. P67 дает возможность использовать CrossFire и SLI в режиме 2x8, тогда как H67 не способен разбить предлагаемые контроллером SNB x16 PCIe 2.0 линий для работы с несколькими видеокартами.

На момент выпуска платформы Sandy Bridge Intel предлагает два типа чипсетов для новых процессоров: P


Отметим, что хотя H67 позволяет разгонять память и графическое ядро, он не способен на оверклокинг самого CPU ни в каком виде; поэтому, для разгона Sandy Bridge вам необходима системная плата на основе P67.

SATA3



Если бы SSD не появились на рынке и не стали столь близки к потребителю, как сейчас, мы с вами вряд ли бы задумывались о наличии интерфейса SATA обновленной версии. Ведь для жестких дисков все происходило следующим образом: анонсировали новый стандарт протоколов ATA или SATA, появлялись поддерживающие его контроллеры, затем подтягивались и HDD… Но, на самом деле, производительно практически не менялась — ведь механические драйвы были попросту не в состоянии задействовать огромную пропускную способность. Изредка появлялись исключения, такие как WD Raptor, но в целом эволюция скорости, в отличие от роста объемов, протекала очень медленно.

Твердотельные накопители буквально взорвали этот рынок. Сегодня в продаже присутствует лишь один «домашний» SSD с интерфейсом SATA 6 Гбит/с — Crucial RealSSD C300. Но уже совсем скоро нас ждет целая лавина обновленных накопителей с невиданной ранее скоростью работы, включая продукты на базе ожидаемого SandForce SF-2000. Все они будут требовать для реализации своего потенциала более широкого интерфейса, чем SATA 3 Гбит/с (II поколение).
Intel DP67BG: синие коннекторы SATA справа внизу соответствуют спецификациям 6 Гбит/с, черные — 3 Гб
Intel DP67BG: синие коннекторы SATA справа внизу соответствуют спецификациям 6 Гбит/с, черные — 3 Гбит/с


Заботясь о потребностях ближайшего будущего, Intel снабдила контроллер PCH шестой серии поддержкой стандарта SATA 6 Гбит/с (2 порта в дополнение к 4 SATA2).

Чтобы проверить работу контроллера на практике мы использовали 128 Гб RealSSD C300. Несколько тестов, по которым вполне можно сформировать общую картину, были проведены на пяти различных платформах: Intel X58 (SATA2), Intel P67 (SATA2 и SATA3), AMD 890GX (SATA3) и Intel X58 с дополнительным контроллером SATA3 Marvell 9128. Именно такой контроллер вы обнаружите на большинстве материнских плат на базе системной логики пятой серии без врожденной поддержки 6 Гбит/с Serial ATA.

Нашей целью было зафиксировать результаты при последовательном чтении/записи и случайном чтении/записи с глубиной очереди в 32 запроса для того, чтобы проверить, на что способны чипсеты в самых жестких условиях. Тестирование последовательных операций проводилось в течение одной минуты, случайный — трех. Естественно, проверялась работа накопителя с блоками данных различных размеров от 512 байт до 32 Кб. Все операции по передаче данных были «выровнены» по 4 Кб стандарту для максимальной близости к имитации доступа к драйву современной ОС. Каждый бенчмарк стартовал с нулевого сектора LBA и мог использовать все адресное пространство. Между тестами на запись SSD очищались с помощью TRIM.

Random Read


Random Write


Sequential Read


Sequential Write


Среди чипсетов Intel при работе в режиме 3 Гбит/с несколько лучше других показал себя X58 (по этой причине именно его мы обычно используем при тестировании SSD). Даже по сравнению с новинкой 6 серии у X58 есть небольшое преимущество при большой длине очереди команд.

Естественно, конкурировать с 6 Гбит/с контроллерами X58 уже не в состоянии. К нашей радости, все конкуренты показали себя хорошо при работе с SATA3. Решение AMD 800 серии оказалось несколько быстрее при определенных размерах блоков данных, но, по большей части, разницы между тройкой от AMD, Intel и Marvell обнаружено не было.

UEFI: работа с 3 Тб HDD без проблем и поддержка мыши на этапе загрузки



Возможно, вы помните, что в обзоре 3 Тб накопителя от Western Digital мы упоминали о проблемах, связанных с использованием подобных объемных ЖД в ПК со стандартными 32-битными BIOS. Недавно Intel выпустила свежую версию драйвера для дисковой подсистемы под номером 10.1, в котором была добавлена программная поддержка дисков с объемом более 2.2 Тб. Но это лишь частичное решение проблемы, ведь, скажем, использовать 3 Тб HDD в качестве загрузочного с помощью обновленного программного обеспечения все равно не удастся. Для этого необходимо наличие UEFI на материнской плате с поддержкой разделов GPT. По нашей информации, подавляющее большинство производителей приняло решение оснастить свои продукты для Sandy Bridge подобающими технологиями вместо устаревшего BIOS. Поэтому, в любых сценариях работы никаких проблем даже с самыми емкими дисками пользователи SNB испытывать не будут.

Все материнские платы ASUS для SNB имеют на борту UEFI
Все материнские платы ASUS для SNB имеют на борту UEFI


Так, ASUS выслала нам для проверки пару своих плат на чипсетах 6 серии, оснащенных UEFI с полностью графическим интерфейсом. Доступна все продвинутая функциональность BIOS, но с GUI и полной поддержкой управления мышью.

Чтобы привыкнуть к интерфейсу UEFI GUI нового типа требуется некоторое время, однако все разделы и функции находятся на своих местах. Определенные действия действительно быстрее совершать с помощью мыши, другие выполняются оперативнее с помощью старой доброй клавиатуры. Отзывчивость оболочки, по крайней мере, в исполнении ASUS, на высоте. Есть поддержка колеса прокрутки, правда сами полосы прокрутки отсутствую, что иногда замедляет работу.

В отличие от P55, в новых чипсетах вы можете выбирать режим работы SATA контроллера (compatible/legacy IDE). Такая опция была доступна ранее на X58, но не P55. Она может оказаться полезной, например, для использования HDDERASE (надежное стирание информации с накопителя). Кстати, раз уж об этой программе зашла речь, то для использования HDDERASE на новой платформе потребуется сначала запустить HDDERASE4 для отключения встроенной в UEFI защиты, а затем уже HDDERASE3 для очистки драйва.

Еще одним важным улучшением, которое однозначно заметят все покупатели, является уменьшенное время прохождения POST. Ниже мы поместили таблицу, в которой наглядно показано преимущество P67/H67 над предшественниками (все оборудование кроме ЦП и материнской платы оставалось неизменно):

Intel P67 Intel P55 Intel X58
Время с момента подачи питания до начала работы загрузчика ОС 22.4 секунды 29.4 секунд 29.3 секунд


Z68



При разработке новой платформы Intel стремилась минимизировать риски, поэтому частично архитектура чипсетов 6 семейства позаимствована от 5-ой серии Lynnfield. Такой подход привел к образованию пробела в линейке для Sandy Bridge. Дело в том, что P67 способен разгонять CPU и память, однако не наделен интерфейсом Flexible Display Interface для работы со встроенной графикой SNB HD Graphics. Напротив, H67 имеет необходимый FDI, т.е. позволяет в полной мере задействовать интегрированный GPU, однако изменение множителей процессора и RAM с целью оверклокинга ему недоступно. Что же делать покупателям, которые хотели бы разогнать ЦП, но при этом использовать ядро GT? К сожалению, с имеющимися на данный момент компонентами платформы, такой вариант невозможен; пользователей практически заставляют приобретать внешнюю видеокарту при желании разгона Sandy Bridge. Это прекрасная позиция для AMD/NVIDIA, но не слишком разумная для Intel; искусственно наложенное ограничение придется не по душе многим потенциальным клиентам.

Разрешить эту ситуацию призван третий чип 6-ого семейства, который должен выйти во втором квартале 2011 года: Z68. Грубо говоря, он представляет собой P67 с поддержкой встроенной графики. Кроме того, Z68 должен стать пионером новой технологии Intel SSD Caching, но подробностей о ней компания пока не разглашает. Известно только, что потребуется версия драйверов Rapid Storage Technology 10.5 (будут ли поддерживать SSD кэширование P67/H67 с новым софтом так же неизвестно). По предварительным прогнозам, данный механизм позволит создавать гибридные SSD/HDD системы искусственным образом, автоматически распределяя информацию разных типов на твердотельный драйв и жесткий диск.

LGA2011 в четвертом квартале



Определенный побочный эффект от стратегии Intel «tick-tock» заключается в шахматном графике выхода обновлений для различных рыночных сегментов. Например, выпущенный в Q4 2008 Nehalem, относился к быстро меняющемуся high-end сектору, но до самого начала 2010 года, когда в пару к нему добавили Gulftown, Intel практически не трогала эту платформу. Похожим образом развивалась ситуация и с дебютировавшим в третьем квартале 2009 Lynnfield, мимо которого 32 нм продукты начала 2010 года прошли стороной. Фактически, Sandy Bridge можно считать тем самым необходимым Lynnfield 32 нм обновлением.

С чем же теперь остаются владельцы Nehalem и Gulftown? Можно сделать достаточно смелое заявление, что платформа X58 отныне морально устарела. Конечно, она до сих пор имеет определенные преимущества (большее количество линий PCIe, более высокая пропускная способность памяти, поддержка шестиядерных ЦП), но для подавляющего большинства пользователей лучшим выбором будет Sandy Bridge и LGA1155.

Для тех из вас, кого текущие плюсы X58 волнуют, Intel готовит специальную версию Sandy Bridge. Ее кодовое название — Sandy Bridge-E, а релиз запланирован на Q4 2011. Чипы будут доступны в 4 и 6 ядерном исполнении и будут иметь более емкий L3 кэш (точных данных пока нет).

Процессоры SNB-E получат все преимущества обычных SNB для LGA1155, включая встроенный контроллер PCI-Express, кольцевую шину и т.д., но будут лишены графического ядра. Кроме того, для них расширят границы TDP до 130 Вт (против 95 Вт у SNB) — типичного тепловыделения LGA1366.

Новая high-end платформа потребует нового сокета (LGA2011) и материнских плат. Нижняя граница цен на такие ЦП ожидается на уровне i7 2600, т.е. около $294, а самые дорогие Extreme Edition варианты, по традиции, будут оценены в $999. [N6-Практически идеальный HTPC] С 2006 года встроенная графика от Intel поддерживала вывод восьмиканального LPCM звука по HDMI. В 2010 компания наделила IGP возможностью битстримминга до 8 каналов сжатого без потерь звука (столь часто используемые на Blu-ray Dolby TrueHD и DTS-HD MA) на ресивер. На данный момент по функциональности этого типа желать больше нечего, поэтому в Intel HD Graphics 3000/2000 никаких изменений по аппаратно поддерживаемым кодекам аудио и видео сделано не было.

Dolby Digital, TrueHD (до 7.1), DTS, DTS-HD MA (до 7.1) — все эти форматы могут быть выведены по HDMI без дополнительных внутренних преобразований. Проблем с передачей декодированного силами ПК звуком также нет. С точки зрения видео, поддерживается аппаратное ускорение H.264, VC-1 и MPEG2. Приятно, что Intel уделила внимание и не первостепенным моментам, таким как Blu-ray 3D и HDMI 1.4. Давайте пробежимся по этому списку.

Битстримминг Dolby TrueHD? Работает:

Битстримминг Dolby TrueHD


Битстримминг Dolby TrueHD


Битстримминг DTS HD-MA? Без вопросов:

Битстримминг DTS HD-MA


Blu-ray 3D? Можете поставить галочку:

Blu-ray 3D


А как насчет проигрывания видео в формате 23.976 FPS? Пожалуй, если бы с данным вопросом в Intel разобрались, слово «практически» отсутствовало бы в заголовке подраздела.

Дело в том, что большинство современных цифровых фильмов для домашнего просмотра записано в формате 23.976 FPS, который многие некорректно приравниваю к 24p. Часть видео действительно проходит мастеринг при 24.000 FPS и соответствует стандарту 24p, но, к сожалению, таких дисков немного.

Чтобы добиться корректного (гладкого, без рывков и подергиваний) воспроизведения содержимого обоих форматов, необходим, с одной стороны, соответствующий источник, а с другой — устройство отображения. Многие high-end телевизоры и проекторы автоматически определяют и подстраиваются под нужный режим, остается только подать на них сигнал с верными параметрами; здесь то у Intel и возникает проблема, так как IGP поддерживает только менее популярный режим 24.000 Гц.

Это не было сделано специально, скорее, такого следствие проблемы, впервые возникшей в Clarkdale. Несмотря на прекрасные характеристики энергетической эффективности и широкий набор возможностей, CPU Clarkdale имели, как оказалось, один существенный недостаток, найденный энтузиастами HTPC: вне зависимости от установок драйвера (формально режим 23 Гц присутствовал), GPU Intel подавали сигнал только в режиме 24 Гц.

Описанное ограничение носит аппаратный характер, связанный с работой PCH 5-ой серии (напомним, что работу по выводу изображения со встроенного ядра на дисплей выполняет именно Platform Controller Hub). Мы уж упоминали, что во многом чипсеты 6-ой серии повторяют своих предшественников, и переход этой ошибки в H67/P67 не стал исключением.

Хотя у компании было достаточно времени для исправления известного недостатка, желание обезопасить себя от возможных проблем с платформой, в которую и без того было внедрено множество изменений (новый блок внеочередного исполнения, интеграция GPU на кристалл процессора, новая архитектура GPU, встроенный PLL), привело к переносу сроков внедрения режима 23.976 FPS.

Обратите внимание на число кадров в секунду
Обратите внимание на число кадров в секунду


Что же произойдет при попытке проиграть 23.976 FPS видео на экране, который обновляется 24.000 раза в секунду? Это приведет к тому, что примерно каждую сороковую секунду будет появляться «лишний» удвоенный кадр, необходимый для синхронизации источника и дисплея. Этот повторяющийся кадр воспринимается глазом как «вибрация», и особенно заметен на планах с медленно движущейся панорамной камерой.

Реакция на эту проблему зависит исключительно от личного восприятия смотрящего. Для кого-то подобные артефакты будут вовсе незаметно, кому-то окажется достаточно перевести экран в режим 60 Гц, другие не смогут переносить подергивания спокойно в принципе.

Если вы хорошо представляете характер описанного явления и относите себя к последней категории, то единственным решением будет использовать для просмотра фильмов внешнюю видеокарту. На сегодня никаких проблем с выводом картинки при 23.976 Гц нет у AMD Radeon HD 5000 и 6000. Графические процессоры этих серий также поддерживают битстримминг Dolby TrueHD и DTS-HD MA, причем более новая 6000 серия может предложить HDMI 1.4a и стереоскопическое 3D. Тоже справедливо и для NVIDIA GeForce GT 430, который видится нам сбалансированным решением, прекрасно подходящим в качестве HTPC карты.

Известно, что Intel собирается исправить недоработку в 5/6 сериях чипсетов только со следующим кардинальным обновлением платформы, т.е. выпуском Ivy Bridge, намеченным на 2012 год. Существует и временная мера для тех, кто все же решит собрать HTPC на Sandy Bridge без внешней видеокарты; программисты компании нашли способ реализовать вывод в 23.97 Гц без внесений изменений в «железо». При 23.976 Гц «паразитный» кадр все равно будет появляться, но такой режим все равно намного предпочтительнее 24p.

Отметим также, что на момент написания обзора существовали некоторые программные трудности с поддержкой SNB в некоторых плеерах. Так, активация DXVA в Media Player Classic Home Cinema приводила к потерям качества изображения и периодическим подвисаниям. Впрочем, решение подобных проблем не заставит себя долго ждать. [N7-Технология Intel Quick Sync] За последние годы кодирование видео стало одной из самых распространенных задач-пожирателей мощности CPU. Популярность одного лишь только сервиса YouTube дала возможность каждому владельцу простейшей камеры почувствовать себя настоящим режиссером, превратив многие ПК в любительские станции для монтажа. Революционные изменения в мобильных устройствах также пока что не облегчили жизнь. Ведь пока что ни один смартфон не в состоянии проигрывать высокобитрейтный 1080p контент, например, с Blu-ray диска, а это значит, что если вы хотите иметь в кармане любимые фильмы или сериалы в высоком качестве, придется конвертировать имеющееся видео в сжатый формат. Тоже относится и к набирающим популярность «таблеткам», причем даже последнего поколения.

На высоком уровне, подобный процесс подразумевает выделение из контейнера имеющегося видеопотока и дальнейшее его пережатие с целью соответствия определенному занимаемому месту и возможностям декодирования устройства. Корректнее называть это действие «транскодированием», потому как изначальный поток уже сжат по определенному алгоритму (наиболее популярные сегодня кодеки — H.264/AVC).

Транскодирование является задачей, особенно сильно нагружающей процессор, из-за сложности самой природы механизмов компрессии. Дело в том, что хотя принципиально в видеоряде можно сжимать каждый кадр в отдельности, благодаря переходу части элементов одного кадра в другой без изменений возможно для экономии выделять ключевые (базовые) фреймы, и уже от них рассчитывать различия в последующих изображениях вплоть до нового ключевого кадра.

Хотя сегодня разнообразная полноценная поддержка декодирования видео воспринимается нами как должное, еще совсем недавно производители только экспериментировали с внедрением в GPU блоков с фиксированной функциональностью для аппаратной реализации некоторых стадий конвейера H.264. С Sandy Bridge Intel выводит эти возможности на новый уровень.

Появление аппаратного декодирования видео в современных GPU очень важно для ускорения транскодирования, ведь первым этапом этого процесса является декомпрессия источника. То, насколько быстро будет выполнять свою работу декодер, напрямую скажется на общем затраченном на преобразования времени. Этому есть два объяснения.

Для начала, в отличие от обычного сценария воспроизведения видео, при котором декодеру достаточно обрабатывать кадры с быстродействием не меньшим, чем того требует значение FPS, при транскодировании важно завершить декомпрессию как можно скорее. Ведь, чем быстрее первоначальная обработка материала будет завершена, тем раньше начнет свою работу кодировщик, сжимающий контент в другой формат. Существует и вторая, менее очевидная причина, — в блоках декодирования уже частично содержатся модули, которые необходимы для кодирования (например, iDCT/DCT).

High Performance Video Decoder


Так как транскодирование является функцией графического ядра Sandy Bridge, Intel значительно улучшила работу ЦП с видео по сравнению с Clarkdale. В первом поколении процессоров Core i ускорение декодирования видео было распределено в GPU между модулями с фиксированной функциональностью и массивом исполнительных блоков (Execution Units, EU). Во втором поколении Core i вся работа проводится исключительно в специализированных модулях. С точки зрения гибкости это не является лучшим решением (например, легко внедрить поддержку новых кодеков не удастся), зато обеспечивается лучшая производительность. Такого же принципа придерживаются в своих GPU AMD и NVIDIA, хотя раньше частично в процессе участвовали шейдерные процессоры чипов.

Достигнутый результат по-настоящему впечатляет как с точки зрения производительности, так и энергетической эффективности. Для проверки быстродействия обновленного движка мы запускали на воспроизведение несколько копий 15 Мбит/с 1080p H.264 ролика с частотой смены кадров 23.976 FPS. Учитывалось количество потоков, которые выполнялись на системе без лагов при полноскоростном проигрывании.

Intel Core i5 2500K NVIDIA GeForce GTX 460 AMD Radeon HD 6870
Число параллельных потоков 1080p 5 потоков 3 потока 1 поток


Отметим, что ролик был закодирован в HP@4.1; при таком сочетании характеристик графический процессор серии AMD Radeon HD 6000 сумел воспроизвести без тормозов только один поток (чего, впрочем, абсолютно достаточно для просмотра фильмов). Заметно лучшие результаты с тремя одновременными потоками продемонстрировал NVIDIA GeForce GTX 460. Лучшим же оказался Sandy Bridge: Core i5 2500K поддерживал воспроизведение целых пяти копий видео.

High Performance Video Decoder (продолжение)


Такое преимущество декодера SNB обусловлено прямой связью с массивным (и с хорошей пропускной способностью) кэшем L3. В свою очередь, сам быстрый декодер является первым кирпичиком в составе успеха технологии Quick Sync. Как мы уже отмечали, движок декодирования используется в дальнейшем и при непосредственном кодировании. Как только фреймы исходного видео проходят первичную обработку, они передаются массиву EU для дальнейшей подготовки к пережатию. Пространственные данные по каждому кадру (положение каждого пикселя) преобразуются в частотный спектр (насколько часто повторяются пиксели того или иного цвета) посредством дискретных косинус-преобразований.

Вы можете помнить, что для декодирования выполняются инверсные операции обратного дискретного косинус-преобразования; логичным выглядит использовать для этих целей одни и те же блоки при транскодировании.

Media Sampler


Partition


Определение движения, самый интенсивный по вычислениям этап процесса кодирования, также производится в EU. Итого, Intel Quick Sync состоит из быстрого декодера, массива блоков EU и модулей с фиксированными функциями. [N8-Quick Sync: лучший способ для кодирования видео] На данный момент транскодирование с помощью Intel Quick Sync поддерживается только двумя приложениями: Cyberlink Media Espresso 6 и Arcsoft Media Converter 7. Обе этих программы нацелены потребителей, которым необходимо перекодировать содержимое с высоким разрешением/потоком в более компактные форматы для использования на смартфонах, планшетных компьютерах, игровых консолях или мультимедиа-серверах. То есть, о создании максимально качественных Blu-ray большого объема речи не идет. Предназначение программного обеспечения подобного класса накладывает и логичные ограничения на функциональность; например, ни одна утилита не поддерживает многоканальный звук, ограничиваясь стерео MP3 или AAC. Также отсутствуют и профили для сжатия с более высоким качеством, чем MP H.264.

Согласно заявлениям представителей Intel, такие урезанные возможности обусловлены исключительно решением создателей ПО, а не ограничениями аппаратной части. Для популяризации новой технологии и скорого внедрения поддержки Quick Sync в программы, ориентированные на создание более качественного видео, Intel взаимодействует с разработчиками напрямую. Желающие добавить совместимость с Quick Sync в свой продукт могут свободно воспользоваться открыто распространяемым Intel Media SDK 2.0.

MediaConverter 7


Для данного тестирования мы использовали Media Converter 7, выбор этот обусловлен только личным предпочтением автора, а не объективными различиями между программами. Производительность и качество изображения должны быть практически идентичными при сравнении с MediaEspresso, так как утилиты работают с Quick Sync через идентичный API.

Хотя результирующее качество при применении тех или иных методов транскодирования в приложениях не совпадает, сам набор поддерживаемых технологий не отличается. В него входят ATI Stream, Intel Quick Sync, NVIDIA CUDA и x86. Для всех этих способов можно установить одинаковые настройки качества, пускай алгоритмы транскодирования и различаются кардинально (мы даже не говорим о различии GPU/CPU, архитектуры Radeon HD 6870 и GeForce GTX 460 имеют очень мало общего). Каждая из технологий обладает собственным балансом качества и быстродействия, который мы и рассмотрим в этой части материала.

Первый, и не столь очевидный момент, заключается в том, что использование вычислительных ядер www.anandtech.com/

подписаться   |   обсудить в ВК   |