Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Вторник, 27 января 2009 00:00

Phenom II X4 – новая надежда

короткая ссылка на новость:

5. Ориентировочная стоимость систем Ci7, C2Q и Phenom II



Чтобы не быть голословными, приведем в сводной таблице общие цены трех платформ, сформированные на основе приблизительных рекомендуемых производителями стоимостей.

Процессор Стоимость CPU Стоимость материнской платы Стоимость оперативной памяти Общая стоимость системы
AMD Phenom II X4 940 $275 $120 $75 $470
Intel Core i7 920 $295 $210 $150 $655
Intel Core 2 Quad Q9400 $270 $100 $75 $445

Поправка: в таблице приведены ориентировочные рекомендованные производителями цены для американского рынка. Оперативная память – 6 Гб (не забывайте, что можно установить и меньший объем для двухканального режима работы) DDR2 1066 МГц для Phenom II/Core 2 Quad и DDR3 1333 МГц для Core i7. Итак, несмотря на сходные цены самих процессоров, очевидно, что система на базе младшего i7 920 из-за DDR3 и материнских плат LGA1366 дороже более, чем на 40%. На разницу между платформами можно приобрести более быстрый графический ускоритель, жесткий диск большего объема, или даже потратиться на SSD. Таким образом, цена платформы Core i7 даже и не подразумевает прямого соревнование с Phenom II, тогда как реальный конкурент для Deneb – 45 нм процессоры Intel Core 2 Quad для платформы LGA775.

Пока что высокая стоимость материнских плат на базе X58 и памяти стандарта DDR3 играет на руку AMD. Сегодня именно поддерживаемая интегрированным контроллером Phenom II память стандарта DDR2 – чемпион по соотношению цена/качество. Однако у любой медали есть и обратная сторона. Обновленные Phenom II сами будут поддерживать DDR3, и это не только скажется в лучшую сторону на быстродействии, но и поднимет цену систем AMD. Привлекательность последних тогда не будет столь очевидна.

Так же стоит отметить и принципиальное отсутствие конкурентов Core i7 в модельном ряду AMD. Ведь на сегодня человеку, собирающему ультимативную систему без ограничения в средствах, компании просто нечего предложить.

Конечно же, рынок CPU стоимостью около 200 долларов, на котором выступают Phenom II, наиболее массовый, однако, хочется уже, наконец, увидеть по-настоящему быстрые процессоры от AMD.

И все же, на сегодня действителен такой прайс-лист на CPU:

Процессор Тактовая частота Кэш Стоимость в партиях от 1000 штук
Intel Core 2 Quad Q9650 3.0 ГГц 12 Мб L2 $530
Intel Core 2 Quad Q9550 2.83 ГГц 12 Мб L2 $316
AMD Phenom II X4 940 3.0 ГГц 2 Мб L2 + 6 Мб L3 $275
Intel Core 2 Quad Q9400 2.66 ГГц 6 Мб L2 $266
AMD Phenom II X4 920 2.8 ГГц 2 Мб L2 + 6 Мб L3 $235
Intel Core 2 Quad Q8300 2.5 ГГц 4 Мб L2 $224
Intel Core 2 Quad Q8200 2.33 ГГц 4 Мб L2 $193
Intel Core 2 Quad Q6600 (65 нм) 2.4 ГГц 8 Мб L2 $183


Кроме одного из самых популярных четырехядерных процессоров-ветеранов Core 2 Quad Q6600 все упомянутые в таблице CPU произведены по 45 нм техпроцессу. Из представленных данных видно, что по сегодняшним ценам Phenom II 940 должен конкурировать с C2Q Q9400, а младший 920 – с Q8300. Обращаем ваше внимание на то, что представленные цены не стоит ожидать в реальной рознице, указана именно стоимость процессоров в партиях от 1000 штук, именно она дает четко понять, как позиционируется процессор производителем.

Нельзя не упомянуть и того, что согласно последним новостям в ближайшее время цены на процессоры обеими компаниями будут снижены, и таблица примет следующий вид:

Процессор Стоимость в партиях от 1000 штук
Intel Core 2 Quad Q9650 $316
Intel Core 2 Quad Q9550 $266
AMD Phenom II X4 940 $235
Intel Core 2 Quad Q9400 $213
AMD Phenom II X4 920 $195
Intel Core 2 Quad Q8300 $183
Intel Core 2 Quad Q8200 $163
Intel Core 2 Quad Q6600 (65 нм) Производство прекращено


Отрадно, что соотношение цен не изменится и после производимого понижения, так что выводы, сделанные в данной статье по ценам, действительным на момент подготовки материала, не потеряют свою актуальность после публикации. [N6-6. Производительность оперативной и кэш-памяти] Теперь, когда вы в общих чертах знаете, чего ждать от новинки, рассмотрим изменения в архитектуре Phenom II более подробно. А так как самое заметное новшество в Deneb – увеличившийся объем кэш-памяти, с него и начнем анализ. Как и у предшественника, в распоряжении каждого ядра Phenom II – 64 Кб кэша первого уровня, для доступа к которому необходимо ожидание в 3 цикла. С переходом на архитектуру Nehalem, L1 процессоров Intel отныне обладает задержками в 4 цикла. Так что, сравнивая напрямую L1, можно констатировать, что в распоряжении Phenom как на четверть более быстрый, так и в два раза более объемный кэш. Рассматривая кэш второго уровня, можно отметить еще более разительные отличия.

Так, у Phenom II в наличии 2 Мб общего, довольно медленного (15 тактов) L2, по 512 Кб на ядро. Если сравнивать данный показатель с кэшем второго уровня процессоров Athlon X2, заметно значительное улучшение (у двухядерных представителей архитектуры K8 для доступа к L2 необходим простой в 20 циклов). Но как только на арену выходит Penryn, кэш L2 которого в 4-6 раз больше, и при этом обладает теми же задержками в 15 тактов, сравнение уже явно не в пользу AMD. Core i7 в свою очередь обладает наиболее быстрым (11 циклов), однако и самым маленьким L2 – всего 256 Кб.

Что касается массивного кэша L3, с ним все не так однозначно. По словам самой AMD, L3 в Phenom II на 2 такта быстрее, чем в Agena. С увеличенным в три раза размером и сокращенным временем доступа, пожалуй, мы видим именно такой кэш третьего уровня, который должен был быть еще в первом Phenom. Everest при тестировании определяет задержки L3 у Phenom II в 55, а у Core i7 – 35 циклов. Очевидно, это неправильные данные. Неразбериха и у Sandra, которая выдает 55 тактов для Phenom, а для Phenom II – 71. Официальных данных о задержках L3 AMD не предоставила (кроме относительных), Intel же говорит о 42 циклах при доступе к L3 в Core i7. По нашим собственным предположениям, задержки L3 у Deneb составляют порядка 50 циклов.

Процессор Задержки L1 Задержки L2 Задержки L3
AMD Phenom II X4 920 (2.8 ГГц) 3 цикла 15 циклов Неизвестно
AMD Phenom 2.8 ГГц 3 цикла 15 циклов Неизвестно
Athlon X2 5400 (2.8 ГГц) 3 цикла 20 циклов Отсутствует
Intel Core 2 Quad QX9770 (2.8 ГГц) 3 цикла 15 циклов Отсутствует
Intel Core 2 Quad Q9400 (2.8 ГГц) 3 цикла 15 циклов Отсутствует
Intel Core i7 965 (3.2 ГГц) 4 цикла 11 циклов 42 цикла


Можно также говорить и об оптимизациях контроллера памяти, которые провела AMD при переработке КП для поддержки нового типа памяти DDR3. Тогда как в оригинальном Phenom задержки составляли 107 нс, в Athlon X2 – 100 нс, в обновленном Phenom II – лишь 95 нс. 11%-улучшение одной из ключевых характеристик контроллера памяти не может не радовать.

Что касается общей структуры организации кэш-памяти, многое уже было разъяснено в статье про Lynnfield, где объяснялась причина уменьшения размера кэша L2 и, в частности, приводился такой график:

Cache per core


С небольшим кэшем L2 в 256 Кб на ядро, Core i7 стал шагом назад в наращивании объема кэша второго уровня. Однако, по словам инженеров Intel, в структуре четырехядерного CPU куда более важна была скорость L2, нежели его объем. С Phenom II ситуация такая же.

Phenom первого поколения также имел L2 сравнительно небольшого объема (512 Кб против 3 виртуальных Мб из 6 общих в Penryn), однако и L3 был крайне мал. Четырем ядрам, разделяющим между собой 2 Мб L3, этого объема было абсолютно недостаточно, однако для того, чтобы держать размеры кристалла в удобоваримых приделах, у AMD не было другого выбора. Phenom опередил свое время по конструктиву, но при этом из-за небольшого L3 не смог раскрыть потенциал своей архитектуры в полный рост.

При всем при этом, если бы мы всегда должны были оставаться в эре двухядерности, куда более справедлив был подход Intel с Conroe/Penryn – пара вычислительных ядер “сидела” за большим общим L2 кэшем, и этого оставалось достаточно. Однако при увеличении количества ядер, смысл в большом разделяемом кэше второго уровня теряется. Частыми при исполнении программ оказываются такие варианты, когда каждое ядро работает над индивидуальным потоком, и необходимости сообщаться с соседями нет. В таком случае лучше работает схема с быстрым L2 небольшого размера. Если же задача хорошо распараллелена и ядра часто общаются между собой – тогда уже к их услугам большой L3, скорость которого уже не так важна, как объем.

Phenom II устраняет дефицит быстрой внутренней памяти. С 6 Мб L3 Deneb может тягаться по объему общего кэша с Core i7. Кстати говоря, на наш взгляд 512 Кб L2 относительно медленного L2, доставшиеся в наследство от первого Phenom, в Deneb не переработаны (в сторону увеличения производительности или даже уменьшения размера) лишь из-за недостатка времени у инженеров AMD. Так что в грядущих Orochi и Llano стоит ожидать именно таких изменений. Стоит признать, что с кэшем L3 большого объема отныне необходимости в массивном L2 (который теперь должен быть в первую очередь быстрым) нет.

Можно провести аналогию с размером кэша первого уровня. L1 с течением времени увеличивался, с 1 Кб до 8, затем до 16 и, в конце концов, до 32/64 Кб в современных CPU. Однако больше размер кэша L1 не увеличивают – просто незачем. Схожий рост мы наблюдали и с L2, до некоторой переломной точки. Для AMD такой точкой стал Phenom, для Intel – Core i7.

С увеличивающимся числом вычислительных ядер в современных процессорах на первый план выходит именно объем разделяемого между всеми ядрами L3, тогда как L2 отходит на второй план, выполняя уже роль некоторого буфера между L1 и L3. В его задачи отныне входит загрузка работой каждого отдельного ядра со своим L1I и L1D, тогда как необходимость быть общей “кормушкой” переходит к L3. Невозможно создать, скажем, эффективный 12 ядерный процессор с 36 Мб кэша L2 – задержки при поиске ядрами информации в L1 друг у друга сведут на нет весь смысл увеличения числа этих самых ядер. Вполне реален вариант развития событий, когда уже в недалеком будущем появятся CPU с еще большим числом уровней кэша.

Таким образом, стоит признать, что будущее именно за такой структурой архитектуры многоядерных CPU, которую продемонстрировала AMD в первом Phenom, а Intel довела до относительного совершенства в Core i7. Phenom II – шаг в верном направление, эволюционное развитие идей первого Phenom. Deneb продолжает тенденцию увеличения кэш-памяти у процессоров, но не стоит забывать что во время такого роста случаются, и, возможно, будут встречаться все чаще переломные точки, когда для эффективности работы пирамиды кэшей необходимо будет добавление очередного уровня. [N7-7. Наконец-то! Новый, работающий Cool’n’Quiet] Современные микропроцессоры обладают целым набором стандартных тактовых частот, между которыми они могут переключаться в зависимости от нагрузки. Обычно реализовано это понижением множителя относительно стандартного до минимального. У первого Phenom было всего два состояния – работа на полной частоте и на половинчатой. То есть Phenom 9550 мог работать либо на стандартной полноценной частоте 2.6 ГГц, либо на пониженной, 1.3 ГГц. Так же оригинальный Phenom был первым x86-совместимым процессором, в котором каждое ядро могло независимо работать на своей собственной частоте. На то время четырехядерные процессоры Intel могли переводить ядра в состояние покоя/поднимать частоты при нагрузке лишь одновременно.

В теории задумка AMD работала отлично. Если запущено однопоточное приложение, три из четырех ядер “спят”, экономя энергию и не нагревая впустую воздух, тогда как активное ядро работает, как ни в чем не бывало, в стандартном режиме. Данная функция вошла в общий набор Cool’n’Quiet. Но на практике все работало отнюдь не так хорошо, как предполагалось. Например, Windows Vista постоянно перебрасывала исполняемые потоки с ядра на ядро, что обычно приводило к потере производительности. Причина состояла в том, что процессору при запуске однопоточного приложения и активированной Cool’n’Quiet приходилось постоянно то выводить на полную скорость работы, то снова “усыплять” ядра, а этот процесс требовал некоторого времени. Phenom II от данного недостатка избавили довольно банальным способом, просто-напросто убрав возможность работы ядер на раздельных частотах. Таким образом, теперь если одно ядро работает на 3 ГГц, значит, и все оставшиеся трудятся на этой частоте. На самом деле, несмотря на отказ AMD от своей первоначальной вроде бы грамотной задумки, на практике Cool’n’Quiet в Phenom II работает отлично. Теперь не возникает ситуаций, когда ОС перебрасывает исполняемый поток на ядро CPU, работающее на половинчатой частоте и из-за этого появляются неожиданные тормоза. Конечно, способ не самый элегантный, но с учетом сегодняшних программных механизмов распределения приоритетов потоков, видимо, реализовать полноценное задуманное в первом Phenom, невозможно.

Однако вместо раздельных частот для разных ядер ввели два дополнительных состояния процессора, снизив при этом минимальную планку до 800 МГц:

Процессор Стандартная частота, P1 P2 P3 Минимальная частота, P4
AMD Phenom II X4 940 3.0 ГГц 2.3 ГГц 1.8 ГГц 800 МГц
AMD Phenom II X4 920 2.8 ГГц 2.1 ГГц 1.6 ГГц 800 МГц


Процессоры Intel Core i7 обладают более продвинутыми технологиями энергосбережения – так, несмотря на то, что весь блок Core работает на одной и той же частоте, неиспользуемые ядра могут быть вообще отключены благодаря специально разработанным Power Gates. Хотелось бы видеть технологии такого уровня в Phenom II, однако, стоит порадоваться хотя бы безо всяких проблем работающему Cool’n’Quiet.

Для того, чтобы показать влияние C’n’Q на быстродействие, использовался SYSMark 2007. В таблице отражены результаты как для оригинального Phenom, так и для Phenom II:

Процессор Оценка SM2007, C’n’Q включен Оценка SM2007, C’n’Q выключен Разница при отключении C’n’Q
AMD Phenom II X4 940 182 185 1.6%
AMD Phenom 9950 136 157 15.4%


В синтетическом SYSMark потери производительности при активации энергосбережения на оригинальном Phenom составили более 15%, что выглядит существенным на фоне полутора процентов для Phenom II. В реальной жизни с Agena случались и куда более значимые провалы, вплоть до двухкратного снижения производительности. Ничего подобного с Phenom II не наблюдается, так что отныне Cool’n’Quiet можно без боязни использовать. [N8-8. 45 нм техпроцесс и замеры энергопотребления] AMD довольно долгое время на шаг отставала от Intel по используемому техпроцессу, а уж с переходом на 45 нм производство были связаны просто феноменальные задержки. К счастью, не слишком удачный 65 нм техпроцесс остался для AMD в прошлом, и отныне процессоры обоих конкурентов созданы с использованием 45 нм норм. Однако, несмотря на одинаковую цифру, подходы компаний к разработке 45 нм технологии были различными.

Известно, что современные кремниевые кристаллы производятся с применением сложных физико-химических процессов, которые можно комплексно обозначить фотолитографией. С помощью специальной маски-шаблона и фоторезиста слой за слоем формируются кристаллы, которые впоследствии соединяются через выводы с подложкой. При этом большую роль в том, насколько компактными можно сделать формируемые схемы, играет длина волны облучающего света (обычно задействован ультрафиолетовый диапазон). С помощью распространенной сегодня 193 нм литографии возможно создавать микросхемы с соблюдением минимальных 50 нм норм. Для того, чтобы пойти дальше, существующих стандартных методик было недостаточно.

AMD для перехода на 45 нм техпроцесс воспользовалась преимуществами так называемой иммерсионной фотолитографии, которая подразумевает облучение участков фоторезиста не напрямую, а используя эффект преломления света при переходе из одной среды в другую, в частности в нашем конкретном случае на пути пучка света появилась жидкость. На конечных пользователях используемый на производстве способ достижения 45 нм норм никак не сказывается, однако на сегодня в массовом производстве ничего более современного, чем иммерсионная литография не применяется. Возможно, именно сложностями, возникшими на пути разработки, в общем-то, революционной технологии, и обусловлено длительное время перехода от 65 традиционной к 45 нм иммерсионной литографии.

Intel считает что на сегодня применение такого типа фотолитографии неоправданно, на заводах компании используется технология с формированием изображения посредством наложения со смещением друг на друга двух масок. С экономической точки зрения очень сложно рассуждать, какой из подходов более целесообразен, так как помимо банальной удвоенной цены шаблонов для Intel существует множество других факторов. Но, можно говорить о том, что AMD уже не потребуется создавать для The Foundry Company иммерсионную литографию с нуля, а переход на 32 нм по идее должен быть куда менее болезненным и более быстрым, чем с 65 на 45 нм. [N9-9. Энергетически эффективный Phenom?] Когда на рынок вышел первый Phenom, не только его производительность была недостаточной, но и энергопотребление зашкаливало. С учетом фактически неработающего C’n’Q, ухудшающего и без того довольно низкую производительность Agena, Phenom сложно было назвать энергетически эффективным. Как и недостаток кэш-памяти, в Phenom II это исправили.

Снова хочется провести параллели с удачным Core i7, в котором любое из ядер может полностью выключаться при отсутствии для него работы. Так как в новых процессорах Intel кэш является инклюзивным, то есть содержимое L1 и L2 каждого из ядер хранится в L3, нет необходимости подключать неиспользуемое ядро для того, чтобы достать из него нужную информацию.

Как вы помните, Phenom II не является полноценной переработкой Phenom, поэтому AMD не стала работать над добавлением такой функциональности. Но в любом случае, благодаря новому 45 техпроцессу, потребляемая в состоянии покоя мощность серьезно снизилась (хотя Nehalem, безусловно, вне конкуренции благодаря Power Gates):

Процессор Потребление в покое Потребление в нагрузке
AMD Phenom II X4 940 (3.0 ГГц) 109.6 Вт 189.7 Вт
AMD Phenom 9950 BE (2.6 ГГц) 124.2 Вт 210 Вт
AMD Phenom X3 8750 (2.4 ГГц) 127.5 Вт 210 Вт
AMD Athlon X2 6400+ (3.2 ГГц) 101 Вт 195 Вт
Intel Core i7 965 (3.2 ГГц) 99 Вт 199 Вт
Intel Core i7 920 (2.66 ГГц) 95 Вт 168 Вт
Intel Core 2 Extreme QX9770 (3.2 ГГц) 135 Вт 219 Вт
Intel Core 2 Quad Q9400 (2.66 ГГц) 126 Вт 174 Вт
Intel Core 2 Quad Q8200 (2.33 ГГц) 134 Вт 168 Вт
Intel Core 2 Duo E8600 (3.33 ГГц)

Источник: www.anandtech.com/

подписаться   |   обсудить в ВК   |