Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Вторник, 27 января 2009 00:00

Phenom II X4 – новая надежда

короткая ссылка на новость:

4. На одной частоте все еще медленнее Core 2 и Core i7…



В таблице на прошлой странице необходимо было показать, что наибольшая архитектурная разница между Phenom первого и второго поколений – в объеме кэша L3. Конечно, была проведена ревизия вычислительных блоков и различные мелкие оптимизации затронули сами ядра, однако, в общем и целом, мы смотрим на старый добрый K10. Нельзя не согласиться с тем, что малый объем общей памяти для всех ядер был в Phenom Agena самым слабым местом, которое в Deneb ликвидировали. Но, к сожалению, это все же не позволило AMD дотянуться до уровня производительности Core 2 Quad и Core i7 при работе на одной и той же тактовой частоте:

Процессор Тактовая частота Adobe Photoshop CS4 x264, второй проход 3dsmax 9 Cinebench SYSMark 2007 Left 4 Dead Far Cry 2
AMD Phenom II X4 940 3.0 ГГц 24.2 с 17.8 FPS 10.8 12393 182 116.2 FPS 48.2 FPS
Intel Core 2 Quad Q9650 3.0 ГГц 19.4 с 19.9 FPS 12.0 12983 209 125.2 FPS 61.9 FPS
Intel Core i7 940 2.93 ГГц 15.8 с 29.2 FPS 16.2 17346 229 123 FPS 71.0 FPS
Преимущество Core 2 Quad Q9650 - 19.8% 11.8% 11.1% 4.8% 14.8% 7.7% 28.4%
Преимущество Core i7 940 - 34.7% 64% 50% 40% 25.8% 5.9% 47.3%
Проигрыш Core 2 Quad Q9650 $265
Проигрыш Core i7 940 $295+


Итак, если сравнивать процессоры разных архитектур “лоб в лоб” на равной частоте, мы снова видим отставание AMD. Однако уже не столь катастрофическое, как в случае с первым Phenom. В общем и целом Deneb близок по показанным результатам к Penryn. Скажем, в Cinebench разница всего лишь в несколько процентов. В то же время 3dsmax показывает большее отставание K10, как и игровые приложения. Причем если в Left 4 Dead, построенном на видавшем виды движке Source, разница не так значительна, в хорошо распараллеленном Far Cry 2 проигрыш решения от AMD уже бросается в глаза. Еще сильнее различие между Phenom II и Core i7, последний оказывается на 30-60% быстрее.

Однако нельзя забывать, что в случае с потребительскими CPU, важную роль играет не столько абсолютная производительность (которая, безусловно, должна быть на достойном уровне), сколько соотношение цены и качества. Обратите внимание на две последние строчки в таблице – это плата за большую скорость процессоров Intel. Скажем, i7 940 стоит вдвое дороже Phenom II, при этом быстрее он отнюдь не в два раза. Более того, если говорить о системах на базе Nehalem, стоит учитывать и стоимость дорогих материнских платы на базе X58 и необходимость недешевой DDR3 (а до выхода Lynnfield о массовых Core i7 и P55 можно забыть). Так что, как и в случае с Radeon 4800, которые не были самыми производительными картами на рынке, нам куда интереснее насколько хорошо себя покажут представленные модели Phenom II с учетом их ценового позиционирования. [N5-5. Ориентировочная стоимость систем Ci7, C2Q и Phenom II] Чтобы не быть голословными, приведем в сводной таблице общие цены трех платформ, сформированные на основе приблизительных рекомендуемых производителями стоимостей.

Процессор Стоимость CPU Стоимость материнской платы Стоимость оперативной памяти Общая стоимость системы
AMD Phenom II X4 940 $275 $120 $75 $470
Intel Core i7 920 $295 $210 $150 $655
Intel Core 2 Quad Q9400 $270 $100 $75 $445

Поправка: в таблице приведены ориентировочные рекомендованные производителями цены для американского рынка. Оперативная память – 6 Гб (не забывайте, что можно установить и меньший объем для двухканального режима работы) DDR2 1066 МГц для Phenom II/Core 2 Quad и DDR3 1333 МГц для Core i7. Итак, несмотря на сходные цены самих процессоров, очевидно, что система на базе младшего i7 920 из-за DDR3 и материнских плат LGA1366 дороже более, чем на 40%. На разницу между платформами можно приобрести более быстрый графический ускоритель, жесткий диск большего объема, или даже потратиться на SSD. Таким образом, цена платформы Core i7 даже и не подразумевает прямого соревнование с Phenom II, тогда как реальный конкурент для Deneb – 45 нм процессоры Intel Core 2 Quad для платформы LGA775.

Пока что высокая стоимость материнских плат на базе X58 и памяти стандарта DDR3 играет на руку AMD. Сегодня именно поддерживаемая интегрированным контроллером Phenom II память стандарта DDR2 – чемпион по соотношению цена/качество. Однако у любой медали есть и обратная сторона. Обновленные Phenom II сами будут поддерживать DDR3, и это не только скажется в лучшую сторону на быстродействии, но и поднимет цену систем AMD. Привлекательность последних тогда не будет столь очевидна.

Так же стоит отметить и принципиальное отсутствие конкурентов Core i7 в модельном ряду AMD. Ведь на сегодня человеку, собирающему ультимативную систему без ограничения в средствах, компании просто нечего предложить.

Конечно же, рынок CPU стоимостью около 200 долларов, на котором выступают Phenom II, наиболее массовый, однако, хочется уже, наконец, увидеть по-настоящему быстрые процессоры от AMD.

И все же, на сегодня действителен такой прайс-лист на CPU:

Процессор Тактовая частота Кэш Стоимость в партиях от 1000 штук
Intel Core 2 Quad Q9650 3.0 ГГц 12 Мб L2 $530
Intel Core 2 Quad Q9550 2.83 ГГц 12 Мб L2 $316
AMD Phenom II X4 940 3.0 ГГц 2 Мб L2 + 6 Мб L3 $275
Intel Core 2 Quad Q9400 2.66 ГГц 6 Мб L2 $266
AMD Phenom II X4 920 2.8 ГГц 2 Мб L2 + 6 Мб L3 $235
Intel Core 2 Quad Q8300 2.5 ГГц 4 Мб L2 $224
Intel Core 2 Quad Q8200 2.33 ГГц 4 Мб L2 $193
Intel Core 2 Quad Q6600 (65 нм) 2.4 ГГц 8 Мб L2 $183


Кроме одного из самых популярных четырехядерных процессоров-ветеранов Core 2 Quad Q6600 все упомянутые в таблице CPU произведены по 45 нм техпроцессу. Из представленных данных видно, что по сегодняшним ценам Phenom II 940 должен конкурировать с C2Q Q9400, а младший 920 – с Q8300. Обращаем ваше внимание на то, что представленные цены не стоит ожидать в реальной рознице, указана именно стоимость процессоров в партиях от 1000 штук, именно она дает четко понять, как позиционируется процессор производителем.

Нельзя не упомянуть и того, что согласно последним новостям в ближайшее время цены на процессоры обеими компаниями будут снижены, и таблица примет следующий вид:

Процессор Стоимость в партиях от 1000 штук
Intel Core 2 Quad Q9650 $316
Intel Core 2 Quad Q9550 $266
AMD Phenom II X4 940 $235
Intel Core 2 Quad Q9400 $213
AMD Phenom II X4 920 $195
Intel Core 2 Quad Q8300 $183
Intel Core 2 Quad Q8200 $163
Intel Core 2 Quad Q6600 (65 нм) Производство прекращено


Отрадно, что соотношение цен не изменится и после производимого понижения, так что выводы, сделанные в данной статье по ценам, действительным на момент подготовки материала, не потеряют свою актуальность после публикации. [N6-6. Производительность оперативной и кэш-памяти] Теперь, когда вы в общих чертах знаете, чего ждать от новинки, рассмотрим изменения в архитектуре Phenom II более подробно. А так как самое заметное новшество в Deneb – увеличившийся объем кэш-памяти, с него и начнем анализ. Как и у предшественника, в распоряжении каждого ядра Phenom II – 64 Кб кэша первого уровня, для доступа к которому необходимо ожидание в 3 цикла. С переходом на архитектуру Nehalem, L1 процессоров Intel отныне обладает задержками в 4 цикла. Так что, сравнивая напрямую L1, можно констатировать, что в распоряжении Phenom как на четверть более быстрый, так и в два раза более объемный кэш. Рассматривая кэш второго уровня, можно отметить еще более разительные отличия.

Так, у Phenom II в наличии 2 Мб общего, довольно медленного (15 тактов) L2, по 512 Кб на ядро. Если сравнивать данный показатель с кэшем второго уровня процессоров Athlon X2, заметно значительное улучшение (у двухядерных представителей архитектуры K8 для доступа к L2 необходим простой в 20 циклов). Но как только на арену выходит Penryn, кэш L2 которого в 4-6 раз больше, и при этом обладает теми же задержками в 15 тактов, сравнение уже явно не в пользу AMD. Core i7 в свою очередь обладает наиболее быстрым (11 циклов), однако и самым маленьким L2 – всего 256 Кб.

Что касается массивного кэша L3, с ним все не так однозначно. По словам самой AMD, L3 в Phenom II на 2 такта быстрее, чем в Agena. С увеличенным в три раза размером и сокращенным временем доступа, пожалуй, мы видим именно такой кэш третьего уровня, который должен был быть еще в первом Phenom. Everest при тестировании определяет задержки L3 у Phenom II в 55, а у Core i7 – 35 циклов. Очевидно, это неправильные данные. Неразбериха и у Sandra, которая выдает 55 тактов для Phenom, а для Phenom II – 71. Официальных данных о задержках L3 AMD не предоставила (кроме относительных), Intel же говорит о 42 циклах при доступе к L3 в Core i7. По нашим собственным предположениям, задержки L3 у Deneb составляют порядка 50 циклов.

Процессор Задержки L1 Задержки L2 Задержки L3
AMD Phenom II X4 920 (2.8 ГГц) 3 цикла 15 циклов Неизвестно
AMD Phenom 2.8 ГГц 3 цикла 15 циклов Неизвестно
Athlon X2 5400 (2.8 ГГц) 3 цикла 20 циклов Отсутствует
Intel Core 2 Quad QX9770 (2.8 ГГц) 3 цикла 15 циклов Отсутствует
Intel Core 2 Quad Q9400 (2.8 ГГц) 3 цикла 15 циклов Отсутствует
Intel Core i7 965 (3.2 ГГц) 4 цикла 11 циклов 42 цикла


Можно также говорить и об оптимизациях контроллера памяти, которые провела AMD при переработке КП для поддержки нового типа памяти DDR3. Тогда как в оригинальном Phenom задержки составляли 107 нс, в Athlon X2 – 100 нс, в обновленном Phenom II – лишь 95 нс. 11%-улучшение одной из ключевых характеристик контроллера памяти не может не радовать.

Что касается общей структуры организации кэш-памяти, многое уже было разъяснено в статье про Lynnfield, где объяснялась причина уменьшения размера кэша L2 и, в частности, приводился такой график:

Cache per core


С небольшим кэшем L2 в 256 Кб на ядро, Core i7 стал шагом назад в наращивании объема кэша второго уровня. Однако, по словам инженеров Intel, в структуре четырехядерного CPU куда более важна была скорость L2, нежели его объем. С Phenom II ситуация такая же.

Phenom первого поколения также имел L2 сравнительно небольшого объема (512 Кб против 3 виртуальных Мб из 6 общих в Penryn), однако и L3 был крайне мал. Четырем ядрам, разделяющим между собой 2 Мб L3, этого объема было абсолютно недостаточно, однако для того, чтобы держать размеры кристалла в удобоваримых приделах, у AMD не было другого выбора. Phenom опередил свое время по конструктиву, но при этом из-за небольшого L3 не смог раскрыть потенциал своей архитектуры в полный рост.

При всем при этом, если бы мы всегда должны были оставаться в эре двухядерности, куда более справедлив был подход Intel с Conroe/Penryn – пара вычислительных ядер “сидела” за большим общим L2 кэшем, и этого оставалось достаточно. Однако при увеличении количества ядер, смысл в большом разделяемом кэше второго уровня теряется. Частыми при исполнении программ оказываются такие варианты, когда каждое ядро работает над индивидуальным потоком, и необходимости сообщаться с соседями нет. В таком случае лучше работает схема с быстрым L2 небольшого размера. Если же задача хорошо распараллелена и ядра часто общаются между собой – тогда уже к их услугам большой L3, скорость которого уже не так важна, как объем.

Phenom II устраняет дефицит быстрой внутренней памяти. С 6 Мб L3 Deneb может тягаться по объему общего кэша с Core i7. Кстати говоря, на наш взгляд 512 Кб L2 относительно медленного L2, доставшиеся в наследство от первого Phenom, в Deneb не переработаны (в сторону увеличения производительности или даже уменьшения размера) лишь из-за недостатка времени у инженеров AMD. Так что в грядущих Orochi и Llano стоит ожидать именно таких изменений. Стоит признать, что с кэшем L3 большого объема отныне необходимости в массивном L2 (который теперь должен быть в первую очередь быстрым) нет.

Можно провести аналогию с размером кэша первого уровня. L1 с течением времени увеличивался, с 1 Кб до 8, затем до 16 и, в конце концов, до 32/64 Кб в современных CPU. Однако больше размер кэша L1 не увеличивают – просто незачем. Схожий рост мы наблюдали и с L2, до некоторой переломной точки. Для AMD такой точкой стал Phenom, для Intel – Core i7.

С увеличивающимся числом вычислительных ядер в современных процессорах на первый план выходит именно объем разделяемого между всеми ядрами L3, тогда как L2 отходит на второй план, выполняя уже роль некоторого буфера между L1 и L3. В его задачи отныне входит загрузка

Источник: www.anandtech.com/

подписаться   |   обсудить в ВК   |