Каталог
4. На одной частоте все еще медленнее Core 2 и Core i7…В таблице на прошлой странице необходимо было показать, что наибольшая архитектурная разница между Phenom первого и второго поколений – в объеме кэша L3. Конечно, была проведена ревизия вычислительных блоков и различные мелкие оптимизации затронули сами ядра, однако, в общем и целом, мы смотрим на старый добрый K10. Нельзя не согласиться с тем, что малый объем общей памяти для всех ядер был в Phenom Agena самым слабым местом, которое в Deneb ликвидировали. Но, к сожалению, это все же не позволило AMD дотянуться до уровня производительности Core 2 Quad и Core i7 при работе на одной и той же тактовой частоте:
Итак, если сравнивать процессоры разных архитектур “лоб в лоб” на равной частоте, мы снова видим отставание AMD. Однако уже не столь катастрофическое, как в случае с первым Phenom. В общем и целом Deneb близок по показанным результатам к Penryn. Скажем, в Cinebench разница всего лишь в несколько процентов. В то же время 3dsmax показывает большее отставание K10, как и игровые приложения. Причем если в Left 4 Dead, построенном на видавшем виды движке Source, разница не так значительна, в хорошо распараллеленном Far Cry 2 проигрыш решения от AMD уже бросается в глаза. Еще сильнее различие между Phenom II и Core i7, последний оказывается на 30-60% быстрее. Однако нельзя забывать, что в случае с потребительскими CPU, важную роль играет не столько абсолютная производительность (которая, безусловно, должна быть на достойном уровне), сколько соотношение цены и качества. Обратите внимание на две последние строчки в таблице – это плата за большую скорость процессоров Intel. Скажем, i7 940 стоит вдвое дороже Phenom II, при этом быстрее он отнюдь не в два раза. Более того, если говорить о системах на базе Nehalem, стоит учитывать и стоимость дорогих материнских платы на базе X58 и необходимость недешевой DDR3 (а до выхода Lynnfield о массовых Core i7 и P55 можно забыть). Так что, как и в случае с Radeon 4800, которые не были самыми производительными картами на рынке, нам куда интереснее насколько хорошо себя покажут представленные модели Phenom II с учетом их ценового позиционирования. [N5-5. Ориентировочная стоимость систем Ci7, C2Q и Phenom II] Чтобы не быть голословными, приведем в сводной таблице общие цены трех платформ, сформированные на основе приблизительных рекомендуемых производителями стоимостей.
Поправка: в таблице приведены ориентировочные рекомендованные производителями цены для американского рынка. Оперативная память – 6 Гб (не забывайте, что можно установить и меньший объем для двухканального режима работы) DDR2 1066 МГц для Phenom II/Core 2 Quad и DDR3 1333 МГц для Core i7. Итак, несмотря на сходные цены самих процессоров, очевидно, что система на базе младшего i7 920 из-за DDR3 и материнских плат LGA1366 дороже более, чем на 40%. На разницу между платформами можно приобрести более быстрый графический ускоритель, жесткий диск большего объема, или даже потратиться на SSD. Таким образом, цена платформы Core i7 даже и не подразумевает прямого соревнование с Phenom II, тогда как реальный конкурент для Deneb – 45 нм процессоры Intel Core 2 Quad для платформы LGA775. Пока что высокая стоимость материнских плат на базе X58 и памяти стандарта DDR3 играет на руку AMD. Сегодня именно поддерживаемая интегрированным контроллером Phenom II память стандарта DDR2 – чемпион по соотношению цена/качество. Однако у любой медали есть и обратная сторона. Обновленные Phenom II сами будут поддерживать DDR3, и это не только скажется в лучшую сторону на быстродействии, но и поднимет цену систем AMD. Привлекательность последних тогда не будет столь очевидна. Так же стоит отметить и принципиальное отсутствие конкурентов Core i7 в модельном ряду AMD. Ведь на сегодня человеку, собирающему ультимативную систему без ограничения в средствах, компании просто нечего предложить. Конечно же, рынок CPU стоимостью около 200 долларов, на котором выступают Phenom II, наиболее массовый, однако, хочется уже, наконец, увидеть по-настоящему быстрые процессоры от AMD. И все же, на сегодня действителен такой прайс-лист на CPU:
Кроме одного из самых популярных четырехядерных процессоров-ветеранов Core 2 Quad Q6600 все упомянутые в таблице CPU произведены по 45 нм техпроцессу. Из представленных данных видно, что по сегодняшним ценам Phenom II 940 должен конкурировать с C2Q Q9400, а младший 920 – с Q8300. Обращаем ваше внимание на то, что представленные цены не стоит ожидать в реальной рознице, указана именно стоимость процессоров в партиях от 1000 штук, именно она дает четко понять, как позиционируется процессор производителем. Нельзя не упомянуть и того, что согласно последним новостям в ближайшее время цены на процессоры обеими компаниями будут снижены, и таблица примет следующий вид:
Отрадно, что соотношение цен не изменится и после производимого понижения, так что выводы, сделанные в данной статье по ценам, действительным на момент подготовки материала, не потеряют свою актуальность после публикации. [N6-6. Производительность оперативной и кэш-памяти] Теперь, когда вы в общих чертах знаете, чего ждать от новинки, рассмотрим изменения в архитектуре Phenom II более подробно. А так как самое заметное новшество в Deneb – увеличившийся объем кэш-памяти, с него и начнем анализ. Как и у предшественника, в распоряжении каждого ядра Phenom II – 64 Кб кэша первого уровня, для доступа к которому необходимо ожидание в 3 цикла. С переходом на архитектуру Nehalem, L1 процессоров Intel отныне обладает задержками в 4 цикла. Так что, сравнивая напрямую L1, можно констатировать, что в распоряжении Phenom как на четверть более быстрый, так и в два раза более объемный кэш. Рассматривая кэш второго уровня, можно отметить еще более разительные отличия. Так, у Phenom II в наличии 2 Мб общего, довольно медленного (15 тактов) L2, по 512 Кб на ядро. Если сравнивать данный показатель с кэшем второго уровня процессоров Athlon X2, заметно значительное улучшение (у двухядерных представителей архитектуры K8 для доступа к L2 необходим простой в 20 циклов). Но как только на арену выходит Penryn, кэш L2 которого в 4-6 раз больше, и при этом обладает теми же задержками в 15 тактов, сравнение уже явно не в пользу AMD. Core i7 в свою очередь обладает наиболее быстрым (11 циклов), однако и самым маленьким L2 – всего 256 Кб. Что касается массивного кэша L3, с ним все не так однозначно. По словам самой AMD, L3 в Phenom II на 2 такта быстрее, чем в Agena. С увеличенным в три раза размером и сокращенным временем доступа, пожалуй, мы видим именно такой кэш третьего уровня, который должен был быть еще в первом Phenom. Everest при тестировании определяет задержки L3 у Phenom II в 55, а у Core i7 – 35 циклов. Очевидно, это неправильные данные. Неразбериха и у Sandra, которая выдает 55 тактов для Phenom, а для Phenom II – 71. Официальных данных о задержках L3 AMD не предоставила (кроме относительных), Intel же говорит о 42 циклах при доступе к L3 в Core i7. По нашим собственным предположениям, задержки L3 у Deneb составляют порядка 50 циклов.
Можно также говорить и об оптимизациях контроллера памяти, которые провела AMD при переработке КП для поддержки нового типа памяти DDR3. Тогда как в оригинальном Phenom задержки составляли 107 нс, в Athlon X2 – 100 нс, в обновленном Phenom II – лишь 95 нс. 11%-улучшение одной из ключевых характеристик контроллера памяти не может не радовать. Что касается общей структуры организации кэш-памяти, многое уже было разъяснено в статье про Lynnfield, где объяснялась причина уменьшения размера кэша L2 и, в частности, приводился такой график: С небольшим кэшем L2 в 256 Кб на ядро, Core i7 стал шагом назад в наращивании объема кэша второго уровня. Однако, по словам инженеров Intel, в структуре четырехядерного CPU куда более важна была скорость L2, нежели его объем. С Phenom II ситуация такая же. Phenom первого поколения также имел L2 сравнительно небольшого объема (512 Кб против 3 виртуальных Мб из 6 общих в Penryn), однако и L3 был крайне мал. Четырем ядрам, разделяющим между собой 2 Мб L3, этого объема было абсолютно недостаточно, однако для того, чтобы держать размеры кристалла в удобоваримых приделах, у AMD не было другого выбора. Phenom опередил свое время по конструктиву, но при этом из-за небольшого L3 не смог раскрыть потенциал своей архитектуры в полный рост. При всем при этом, если бы мы всегда должны были оставаться в эре двухядерности, куда более справедлив был подход Intel с Conroe/Penryn – пара вычислительных ядер “сидела” за большим общим L2 кэшем, и этого оставалось достаточно. Однако при увеличении количества ядер, смысл в большом разделяемом кэше второго уровня теряется. Частыми при исполнении программ оказываются такие варианты, когда каждое ядро работает над индивидуальным потоком, и необходимости сообщаться с соседями нет. В таком случае лучше работает схема с быстрым L2 небольшого размера. Если же задача хорошо распараллелена и ядра часто общаются между собой – тогда уже к их услугам большой L3, скорость которого уже не так важна, как объем. Phenom II устраняет дефицит быстрой внутренней памяти. С 6 Мб L3 Deneb может тягаться по объему общего кэша с Core i7. Кстати говоря, на наш взгляд 512 Кб L2 относительно медленного L2, доставшиеся в наследство от первого Phenom, в Deneb не переработаны (в сторону увеличения производительности или даже уменьшения размера) лишь из-за недостатка времени у инженеров AMD. Так что в грядущих Orochi и Llano стоит ожидать именно таких изменений. Стоит признать, что с кэшем L3 большого объема отныне необходимости в массивном L2 (который теперь должен быть в первую очередь быстрым) нет. Можно провести аналогию с размером кэша первого уровня. L1 с течением времени увеличивался, с 1 Кб до 8, затем до 16 и, в конце концов, до 32/64 Кб в современных CPU. Однако больше размер кэша L1 не увеличивают – просто незачем. Схожий рост мы наблюдали и с L2, до некоторой переломной точки. Для AMD такой точкой стал Phenom, для Intel – Core i7. С увеличивающимся числом вычислительных ядер в современных процессорах на первый план выходит именно объем разделяемого между всеми ядрами L3, тогда как L2 отходит на второй план, выполняя уже роль некоторого буфера между L1 и L3. В его задачи отныне входит загрузка |
Источник: www.anandtech.com/