Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Суббота, 5 июня 2010 11:28

Thuban — шесть ядер от AMD на примере Phenom II X6 1055T и 1090T

короткая ссылка на новость:

AMD Turbo Core



   Внимательные читатели могли задаться вопросом, откуда вдруг у новых процессоров появился в названии некий суффикс "T". Оказывается, он означает наличие новой технологии AMD Turbo.

   Во времена Pentium 4 инженеры Intel быстро поняли, что существует объективный потолок тепловыделения, при достижении которого для стабильного функционирования системы потребуется применение нестандартных методов охлаждения. До архитектуры Netburst CPU и GPU постоянно прибавляли в энергетическом аппетите, и, как следствие, степени необходимости рассеивать все большее количество тепла. Однако серьезного значения данному факту не придавали, так как существующие блоки питания и системы охлаждения вполне справлялись с нагрузкой. Но с выпуском высокочастотных P4 стало понятно, что выше определенных пределов TDP CPU выходить просто нелогично, и необходимо думать о внедрении более эффективных решений. Так были установлены некие общепринятые лимиты, которым следуют как Intel, так и AMD.

   Так, наиболее производительные десктопные CPU не выходят за границы 125-140Вт, тогда как массовые процессоры и вовсе стараются выпускать с 65 Вт тепловым пакетом. Мобильные процессоры в свете необходимости экономии энергии редко когда превосходят значение 35 Вт. Но, какими бы естественными не казались эти ограничения, соответствовать им очень непросто при увеличении числа ядер или тактовых частот.

   В современных "однородных" многоядерных процессорах находится определенное количество идентичных ядер, которые делят между собой максимальный TDP CPU. При этом если гипотетический одноядерный процессор имеет частоту 4 ГГц и достигает 125 Вт, то удвоение вычислительных ядер в таком чипе при сохранении теплового пакета потребует снижение тактовых частот, скажем, до 3.6 ГГц. Необходима четырехъядерная версия без каких-либо архитектурных изменений? Снова снижаем частоты. Шесть ядер? Очередной шаг по снижению тактовой частоты приведет в нашем примере к 3.2 ГГц CPU.

Одно ядро Два ядра Четыре ядра Шесть ядер

   Все это не создавало бы каких-либо проблем, если подавляющее большинство запускаемых на процессорах программ было хорошо распараллелено и полностью использовало доступные вычислительные ресурсы. Однако в реальности таких идеальных условий просто не бывает, и на практике при повседневной работе встречаются приложения, которые способны использовать в разных комбинациях от одного до шести ядер. Простой просмотр веб-страниц вряд ли загрузит более одного или двух ядер, игры загрузят два или четыре ядра, а кодировщики видео, в свою очередь, полностью задействуют все шесть вычислительных блоков. Таким образом, если спроектировать стандартный шестиядерный процессор без каких-либо дополнительных технологий, получится чип, который обеспечит отличную производительность при сжатии видео, но покажет худшее быстродействие в играх по сравнению со своими четырехъядерными конкурентами с более высокой частотой и еще больше проиграет одноядерным CPU в легком ПО. Компромиссным путем одно время казался выбор двуядерного ЦП, но заметная лучшая производительность четырехъядерных процессоров в соответствующих задачах заставила производителей придумать занимательный алгоритм, решающий данную проблему.

   С Nehalem Intel впервые представила специальные "энергетические шлюзы" (транзисторы Power Gate). Будучи размещенными между источником питания и самим ядром, они были способны полностью отключать незадействованные в определенный момент времени ядра. В прошлом AMD и Intel ставили схожие контроллеры между ядром и тактовым генератором, которые так же были способны отключать неиспользуемые блоки, однако они не решали проблему токов утечки, которая становилась все более значимой с уменьшением геометрических размеров полупроводниковых элементов. Поэтому такие решения не были особенно эффективными. Вместе с тем, специально разработанные Intel шлюзы блокировали неактивное ядро практически полностью, не давая ему понапрасну тратить энергию.

   Получается, что если выбросить из уравнения TDP одно ядро, то с помощью некой дополнительной логики (которая в случае с Nehalem занимает порядка одного миллиона транзисторов), можно поднимать частоты оставшихся ядер до тех пор, пока не будет достигнут предел TDP или прочие физические ограничения. Именно так работает технология Intel Turbo Boost, которая может устанавливать повышенные частоты работающих ядер в случае неполной загрузки CPU.
   С Thuban AMD представляет свою собственную альтернативную технологию, предназначенную для решения описанной проблемы, под названием Turbo Core. Еще в первых процессорах Phenom существовала возможность раздельного управления частотами ядер. Однако из-за определенных проблем в реализации, приводивших к потере производительности, в Phenom II от этой идеи отказались. И вот теперь, с Thuban доработанная версия, лишенная каких бы то ни было недостатков, вернулась в Phenom II X6.

   Когда половина (или более) ядер CPU на кристалле Thuban простаивают, Turbo core делает следующее:
  1. уменьшает тактовую частоту неактивных ядер до 800 МГц;
  2. увеличивает напряжение всех ядер;
  3. увеличивает частоту задействованных программой ядер на величину до 500 МГц.
   Тем самым, с точки зрения производительности, достигается такой же результат, как и у Turbo Boost. Не использующие многопоточные вычисления программы получают прирост производительности от более высокой тактовой частоты. К тому же даже у хорошо распараллеленных приложений зачастую бывают периоды, когда их быстродействие ограничивается возможностями одного ядра — и здесь AMD Turbo Core будет кстати. На практике технология Turbo Core действительно работает. Иногда мы замечали, как скорость Phenom II X6 1090T поднимается до 3.6 ГГц, чаще — до 3.4 ГГц. Как можно видеть из представленного выше слайда, между работающими ядрами и их частотой не слишком жесткая взаимосвязь, в каждый момент времени процессор просто пытается выбрать наиболее оптимальный режим работы.

Прирост скорости от активации AMD Turbo Core
AMD Phenom II X6 1090T Turbo Core выключена Turbo Core включена Прирост производительности
x264-HD 3.03 1ый проход 71.4 FPS 74.5 FPS 4.3%
x264-HD 3.03 2ой проход 29.4 FPS 30.3 FPS 3.1%
Left 4 Dead 117.3 FPS 127.2 FPS 8.4%
Бенчмарк 7-zip 3069 Кб/с 3197 Кб/с 4.2%

   В среднем выигрыш от использования Turbo Core в приложениях нашего тестового пакета составил от 2 до 10%. С учетом того, что максимальное увеличение частоты Phenom II X6 1090T соответствует 12.5% от базового значения, это не такой уж и плохой результат. Но все же такие CPU Intel, как Clarkdale и Lynnfield показывают себя несколько лучше как с точки зрения прироста от Turbo, так и благодаря чуть меньшему потреблению энергии, ведь их транзисторы Power Gate способны полностью отключать ядра, а не просто снижать частоту.
   Интересно, что, хотя такие ситуации и были редки, в некоторых тестах включение Turbo Core приводило к потере производительности, чего не случалось с Turbo Boost. Возможно, этот недостаток является следствием имеющихся у Phenom ранее проблем с индивидуальными частотами ядер. [N4-Заключение о производительности]    Как мы и предполагали во вступлении, в не использующих параллельные вычислительные потоки приложениях победа, несмотря на большее число физических ядер у Thuban, осталась за Lynnfield. Благодарить в данном случае не только лучшую эффективность, но и более продвинутый Turbo-режим у Intel.

Phenom II X6 против Lynnfield
  Cinebench R10 (один поток) Cinebench R10 (многопоточность) 3dsmax r9 x264 HD, второй проход Left 4 Dead
AMD Phenom II X6 1090T 3951 18526 13.7 28.5 FPS 127.2 FPS
AMD Phenom II X6 1055T 3547 16268 12.7 25.1 FPS 111.5 FPS
Intel Core i7 860 4490 16598 15.0 26.8 FPS 131.0 FPS
Intel Core i5 750 4238 14142 13.4 21.0 FPS 130.0 FPS

   Качественно распараллеленное ПО, вроде инструментов для трехмерного рендеринга, без сомнений, быстрее работает на Phenom II X6. Похоже, что в некоторых тестах 6 Мб L3 и двухканальный контроллер памяти несколько ограничивают потенциал Thuban, однако, в общем и целом, при решающей роли многопоточных приложений в вашей работе X6 станет лучшим выбором.

   Неспециализированные программы общего назначения, включая процессорозависимые игры, отдают предпочтение четырехъядерным CPU Intel. Словом, вывод здесь тот же, что и при противостоянии Clarkdale с Athlon II X3/X4: при необходимости запуска распараллеленных приложений, которые действительно используют дополнительные ядра, AMD будет в выигрыше. В противном случае, более универсальные ЦП Core i3/i5/i7 покажут лучший результат. [N5-Чипсет AMD 890FX]    Хотя Phenom II X6 отлично работает в существующих Socket AM2+ и AM3 материнских платах, которые поддерживают 125 Вт процессоры и имеют обновленный для Thuban BIOS (а таких к моменту запуска X6 насчитывается 160 штук), AMD представила обновленный чипсет 890FX. Фактически, он отличается от 790FX лишь новым южным мостом SB850 с поддержкой SATA III, который был изначально анонсирован вместе с 890GX.
   Он может стать хорошим выбором для тех покупателей, которые собирают систему с Phenom II X6 "с нуля", а не обновляют существующие ПК. В целом же никаких глобальных изменений вроде числа линий PCI-Express 2.0. Техпроцесс производства остался прежним, среди формальных новшеств можно назвать только соответствие стандарту IOMMU версии 1.2.

  AMD 890FX AMD 890GX AMD 790FX
CPU AMD Socket AM3 AMD Socket AM3 AMD Socket AM3/AM2+
Техпроцесс 65нм 55нм 65нм
PCI Express 44 линии PCIe 2.0 24 линии PCIe 2.0 44 линии PCIe 2.0
Graphics Нет Radeon HD 4290 (DirectX 10.1) Нет
South Bridge SB850 SB850 SB750
USB 14 портов USB 2.0 14 портов USB 2.0 12 портов USB 2.0
SATA 6 портов SATA 6 Гбит/с 6 портов SATA 6 Гбит/с 6 портов SATA 3 Гбит/с
IOMMU 1.2 Нет Нет
[N6-Тестовая конфигурация и программы] [N7-Тестирование — SYSMark 2007]
   Мы уже знаем, что SYSMark не способен загрузить более двух процессорных ядер, поэтому нам он не очень интересен — результаты абсолютно прогнозируемы. [N8-Тестирование — Adobe Photoshop CS4]
   Производительность новинок в Photoshop находится на хорошем уровне. К сожалению, этот графический пакет недостаточно сложен, чтобы по-настоящему загрузить все доступные 6 ядер Thuban. В результате Phenom II X6 хотя и опережают X4, дотянуться до i5 750 они не в состоянии. [N9-Тестирование — кодирование видео DivX 6.8.5 с Xmpeg 5.0.3]
   Вряд ли в 2010 году пользователей заинтересует этот устаревший метод сжатия видео. В нашем грядущем обновлении тестового пакета процессорных бенчмарков данный кодировщик видео, уже необъективно отражающий разницу между современными CPU, будет исключен. [N10-Тестирование — кодирование HD видео с x264]
   Наконец-то перед нами ситуация, в которой Phenom II X6 способен раскрыться — даже младший 1055T оказался быстрее i7 860.
   Непосредственно при сжатии видео 1055T все-таки уступил i7 860, но был на значительные 19% быстрее i5 750. [N11-Тестирование — процессорный рендеринг 3dsmax 9 SPECapc CPU]
   Интересно, что не все даже хорошо распараллеленные программы отдают предпочтение AMD. Оказывается, в 3dsmax даже четырехъядерный CPU Intel может быть чуть быстрее шестиядерного Phenom II. [N12-Тестирование — Cinebench R10]
   Безусловно, тягаться в индивидуальной скорости работы ядер K10.5 с Nehalem/Westmere AMD не в силах. Зато, как только все имеющиеся ядра начинают интенсивно работать, их суммарный результат оказывается предпочтительнее достигнутого Intel.
[N13-Тестирование — POV-Ray 3.73 beta 23 Ray Tracing]
   И вновь преимущество остается на стороне AMD. С учетом показателей в POV-Ray и Cinebench неясно, почему в 3dsmax Lynnfield обошел Phenom II X6. Возможно, в данном случае сказался редкий негативный эффект от включения Turbo Core. [N14-Тестирование — создание архивов WinRAR]
   При создании архивов в WinRAR i7 860 оказывается в состоянии обойти 1090T, однако отсутствие Hyper Threading у i5 750 обезоруживает его перед мощью 1055T. [N15-Тестирование — создание архивов 7-zip]
   Хотя синтетический тест пророчил продукции AMD безоговорочную победу, на практике оба X6 уступили даже младшему Lynnfield. Это еще раз доказывает потенциальную разницу в поведении ЦП в формальных тестах и реальных приложениях. [N16-Игровая производительность]    Вне всякого сомнения, если вы выбираете игровой процессор, Lynnfield и Core i5/i7 будут предпочтительнее шестиядерных CPU AMD.
[N17-Энергопотребление]    Нас впечатляет то, что AMD удалось добиться от шестиядерных 45нм процессоров схожего с 45нм четырехъядерными ЦП энергопотребления. Хотя в простое Phenom II демонстрирует неплохие показатели, без "шлюзов" для полного отключения ядер AMD не способна на равных соперничать с Intel.

   Под нагрузкой у конкурирующих процессоров результаты также заметно лучше, чего уже нельзя объяснить отсутствием транзисторов Power Gate.
[N18-Разгон]    Так как Phenom II X6 1090T относится к серии Black Edition, его множитель разблокирован на повышение. Без каких-либо усилий нам удалось достичь частоты 3.8 ГГц с нашим 3.2 ГГц семплом и штатным охлаждением.

   Потратив немного времени на подбор оптимальных настроек, покорились и 3.9 ГГц, но даже сам факт работы 45нм шестиядерного ЦП на частоте 3.8 ГГц очень впечатляет. С повышением напряжения до 1.45 В был взят и 4 ГГц барьер. Не применяя какого-то экстремального охлаждения, нам удалось загрузиться в Windows и на 4.1 ГГц, однако полной стабильности в таком режиме не было. Отрадно, что имевшаяся ранее проблема с работой CPU AMD в 64-битном режиме на частотах свыше 4 ГГц с Thuban, по-видимому, ушла.
[N19-Заключение]    Сегодняшнее заключение, которое мы можем сделать после тестирования шестиядерных процессоров AMD Phenom II X6 на ядре Thuban, не отличается от прошлых выводов по более простым CPU Advanced Micro Devices. Если для вас наиболее важны хорошо распараллеленные программы, которые используют дополнительные физические ядра ЦП, то AMD в целом будет демонстрировать лучшее быстродействие, чем схожие по цене процессоры Intel. Весь смысл политики компании на данный момент заключается в продаже большего числа менее производительных, чем у Intel, ядер.

   Такие программы, как кодировщики видео и инструменты для 3D-рендеринга демонстрируют весь потенциал Phenom II X6. В тоже время, благодаря наличию полноценного кэша L3 и работающей технологии Turbo Core, никакого падения производительности Thuban относительно Phenom II X4 в "легком" ПО не наблюдается. В благоприятных для AMD условиях модель 1090T может с легкостью превзойти Core i7 860, а 1055T в сравнении с Core i5 750 выступает даже лучше.

   Однако, как только речь заходит о работе в простых программах, или даже играх, где не используется большое число физических ядер, более высокая удельная эффективность четырехъядерных Intel Lynnfield оказывается предпочтительнее. Как и в случае с парой Athlon X3/Core i3, изделия Intel попросту более универсальны. Поэтому если для вас не стоит задач, связанных с работой в "тяжелом" специализированном программном обеспечении, Intel окажется лучшим выбором. К тому же стоит учитывать и сравнимую общую стоимость платформ (Bloomfield в свое время был все же существенно дороже из-за материнских плат на X58 и малораспространенной памяти DDR3), не говоря уж о меньшем энергопотреблении процессоров семейства Core как в покое, так и под нагрузкой. В конце концов, все определит только ваше решение о том, какие задачи будут решаться на ПК. А вот помочь его принять мы уже не можем.

Источник: www.anandtech.com/

подписаться   |   обсудить в ВК   |