Каталог
Эффективность и энергопотреблениеВ прошлом году Intel справедливо критиковали, в частности, за большое энергопотребление и тепловыделение Xeon. Во время работы Xeon’оны всегда сильно нагревались, особенно сильно в тех случаях, когда 2 процессора, работающих на большой частоте, располагались на плате рядом друг с другом. Когда частоты одноядерных Xeon достигли частот 3,6 ГГц +, это стало главной проблемой, поскольку с перегревом стали сталкиваться все пользователи. Однако только с появлением двухъядерного Paxville этот факт обратил на себя всеобщее внимание, поскольку его энергопотребление было запредельным. Для самой простой двухпроцессорной системы без видеокарт и одним жестким диском требовался 500 Вт блок питания. Эффективность процессоров AMD Opteron, по отношению к потребляемой электроэнергии, стала одним из самых больших его преимуществ, особенно для тех, кто использовал эти процессоры в кластерных / стоечных системах. По-видимому, новое ядро Intel Dempsey частично решает эту проблему. Эти новые ядра изготовлены по 65 нм техпроцессу, что позволило существенно снизить энергопотребление, по сравнению с предыдущим 90 нм двухъядерным вариантам. Однако даже 65 нм Xeon 5000-серии с самой большой тактовой частотой позиционируется на 130 Вт TDP, и только более «медленные» модели имеют сравнительно терпимое TDP в 95 Вт. Для сравнения, топовые процессоры AMD линейки Opteron 285 имеют 95 Вт TDP, так что по этому параметру у процессоров AMD всё еще имеется 25% преимущество, если сравнивать самые быстрые процессоры Intel и AMD. В отличие от Paxville, некоторые из этих новых процессоров Xeon 5000-серии могут поддерживать технологию Intel Enhanced SpeedStep и режимы C1E. Тестируемый Xeon 5080, который по умолчанию работал на частоте 3,73 ГГц (14x множитель), на холостом ходу сбрасывал частоту до 3,2 ГГц (12x множитель), если был включен режим EIST. Однако процессор 5060 не будет сбрасывать частоту, так как по умолчанию он работает на частоте 3,2 ГГц (12x множитель), а он не поддерживает умножение меньше 12x.
При тестировании в открытом корпусе при максимальной нагрузке Xeon 5080 нагревался до 43 - 53°C. По сравнению с предыдущими Xeon это уже лучше, но все еще весьма горячо, и можно предположить, что в одно/двух процессорной конфигурации трудности с охлаждением всё же будут, а при 3/4 процессорах это уже будет проблемой. Довольно интересно, что, несмотря на изменение разъема, для охлаждения процессоров Xeon Socket-771 могут подойти кулеры Socket-604 процессоров. Для своих новых процессоров Intel изменила свои кулеры (массивные медные радиаторы), но по-прежнему они крепятся на стандартных 4-х ножках, проходящих через отверстия в материнской плате. Всё же шум вентиляторов довольно сильный, несмотря на то, что они поддерживают функцию PWM (Pulse Wave Modulation), корректирующую скорость вращения крыльчатки. Даже когда система находится в состоянии простоя, скорость вращения вентиляторов довольно большая. Пока вентиляторы родных кулеров двухъядерных Opteron'ов работают намного тише.
При тестировании энергопотребление измерялось ваттметром, как и в предыдущих наших тестах. Аппаратно тестовые системы для разных платформ конфигурировались как можно ближе друг к другу, и все они запитывались блоком питания Antec TruePower 550 EPS 12V. Управление питанием (EIST/PowerNow) не активировалось, так как Xeon 5060 и Paxville Xeon не поддерживают эту функцию. Но не забывайте, что на холостом ходу и при включенной функции PowerNow Opteron’ы могут потреблять значительно меньше электроэнергии по сравнению с Xeon'ами. Как видите, новые 65 нм процессоры 5000-серии более эффективны по сравнению с процессорами Paxville в пересчете на такт рабочей частоты, но все ещё не могут конкурировать с Opteron по энергопотреблению. Новые топовые 5080 процессоры при полной нагрузке потребляют меньше энергии, чем 2,8 ГГц Paxville, несмотря на почти 1 ГГц преимущество по тактовой частоте. Даже при 474 Вт энергопотреблении при полной нагрузке, используемый блок питания TruePower 550W обеспечивал работу системы без проблем. Хотя процессоры Xeon 5050/5030 не тестировались, по приблизительным оценкам можно предположить, что по энергопотреблению они будут сравнимы с high-end Opteron’ами. Проще говоря, если Вы хотите получить большую производительность на ватт, то нужно все еще выбирать Opteron. Однако, похоже, что новое ядро Woodcrest Xeon будет более конкурентоспособным по сравнению с рассматриваемыми здесь ядрами Dempsey. [N5-Новые платформы и модули памяти] Новые Dempsey-процессоры являются только частью нового арсенала Xeon компании Intel, и об этом тоже нужно рассказать. Наряду с процессорами, Intel вводит 3 новых чипсета, которые должны их поддерживать. Это чипсет 5000X для рабочих станций, 5000P и 5000-VS для серверов. Эти платформы отличаются в основном контроллерами памяти и видеоинтерфейсами PCI Express. Чипсет 5000X поддерживает до 32 ГБ памяти и шину PCI Express x16 (или 8 x 8 SLI - это не опечатка, 5000X, по-видимому, поддерживает SLI, хотя у нас не было возможности проверить это). Чипсет 5000-V поддерживает 16 ГБ памяти и не поддерживает PCI Express (для серверов минимальной конфигурации), а мощный 5000P поддерживает до 64 ГБ памяти и не поддерживает PCI Express (для high-end серверов). Согласно таблице параметров чипсетов 5000-серии, представленной на сайте Intel, кроме этих отличий в остальном они почти идентичны. Все три платформы поддерживают новую функцию Intel DIB (Dual Independent Bus), которая позволяет каждому процессору Xeon иметь свою собственную FSB шину, связывающую его с северным мостом. У процессоров Xeon предыдущих поколений оба процессора совместно использовали один канал, который при интенсивной нагрузке мог быть перегруженным. DIB позволяет каждому процессору иметь отдельный 8,5 ГБ/с канал связи с северным мостом, тогда как старые Xeon’ы вынуждены были совместно использовать всего один 6,4 ГБ/с канал. Теоретически, это должно способствовать большей производительности, особенно у топовых моделей, работающих при самых высоких частотах.
Новый чипсет 5000X также поддерживает FB-DIMM модули памяти. FB-DIMM –сокращение от full-buffered DIMM (DIMM с полной буферизацией), является новой интересной технологией, позволяющей устанавливать на современные high-end Xeon-платформы значительно больше памяти. Многие материнские платы формфактора Extended ATX, поддерживающие технологию FB-DIMM, уже сейчас работают с 64 ГБ памятью, тогда как платы того же размера с традиционной DDR/DDR2 памятью могут работать максимум с 16 ГБ памятью. Платформа Supermicro, которая использовалась при тестировании, может поддерживать память объемом 32 ГБ – для этого у неё есть 8 слотов FB-DIMM. FB-DIMM – это интересное сочетание новой и стандартной DDR2 технологий. Модули FB-DIMM используют стандартный 240-pin DDR2 интерфейс памяти и поддерживают те же самые тактовые частоты и уровни пропускной способности, как у стандартных DDR2 модулей. Например, модуль FB-DIMM 667 МГц имеет пиковую пропускную способность в 5,3 ГБ/с на модуль, такую же, как у модуля DDR2-667 МГц. Однако модули FB-DIMM имеют дополнительный элемент – AMB (Advanced Memory Buffer – расширенный буфер памяти). Эта микросхема (которую видно на фотографии, представленной ниже) расположена в центре модуля памяти DDR – она напрямую связана с контроллером памяти. Микросхема AMB обращается к контроллеру памяти с последовательными, а не с параллельными запросами, как в традиционных DDR и DDR2 модулях. Так как контроллеру памяти нужно поддерживать связь с несколькими простыми, высокоскоростными последовательными интерфейсами, то можно использовать больше модулей, и проблем с сохранением целостности сигнала не будет. AMB является своеобразным контроллером памяти, и главный контроллер памяти системы связан с AMB контроллерами, а не со всеми небольшими модулями памяти системы.
Похоже, что FB-DIMM будет рекомендоваться для high-end рабочих станций и серверов, которым нужны большие объемы памяти. Такие модули заменят традиционные ECC/регистровые модули. FB-DIMM модули обеспечивают большую стабильность и поддержку CRC. Они могут отключать неисправные компоненты памяти и продолжать надежно работать, сводя к нулю простои в течение всего срока службы модулей памяти. Тем не менее, и у них есть одна проблема – микросхемы AMB модулей FB-DIMM могут довольно сильно нагреваться. Поэтому все FB-DIMM модули имеют пластинчатый радиатор, изготовленный из алюминиевых сплавов, который предотвращает перегрев микросхемы AMB. Во время тестирования памяти измерялась температура микросхемы AMB. На открытом стенде она была в пределах 57 - 60°C – намного горячее, чем остальные части модуля. Первое время системы, в которых использовались FB-DIMM модули памяти, должны были иметь отдельные вентиляторы, охлаждающие банки модулей памяти, так как время от времени они могли сильно нагреваться. Такое тепловыделение, очевидно, не является проблемой для Intel и её партнеров, поскольку такие модули хорошо продаются, и сейчас FB-DIMM системы уже не требуют специального охлаждения (хотя оно, конечно, не повредило бы). Чипсет 5000X имеет также 4-х канальную шину памяти, которая поддерживает новую технологию Intel двух независимых шин памяти. Материнские платы 5000-серии с 4 или большим количеством FB-DIMM DDR2-667 модулей памяти и двумя процессорами теоретически могут обеспечивать пропускную способность памяти до 21,3 ГБ/с – предыдущие Xeon-системы только 8,5 ГБ/с (двухканальная DDR2-533). Чипсеты 5000-серии могут работать минимум с 2 модулями памяти (возврат к двухканальному режиму). С одним модулем памяти на плате они работать не будут. С целью проверки того, как влияет поддержка четырех каналов памяти на её пропускную способность и латентность были проведены небольшие тесты. Имея 8 FB-DIMM модулей, с помощью синтетического теста SiSoft Sandra 2007 x64 мы протестировали различные конфигурации.
Эти тесты показали, что поддержка четырех каналов FB-DIMM памяти чипсетами 5000-серии действительно увеличивает пропускную способность памяти по сравнению с Xeon-системами предыдущих поколений (которые «застревали» где-то около 3200 МБ/с). Однако, той пропускной способности, которую обещает Intel, мы не получили и близко. Фактически, мы получили примерно 25% от заявленной пропускной способности. Здесь что-то работает очень даже неэффективно. Для сравнения, Opteron-системы могут обеспечить пропускную способность памяти на уровне 12 ГБ/с, и на практике в тестах они могут показать результат в более чем 10 ГБ/с, что не дает поводов сомневаться в эффективности интегрированного контроллера памяти AMD. Intel’овский внешний (не на кристалле) 5000X контроллер памяти просто не может выжать из модулей памяти столько, сколько обещает теория. Однако приятно видеть, что добавление большого количества модулей не сильно влияет на латентность. Как бы то ни было, в целом, по сравнению с тем, что было у Intel раньше, платформа значительно улучшена, поэтому резкой критики она не заслуживает.
[N6-Тестовые системы] Система Intel "Dempsey" Dual Core Xeon
Система Intel "Paxville" Dual Core Xeon
Система AMD Opteron
Тестовые приложения
Результаты наших первых синтетических тестов оказались для новых процессоров Intel Xeon и положительными, и отрицательными. В арифметическом и мультимедийном тестах новые 3,73 ГГц Xeon смогли опередить лучшие 2,6 ГГц процессоры AMD Opteron. Однако, в тесте пропускной способности памяти у Opteron все еще большое преимущество, благодаря его поддержке NUMA, что обеспечивает пропускную способность более чем в 10 ГБ/с с DDR-400 модулями памяти. Тем не менее, у Intel хорошее начало, но давайте перейдем к реальным тестам. [N8-3D Studio Max 7.0] 3D Studio Max 7.0 – сейчас это один из самых популярных 3D тестов. Поводился тест на прорисовку сцены "Radiosity", которая отличается очень реалистичным освещением. Чем меньше время прорисовки сцены, тем выше производительность системы. [N9-Alias's Maya 6.5] Alias's Maya 6.5 – одно из самых используемых приложений в 3D моделировании. С помощью Mental Ray проводился рендеринг одного кадра с HD разрешением. Maya сильно оптимизирована под SMP. Чем быстрее выполняется рендеринг, тем выше производительность системы. Пользователям рабочих станций видно, что Xeon вернулся. Новый двухъядерный Xeon может составить конкуренцию самыми быстрым процессорам Opteron. Сложный рендеринг сцены 3D Studio Max 7.0 показывает, что лучший процессор Intel Xeon справляется с этой задачей быстрее всех, опережая лучший процессор AMD Opteron примерно на 10%. В тесте Maya Opteron побеждает, хотя двухъядерные процессоры Xeon отстают от него совсем ненамного. [N10-Windows Media Encoder 9] Windows Media Encoder 9 компании Microsoft является бесплатным кодировщиком мультимедиа. С помощью WME9 кодировался 200 МБ .mpg файл высоко разрешения в файл .wmv. Кодировка осуществлялась с качеством DVD video и CD audio. [N11-LAME MT 3.97] MP3 кодирование очень сильно нагружает CPU и тестирует производительность математического сопроцессора (FPU). Для этого использовался тест LAME MT 3.97, который оптимизирован под SMP, MMX, 3DNow и SSE. 200 МБ .wav файл перекодировался в 160 kbps MP3 – замерялось время кодирования. Довольно интересно, что новый двухъядерный Xeon Intel все еще тормозит в Windows Media Encoder 9 .0, хотя его показатели уже намного лучше, чем у его двухъядерных предшественников. Обычно в этом тесте побеждала архитектура Intel, а не AMD, но теперь они поменялись местами и Opteron уверенно лидирует. Новые Xeon'ы весьма успешны в LAME audio кодировании, показывая лучшее время для рабочих станций. [N12-CS2] CS2 - последняя версия самого популярного приложения для редактирования изображений. Применялись различные фильтры, замерялось время обсчета изображения. Время обсчета всех фильтров суммировалось. Чем меньше суммарное время применения набора фильтров, тем выше производительность. [N13-Macromedia Flash MX 2004] Flash MX 2004 компании Macromedia является стандартным индустриальным приложением для работы с векторной графикой. Проводился тест по импортированию и редактированию 50 МБ MPEG видео во Flash MX для воспроизведения. Засекалось время импортирования видеофайла с качеством 768 kbps. По сравнению со старыми, новые Xeon’ы справляются с созданием контента намного лучше, и уже конкурируют с самым быстрым двухъядерным Opteron’ом. AMD все еще продолжает лидировать в Photoshop CS2, хотя раньше её процессоры намного опережали конкурентов и в импорте/ |
Источник: www.gamepc.com