Каталог
Последствия некоторых архитектурных решений. Новый вариант реализации HyperThreadingЕще одним важным нововведением в Nehalem стала реализация HyperThreading. В свое время, проектируя Core 2, инженеры отказались от данной технологии, так как софт был еще не оптимизирован даже под два реальных ядра, а уж о реальной пользе двух дополнительных виртуальных ядер можно было и не мечтать. Сейчас по мнению Intel ситуация иная, и самое время реализовать HT для обновленной архитектуры. Вспоминая первый вариант HyperThreading на Pentium 4, можно выделить два основных минуса: серьезное возрастание и без того немалого энергопотребления при активации технологии, и снижение производительности CPU в случае, если программа не задействует виртуальное ядро. С учетом того, что сегодня о соотношении производительности на Ватт разработчики не забывают, но и реальных ядер без того много, особенно интересно, как поведет себя новая версия HT. Скажем, что для получения полной картины мы провели достаточное количество тестов, однако приводить все результаты не имеет смысла. Технология работает хорошо, хотя и не идеально. Можно выделить 3 результата, соответственно отражающих максимальный эффект, среднее положение вещей, и наихудший вариант.
Видно, что в приложениях, хорошо оптимизированных под многоядерность, эффект от включения HT может достигать 30%, что сопровождается 12% ростом энергопотребления (как раз вспоминается правило 1:2). При этом, в общем и целом, большинство приложений не получают никакого выигрыша от HT, так как не способны задействовать и 4 физических ядра. В худшем случае производительность немного падает, однако при этом хотя бы не возрастает энергопотребление, как было в случае с Pentium 4, да и случаи такие редки. Таким образом, выключать HT смысла нет – вы как минимум не проиграете в производительности, а, можете и существенно выиграть. Причем чем “тяжелее” приложения, запускаемые на Nehalem, тем выигрыш будет больше. Источник: www.tomshardware.com www.anandtech.com [N6-Последствия некоторых архитектурных решений. Новые технологии контроля энергопотребления Core i7] На особое место хочется поставить заслуги инженеров Intel, сумевших сделать новый процессор энергетически эффективным и столь же экономичным, как его предшественника, несмотря на возросшую сложность дизайна и добавление многочисленных усовершенствований и улучшений. Стоит повториться, что первый коммерческий степпинг не идеален. Например, Core 2 Quad Q9450, работающий на частоте 2.66 ГГц, имеет TDP на уровне 95 Вт, тогда как i7-920 на той же частоте требует 130 Вт. Обусловлено это тем, что Intel приходиться перестраховывается. Пока производство не отлажено у корпорации нет возможности тестировать CPU на пониженных напряжениях, поэтому почти для всех Core i7 сейчас Vcore устанавливается не ниже отметки 1.137 В. Q9450, при этом, штатно может питаться и 0.85 В (конечно, все зависит от удачности конкретного экземпляра процессора, но официально заявленное минимальное значение такого). Это отнюдь не значит, что i7-920 не может работать, например, на 1.0 В, но такие пониженные напряжения надо подбирать самостоятельно, не забывая тестировать стабильность. Новые степпинги однозначно принесут понижение напряжения и TDP, но, как показало тестирование, даже сейчас дела обстоят очень хорошо. Для сравнения мы решили воспользоваться самыми горячими топовыми процессорами новой и предыдущей линеек – Core i7-965 Extreme Edition и Core 2 Extreme QX9770 соответственно. Они имеют схожий TDP (130 Вт для i7 и 136 Вт для QX) и работают на одинаковой частоте 3.2 ГГц. Для получения более точных результатов мы использовали несколько семплов процессоров, усредняя в таблице полученные данные: Перед представление результатов очередное важное замечание – при сборке системы на базе Core i7 обязательно проверяйте установки BIOS материнских плат в разделе Power Management или аналогичных. Все энергосберегающие технологии должны быть включены, иначе повысится потребление в состояние покоя и т.п. В нашем случае, например, почему то оказалась выключенной опция QPI Power Management, которая недвусмысленно влияла на результаты, естественно в худшую сторону. После ее активации верная картина получилась такой:
Крайне впечатляющие результаты! Особенно если принимать во внимание, что контроллер памяти теперь находится под крышкой процессора, и что активация HT также вносит свою лепту в энергопотребление. Особенно заметен выигрыш в состоянии покоя. В играх также разница очень и очень существенна. Более того, посмотрите на сами результаты тестов, во время которых были сделаны замеры энергопотребления:
Поразительно, но почти во всех тестах Core i7 взял верх над своим предшественником, потребляя при этом меньше энергии. Выходит, что, несмотря на одинаковый техпроцесс, Nehalem может быть намного экономичнее Penryn. Особенно интересным выглядит факт превосходства нового CPU под высокой нагрузкой на все вычислительные блоки – ведь если победу в состоянии покоя легко можно объяснить новомодной технологией энергетических шлюзов, полностью отключающих питание ядер, то в остальных сложных режимах спасибо говорить надо однозначно интеллектуальному блоку Power Control Unit. Источник: www.tomshardware.com www.anandtech.com [N7-Последствия некоторых архитектурных решений. Функционирование турбо-режима и оверклокинг] Так сложилось, что последние семейства процессоров Intel отлично разгоняются. Видимо, сказывается высокая степень отлаженности 65 и 45 нм техпроцессов в паре с удачной компоновкой самих CPU и постоянной работой над улучшением тепло-электрических характеристик в виде постоянно обновляющихся степпингов. 4 ГГц на простом воздушном охлаждении для процессоров Penryn – привычная частота, покоряющаяся подавляющему большинству CPU без каких-либо проблем. Однако штатные частоты CPU в первую очередь по маркетинговым причинам ограничены. Какой смысл выпускать, скажем, 3.8 ГГц Core 2 Duo, когда и на трех гигагерцах конкуренты из стана AMD повержены, а конкуренция идет не на поле производительности, а скорее ценообразования. Тем не менее, процент пользователей, о разгоне осведомленных, крайне невелик, и разномастные CPU от Pentium Dual Core E2140 до Core 2 Duo E8600 трудятся на штатных частотах, никак не задействуя свои резервы. Справедливо решив, что незачем добру пропадать, в Intel решили создать встроенную в CPU технологию авто-разгона. Впервые она была представлена в мобильной версии Penryn, а в Nehalem получила свое дальнейшее развитие. Мы уже рассказывали о принципе ее работы, однако стоит кратко повторить суть, так как с этим связаны некоторые возникшие недоразумения при ручном разгоне. Итак, у каждого CPU есть заводской TDP. Сейчас, напомним, для всех Bloomfield он равен 130 Вт. Блок PCU постоянно мониторит потребляемую энергию, напряжения, температуру процессора и другие параметры. Если в данный конкретный момент температура достаточно низкая, а TDP не выходит за установленные рамки, множитель может быть увеличен либо на единичку, либо на двойку. Это может сопровождаться отключением неиспользованных ядер и прочими действиями для поддержания приемлемого тепловыделения. При этом если процессор вдруг начинает перегреваться, то мгновенно возвращаются штатные, или даже ослабленные параметры для предотвращения угрозы перегрева. Кстати говоря, в покое SpeedStep скидывает множитель до x12.0, что соответствует частоте 1.6 ГГц. Ясно, что Turbo-Mode с его дополнительные 133 или 266 МГц особой погоды не сделают, но и они будут приятным бонусом для неискушенных пользователей. Чтобы результаты основного тестирования были “честными” и их можно было бы с точностью воспроизвести, в основном тестировании TM мы отключили, однако при включении данной технологии преимущество может оказаться приблизительно таким:
Много это или мало – судить сложно, наверное, лучше, чем ничего. В любом случае, автоматический разгон никогда не поднимал производительность системы существенно. А вот с ручным разгоном Nehalem изначально возникли сложности. Дело в том, что появилась информация, согласно которой блок PCU намертво блокировал любые попытки разгона при превышении процессором установленных границ TDP. Естественно, при любом мало-мальски значимом повышении частот энергопотребление и тепловыделение существенно превышает заводское значение TDP. Отключить эту функцию было возможно только на “экстремальном” i7-965. Таким образом, об оверклокинге фактически можно было забыть. Началось шаманство с целью выяснения, как повысить значения множителя при переходе CPU в Turbo Mode и прочие неочевидные действия. Однако, в конце концов, оказалось, что невозможность отключения аппаратной защиты от превышения TDP – не более чем недоработка первых версий BIOS, которыми снабжались самые популярные платы с LGA1366 – ASUS Rampage II Extreme и Intel DX58SO. После обновления появляется такая опция: А в версии BIOS для ASUS: Итак, отключив данную не особо полезную функцию, можно преступать к разгону. Фактически, технология особо не отличается от привычной нам по Core 2, большой плюс состоит в том, что отныне частота памяти напрямую не привязана к FSB. Так как множители на неэкстремальных процессорах залочены на повышение, приходится поднимать частоту тактового генератора. Для того чтобы не затрагивать другие частоты, зависящие от него (например, шины QPI и Uncore), соответственно следует снижать их коэффициенты умножения. Без повышения напряжения на воздушном охлаждении наш младший CPU Core i7-920 смог разогнаться до 3.3 ГГц (тактовый генератор работал на 165 МГц). С небольшим повышением Vcore до 1.37 V стала достижима частота ядра в 3.7 ГГц. Процессор охлаждался кулером Thermalright Ultra 120 Extreme, стабильно проходил трехчасовое тестирование OCCT, а также Linpack. Повышение частоты Bclock сопровождалось крахом системы. При этом повышение напряжения еще на одну ступень сопровождалось серьезным ростом тепловыделения, а убивать процессор в наши планы не входило. Очевидно, что это не предел, однако необходимы более серьезные системы охлаждения для выяснения потенциала CPU при повышении напряжения. Однако оказалось, что можно сделать еще кое-что, для того, чтобы немного увеличить частоту CPU не поднимая напряжения и частоты тактового генератора. Оказалось, что турбо-режим исправно работает при отключенной функции контроля TDP, и даже с разогнанным CPU! Поэтому под нагрузкой заблокированный множитель x20.0 поднимался до x21.0, и частота составляла 3.89 ГГц. Процессор был все также стабилен и функционировал на высокой частоте, почти в полтора раза превышающей номинал, при допустимых температурах (Intel заявляет о критическом пороге срабатывания троттлинга 100 градусов, при наших экспериментах по разгону температура под нагрузкой ни разу не превышала 80 градусов). Так что, оказалось, разгонять Core i7 не так и сложно, а частотный потенциал процессора ничуть не ухудшился по сравнению с Core 2 Quad (Wolfdale не работают на столь же высоких частотах, как однокристальные двухядерные Penryn). Думается, что в среднем для CPU степпинга C0 будут покоряться частоты в 3.8-4.0 ГГц, а в дальнейшем с переходом на новые ревизии частоты только возрастут вместе с понижением напряжений и TDP. Что касается экстремального i7-965 EE, возможность вручную поднять множитель без повышения частоты системного генератора способствовала разгону до 4 ГГц при том же напряжении 1.37 В, с которым i7-920 работал на 3.7 ГГц. 4.2 ГГц покорились при напряжении 1.5 В: С использованием системы водяного охлаждения CoolIT FreeZone Elite, CPU заработал и на 4.5 ГГц при 1.55 В. Источник: www.tomshardware.com www.anandtech.com [N8-Intel X58 как неотъемлемая составляющая новой платформы] Так как новый процессор Core i7 является полностью новой моделью CPU в конструктивном и компоновочном плане, для него нужен и новый чипсет. Основная причина, по которой старые северные мосты вроде P45 или X48 с Core i7 несовместимы – интеграция контроллера памяти в сам процессор. Так как Intel традиционно является лидером в производстве чипсетов для своих процессоров, и в этот раз синхронно с релизом Core i7 корпорация представила новый набор логики X58. На сегодня он является единственным чипсетом, который работает с Core i7. Его блочная диаграмма в традиционных цветах Intel выглядит так: Если говорить грубо, X58 (кодовое название – Tylersburg) превратился из северного моста в контроллер PCI-Express. С этим связаны некоторые интересные особенности, о которых мы поговорим абзацем ниже. В качестве южного моста выступает уже знакомый нам ICH10/R. Об уже стандартных возможностях вроде 12 портов USB 2.0, 6 SATA2 или HDA кодека говорить смысла нет. Скорее всего, Intel не стали трогать южный мост потому, что в следующем поколении чипсетов (например, P55) дизайн системной логики станет моночиповым, то есть не будет отдельно северного и южных мостов. Такая схема уже давно применялась NVIDIA (еще в nForce 3 для K8 чипсет состоял из одной микросхемы), это упрощает разводку материнской платы, и, следовательно, в последующем удобство сборки. Но сейчас мы имеем, что имеем, а северный мост таки заслуживает внимания. Дело в том, что впервые на чипсете Intel NVIDIA разрешила реализовать поддержку SLI. Ранее все чипсеты компании поддерживали многоплатные конфигурации лишь для Crossfire, NVIDIA ни в какую не хотела давать Intel лицензию на использование своей технологии. Существует мнение, что в ответ на такое поведение Intel решила не давать NV лицензию на проектирование чипсетов для Nehalem и QPI, но, в конце концов, благодаря дипломатичным переговорам обе стороны обменялись своими козырями – NVIDIA выпустит свои чипсеты для Core i7, а для Intel отныне не будет требоваться отдельный чип nForce 200 для организации SLI. Это, к счастью, не отменяет поддержки Crossfire – владельцы материнских плат на базе X58 теперь будут вольны выбирать, кому из графических вендоров отдать предпочтение при построении системы с несколькими видеокартами. Конечно, впервые разрешив поддержку Scalable Link Interface на чипсете стороннего производителя, NVIDIA поставила определенные условия. Так, корпорация будет тщательно тестировать на совместимость с SLI все материнские платы, построенные на базе X58. Тестовый набор, согласно пресс-релизу корпорации, будет состоять из прогона на оборудовании разных брендов бенчмарков 15 самых популярных на данный момент игр, 15 специализированных тестов, тестов на соответствие реализации PCI-Express заявленным спецификациям. При этом будут тестироваться как 2-way, так и 3-way и Quad-SLI связки. На сегодня список сертифицированных моделей выглядит так: В общем-то, в таком наборе тестов ничего оригинального нет – сертифицируя для Crossfire платы, AMD выполняет примерно тот же самый набор действий. Интересно другое – материнская плата самой Intel, на которой нами проводились системные тесты, оказалась не сертифицирована для работы с SLI, поэтому для игровых тестов использовалась ASUS Rampage II. Вообще для X58 предлагается несколько конфигурации SLI в зависимости от того, как будут распределены линки PCI-E 2.0 и соответственно слоты. Самый простой и популярный на данный момент вариант – 2-way SLI, сформированный двумя полноценными слотами PCI-E 2.0 16x, подключенными нативно к северному мосту. В таком варианте не будет никаких проблем с установкой, например, пары GeForce GTX 280 в SLI или двух Radeon HD 4870X2 в Crossfire X. При второй схеме подключения слота на материнской плате должно быть три, причем один из них будет работать на полной скорости (x16), а два других ограничатся x8. Опять же, в таком случае будет задействован только сам X58. Такая конфигурация является простейшей для создания тройного SLI. Да, два слота не будут работать на полной скорости, но на сегодня нет, а в обозримом будущем не появится ни одной видеокарты, которой пропускной способности PCI 2.0 x8 не будет достаточно. Так же 32 линии могут разделяться и на четыре восьмискоростных слота. По мнению, NVIDIA такой подход может быть применим при комбинировании 3-way SLI и отдельной карты для акселерации PhysX. Лично мне искренне интересно, наберется хотя бы 0.005% всех ПК на Земле, в которых будут трудиться 3 видеокарты NVIDIA для графики и одна для физики. Четвертый вариант SLI, предложенный NVIDIA, содержит чип nForce 200. Он подключается к 16 линиям, предлагаемым X58, и сам при этом предоставляет 2 линии по x16. Получается экзотическая конфигурация, при которой все 3 слота вроде как работают на полной скорости x16. Не совсем понятно правда, как умудряется nF 200 предоставлять 32 линии PCI-E, будучи сам подключен к 16 линиям, но, оставим это на совести маркетологов. Наконец, последий тип самый нестандартный и, видимо, будет применяться только на полусерверных платах вроде Skulltrail, на которых элементарно будет достаточно места для того, чтобы развести целых 2 nForce 200. Каждый из них будет забирать по 16 линий от Tylesberg, предоставляя четырем слотам скорость шестнадцати линий PCI-Express. По словам NVIDIA, четыре слота PCI-E x16 понадобятся для рабочих станций с графическими процессорами Tesla, основное предназначение которых будет заключаться отнюдь не в играх, а в научных расчетах и прочих ресурсоемких действиях. Таким образом, пожалуй, самым интересным нововведением X58 стоит считать поддержку разнообразных режимов работы графических плат, а значит и направленность всей платформы Core i7 на игры далеко не в последнюю очередь. Мы обязательно протестируем, насколько хорошо масштабируется производительность при использовании самого современного High-End железа в играх: Однако перед этим нам предстоят бенчмарки неигровых приложений, а также знакомство с платами, использованными при тестировании. Источник: www.tomshardware.com www.anandtech.com [N9-Тестовая конфигурация и программы]
Программы, использованные для системного тестирования
Источник: www.tomshardware.com www.anandtech.com [N10-Кратко об использованных материнских платах] Стоит сказать пару слов об использованных материнских платах. Вариант от Intel, как и всегда, ничего интересного собой не представляет. Самый отрицательный момент платы под кодовым названием Smackover заключается в разводке упрощенного варианта слотов памяти. Если помните, мы говорили о том, что на платах могут встречаться как 6 полноценных слотов для трехканального режима, так и 4 слота с трехканальностью лишь для первой тройки. По идее, Intel было бы выгоднее на своей плате реализовать именно продвинутый вариант, однако, по каким-то причинам решено было развести лишь 4 слота. Причем расположение компонентов нестандартно для ATX материнской платы, а схоже с некоторыми платами для AMD K8 – слоты памяти развернуты перпендикулярно своему стандартному расположению и вынесены на верхний край платы за сокет. Северный мост чипсета при этом располагается на законном месте модулей памяти. Такая компоновка нестандартно, однако неудобств при сборке не вызывает, как и при установке габаритных кулеров. Шестифазная система питания процессора реализована качественно, на греющихся мосфетах установлены радиаторы. К сожалению, полимерные конденсаторы с твердым электролитом использованы только в подсистеме питания процессора, остальные “банки” классические, хотя и от фирмы, дорожащей своей репутацией – Rubicon. Вообще говоря, к охлаждению платы инженеры Intel подошли со всей серьезности – на северном мосту X58 установлен массивный радиатор с высокими ребрами, причем в комплекте поставляется вентилятор небольших размеров. Сделано это не зря – несмотря на 65 нм технологию производства, Tylesberg обладает горячим нравом и при длительной работе под высокой нагрузкой нагревает радиатор очень прилично. Южный мост при этом довольствуется небольшим декоративным радиатором, однако этого вполне достаточно. Слоты PCI-Express 2.0 разбиты по схеме 2 слота по 16 линий на каждом, при этом, напомним, на плате работает лишь Crossfire, для SLI Smackover не предназначена. В общем и целом, несмотря на высокое качество изготовления материнской платы Intel и имя корпорации, мы бы порекомендовали воздержаться от приобретения DX58SO, и посмотреть в сторону более интересных материнских плат от сторонних производителей, например, ASUS Rampage II Extreme. Плата относится к серии Republic Of Gamers, и этим сказано многое. Многие считают данную серию пустой тратой денег, однако для энтузиастов один взгляд на плату Rampage II может послужить поводом для траты немалой суммы из бюджета на данное чудо инженерной мысли. Во-первых, инженеры ASUS смогли скомпоновать на восьмислойном текстолите чуть большего, чем полный ATX (без проблем вмещается в нормальные корпуса), размера широкий набор современных функций, реализованный посредством нескольких дополнительных котроллеров, и сдобрить все это несколькими уникальными фишками, которые не встретить больше нигде. В отличие от DX58SO, Rampage II Extreme предлагает пользователям воспользоваться шестью слотами DDR3: При этом неподалеку от них расположен выведенный ASUS модуль контроля за всеми мыслимыми и немыслимыми напряжениями, которые могут потребоваться при экстремальном разгоне: В терминологии ASUS данная панелька называется TweakIT, и, если мне не изменяет память, ранее ни на каких платах таких расширенных возможностей для ручного мониторинга, предусмотренных производителем, не встречалось. Выведены контактные площадки для замера напряжений DIMM, ICH, ICH PCI-Express, IOH, QPI, CPU PLL и самого Vcore, так что больше не будет необходимости лазить щупами в околосокетном пространстве, пытаясь свериться со схемой вольтмода и боясь попасть в неправильную точку. Кроме этого присутствуют стандартные кнопки подачи питания и перезагрузки, чрезвычайно удобные при эксплуатации платы вне корпуса. На нижнем краю платы раздолье для подключения периферии – распаяны все 6 SATA2, предоставленные ICH10R, причем в удобном наклонном исполнении. Для них доступны все необходимые для дома режимы RAID – 0, 1, 5 и 10. Также в распоряжении пользователя дополнительный контроллер JMicron, который отвечает за функционирование черного SATA порта, IDE канала и разъема eSATA на задней панели. В том же углу платы распаян и фирменный чип ASUS iROG, предоставляющий те же функции, что и ранее на прошлых платах серии Republic Of Gamers – дополнительные возможности контроля напряжений, управление набортными LED индикаторами, способность отката BIOS’а и т.д. Что касается слотов расширения, ASUS разместили на плате 2 разъема PCI-E x1, один из которых выкрашен в черный цвет и предназначен для установки фирменной звуковой карты SupremeFX на базе ADI SoundMAX 2000B, поддерживающей программно набор инструкций X-Fi 4.0. К сожалению, ADI больше не будет производить чипы для звуковых карт, однако в ближайшем будущем поддержка существующих решений будет продолжена. Что касается конфигурации быстрых PCI-E слотов для видеокарт, для них доступно два варианта – либо по 16 линий на два слота PCI-E x16 (третий тогда неактивен), либо на верхний слот – 16 линий, а два нижних делят между собой по 8 линков. Таким образом, на плате можно реализовать какой угодно массу вариантов построения конфигурации с несколькими видеокартами. Сложная схема конструкции радиаторов скрывает под собой не только оба моста X58 и ICH10R, но и отдельную карту для управления напряжениями VTT CPU. Радиаторы со своей задачей справляются хорошо, как и в случае с DX58SO на помощь пассивной конвекции приходит вентилятор. Несмотря на небольшие размеры, он не слишком шумит и выделяется на фоне остальных компонентов системы. Неприятный момент, который можно видеть на фото, состоит в том, что при использовании SLI/CF конфигураций, все слоты расширения до единого блокируются. Возможно, данный недостаток хотя бы для верхнего PCI-E x1 устранят до того, как плата будет запущена в серию (у нас побывал тестовый экземпляр). Кстати, с установленными видеокартами Rampage 2 выглядит поистине монструозно: Задняя панель платы лаконична и явно нацелена не на удобство повседневного использования, а для облегчения достижения рекордов разгона. Кнопка сброса BIOS и PS/2 порт явно на это намекают. Также распаяно 6 портов USB (остальные 6 доступны при подключении выводов к внутренним разъемам материнской платы) и уже упомянутый порт eSATA. Два гигабитных сетевых адаптера используют чипы Marvell 88E8056-NNC1, а FireWire доступен благодаря VIA VT8308P. Околосокетное пространство со всех сторон огорожено радиаторами охлаждения подсистем питания процессора, памяти и северного моста чипсета. Для CPU заявлено 16 маркетинговых фаз, 12 из которых посредством EPU2 могут отключаться, экономя энергию (интересно, кто-нибудь будет задумываться об экономии электричества, покупая такую плату и связку из пары 4870X2 в Crossfire?). Говорить о качестве изготовления платы и использованной элементной базе даже как-то и не требуется, все, само собой разумеется, выполнено на высшем уровне. Конечно, удовольствие от обладания такой продвинутой платой для энтузиастов приходится платить, и платить немало, но на фоне общей стоимости системы с Core i7 и парой high-end видеокарт лишние $500 за Rampage II Extreme не кажутся такой большой суммой. Хочется отдельно отметить |
Источник: НИКС - Компьютерный Супермаркет