Каталог
Новый сокет, кулер и дизайн упаковкиМногочисленные архитектурные изменения потребовали серьезного усовершенствования дизайна платформы. Вместе с переносом контроллера памяти в процессорное ядро и соответствующей сменой поколений чипсетов, Intel разработали для Nehalem новый процессорный сокет и усовершенствовали кулер. В качестве приятного дополнения изменили и дизайн упаковки коробочной Retail-версии процессора. Трехканальный КП DDR3 потребовал серьезного увеличения количества контактных площадок в сокете, с 775 до 1366. В свое время у AMD случился такой же впечатляющий рост – с 462 до 940 контактов. Конструкция самого сокета принципиально не изменилась, отныне он лишь более прочно закреплен на материнской плате, сам процессор прижимается все той же рамкой: А вот так выглядит брюшко процессора. Интересный момент – контактные площадки стали немного вытянутыми, и теперь напоминают эллипс вместо правильного круга: LGA775 и 1366 в сравнении: А вот и сам процессор: В сравнении с предшественником… : Интересно, что впервые на лицевой стороне CPU также присутствуют контактные площадки. Однако они задействуются только в процессе производства, а для конечного пользователя никакой полезной нагрузки не несут. При проектировании нового кулера инженеры Intel не стали изобретать велосипед, фактически просто укрупнив предыдущую версию своего творения и несколько изменив конфигурацию ребер. На фото слева – боксовый кулер для 45нм двухядерных CPU Intel, по центру – для чеырехядерных, справа – новинка для Bloomfield. Для Extreme версии охладитель, как и ранее, более продвинутый, и также не особенно сильно отличается от кулера для процессоров Core 2 Extreme: Стоит отметить, что из-за изменившихся габаритов сокета и расположения крепежных отверстий, старые кулеры и ватерблоки не будут подходить к новому разъему. Большинство производителей первого эшелона вроде Zalman, Thermaltake или Thermalright уже выпустили отдельные комплекты крепежа, а новые ревизии кулеров комплектуются ими уже штатно. Кстати говоря, коробка неэкстремальных процессоров будет выглядеть следующим образом: Источник: www.tomshardware.com www.anandtech.com [N4-Последствия некоторых архитектурных решений.Работа с памятью] Во время написания теоретической статьи мы множество раз задумывались о характере изменений, внесенных инженерами в Nehalem относительно Core 2. Согласно формуле, которую избрали для себя сами проектировщики, на 1% увеличения энергопотребления должно было приходиться 2% увеличения производительности. Однако вопрос в том, как правильно измерять эту самую производительность. Ведь даже добавление шины QPI в одних задачах может не сказать вообще, а в других – проявить себя в полный рост. Тоже справедливо и для нового трехканального контроллера памяти, и для реструктурированной иерархии кэша. На самом деле больше всего вопросов вызывают именно изменения в работе с памятью, на них стоит остановиться подробнее. По опыту предыдущих тестирований несложно предугадать, например, в каких приложениях эффект от виртуальных ядер HyperThreading будет ощутим, а вот попытаться предсказать поведение Bloomfield при работе с памятью в обычных домашних приложениях – трудновато. Судите сами – с одной стороны полностью переработана кэш-память. Вместо простой, привычной и понятной структуры двухуровнего кэша перед нами механизм, работающий с тремя типами памяти разного размера и скорости. При этом крайне важный размер L2 сокращен до 256 Кб на ядро. Сможет ли это компенсировать большой, но медленный L3? Как поспособствует встроенный КП, в каких режимах он будет наиболее эффективен? Все это лишь предстоит выяснить. Чтобы не быть голословными, приведем для начала таблицу задержек кэшей различных уровней в Bloomfield и Penryn:
Такое устройство характерно скорее для серверных CPU, Opteron давно использует схожую структуру с небольшим L2 и огромным L3. А вот самый первый Pentium 4 Extreme Edition, в котором добавили L3 в свое время не получил от этого существенной прибавки в скорости обычных приложений. Про базы данных и прочие серверные операции мы не говорим, так как перед нами все-таки процессор под торговой маркой Core, а не Xeon. Тем не менее, замерить непосредственно эффективность работы кэш-памяти проблематично. Необходимые инструменты отсутствуют, да и в любом случае неравные платформы (не забываем про месторасположение КП) даже с одинаковой памятью могут дать слишком большую погрешность измерений, сводящую полезность результатов на “нет”. А вот отдельно скорость работы с памятью измерить можно. Только посмотрите, насколько сократились задержки КП при работе с DDR3 от переноса последнего в ядро! Более того, как уже отмечалось, каналов памяти теперь целых три, и пиковую пропускную способность в 25.6 Гб/c CPU достигает только при установке модулей на все три 64-битных контроллера. Нельзя не сказать и об особенностях работы КП Nehalem, которые будут трактоваться производителями материнских плат на свой вкус. Дело в том, что “набрать” трехканальность можно будет двумя способами. На некоторых материнских платах будет установлено 4 слота, на некоторых – 6. В случае использования конфигурации 4х слотов, первые три будут соответствовать трем каналам контроллеров в CPU, а модуль RAM, установленный в четвертый слот, будет разделять пропускную способность одного из каналов. Другими словами, если у вас установлено 4 планки по гигабайту во все 4 слота, при доступе к первым трем гигабайтам пропускная способность будет на уровне заявленных 25.6 Гб/с, а как только потребуется обратиться к четвертому гигабайту, она упадет до уровня производительности при использовании одноканального режима. В любом случае даже в таком режиме общая производительность будет больше, чем при двухканальной памяти. Выглядеть это будет так: Более продвинутой является конфигурация с использованием 6 слотов для трех каналов по 2 модуля на каждый канал: Тут все понятно и прозрачно – для трехканалности следует устанавливать либо три, либо шесть модулей. Однако все это теория. Дополнительный третий канал памяти это, конечно, очень серьезно, однако будет ли заметен от него эффект, или же в реальных приложениях практическая ценность третей планки будет сводиться лишь к увеличенному объему? Проведя тестирование Nehalem с использованием двух и трехканального режима работы, можно сделать вывод, что это задел на будущее. Серьезный эффект от огромной пропускной способности могут получить лишь будущие серверные системы, построенные на базе CPU с числом физических ядер более шести и с несколькими такими процессорами, объединенными для параллельных вычислений. Сейчас же для домашних пользователей третий модуль является, фактически, пустой тратой денег. Хотя для получения максимальной отдачи от Nehalem и он, конечно, не лишний. Судите сами:
Фактически результаты многих испытаний находятся в пределе погрешности испытаний, так что огромная пропускная способность Nehalem’а, работающего с памятью в трехканальном режиме, в домашних приложениях просто не используется. Итак, мы поняли, что высокий уровень производительности при работе с памятью достижим и без использования трех модулей памяти. Однако встает другой вопрос – какого типа памяти будет минимально достаточно для полного раскрытия потенциала Bloomfield? Ведь, скажем, многие пользователи на волне выхода первых чипсетов X38 и P35 с поддержкой DDR3 приобрели не самые производительные на текущий момент киты. Следующая таблица результатов даст ответ на этот вопрос.
Сделаем небольшую оговорку для внимательных читателей – частота памяти 1600 МГц была получена на i7-965 EE путем установки множителя Uncore в положение x24.0, и, соответственно, памяти в x12.0,то есть, фактически, это уже нештатный режим работы и небольшой разгон. Как и следовало ожидать, бескомпромиссную производительность показывает кит из трех модулей быстрой DDR3-1600. Однако нельзя не заметить, что разница между DDR3-1066 и 1600 на сходных таймингах (а это, между прочим, полуторакратная разница в пропускной способности) не очень сильно влияет на результаты. Это только подтверждает выводы предыдущего абзаца – используя в повседневной работе стандартные неспециализированные приложения, не стоит гнаться за максимальной производительностью подсистемы памяти Core i7. Разница в цене между самым производительным и средним вариантом (не стоит уходить в крайности и оставлять одноканальную память) будет бросаться в глаза намного больше, чем разница в скорости работы реальных приложений. Источник: www.tomshardware.com www.anandtech.com [N5-Последствия некоторых архитектурных решений. Новый вариант реализации HyperThreading] Еще одним важным нововведением в Nehalem стала реализация HyperThreading. В свое время, проектируя Core 2, инженеры отказались от данной технологии, так как софт был еще не оптимизирован даже под два реальных ядра, а уж о реальной пользе двух дополнительных виртуальных ядер можно было и не мечтать. Сейчас по мнению Intel ситуация иная, и самое время реализовать HT для обновленной архитектуры. Вспоминая первый вариант HyperThreading на Pentium 4, можно выделить два основных минуса: серьезное возрастание и без того немалого энергопотребления при активации технологии, и снижение производительности CPU в случае, если программа не задействует виртуальное ядро. С учетом того, что сегодня о соотношении производительности на Ватт разработчики не забывают, но и реальных ядер без того много, особенно интересно, как поведет себя новая версия HT. Скажем, что для получения полной картины мы провели достаточное количество тестов, однако приводить все результаты не имеет смысла. Технология работает хорошо, хотя и не идеально. Можно выделить 3 результата, соответственно отражающих максимальный эффект, среднее положение вещей, и наихудший вариант.
Видно, что в приложениях, хорошо оптимизированных под многоядерность, эффект от включения HT может достигать 30%, что сопровождается 12% ростом энергопотребления (как раз вспоминается правило 1:2). При этом, в общем и целом, большинство приложений не получают никакого выигрыша от HT, так как не способны задействовать и 4 физических ядра. В худшем случае производительность немного падает, однако при этом хотя бы не возрастает энергопотребление, как было в случае с Pentium 4, да и случаи такие редки. Таким образом, выключать HT смысла нет – вы как минимум не проиграете в производительности, а, можете и существенно выиграть. Причем чем “тяжелее” приложения, запускаемые на Nehalem, тем выигрыш будет больше. Источник: www.tomshardware.c |
Источник: НИКС - Компьютерный Супермаркет