Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Понедельник, 17 ноября 2008 00:00

Nehalem – новый уровень производительности десктопных CPU

короткая ссылка на новость:

Новый сокет, кулер и дизайн упаковки



   Многочисленные архитектурные изменения потребовали серьезного усовершенствования дизайна платформы. Вместе с переносом контроллера памяти в процессорное ядро и соответствующей сменой поколений чипсетов, Intel разработали для Nehalem новый процессорный сокет и усовершенствовали кулер. В качестве приятного дополнения изменили и дизайн упаковки коробочной Retail-версии процессора.

   Трехканальный КП DDR3 потребовал серьезного увеличения количества контактных площадок в сокете, с 775 до 1366. В свое время у AMD случился такой же впечатляющий рост – с 462 до 940 контактов. Конструкция самого сокета принципиально не изменилась, отныне он лишь более прочно закреплен на материнской плате, сам процессор прижимается все той же рамкой:

   А вот так выглядит брюшко процессора. Интересный момент – контактные площадки стали немного вытянутыми, и теперь напоминают эллипс вместо правильного круга:

   LGA775 и 1366 в сравнении:

   А вот и сам процессор:

   В сравнении с предшественником… :

   Интересно, что впервые на лицевой стороне CPU также присутствуют контактные площадки. Однако они задействуются только в процессе производства, а для конечного пользователя никакой полезной нагрузки не несут.

   При проектировании нового кулера инженеры Intel не стали изобретать велосипед, фактически просто укрупнив предыдущую версию своего творения и несколько изменив конфигурацию ребер.

На фото слева – боксовый кулер для 45нм двухядерных CPU Intel, по центру – для чеырехядерных, справа – новинка для Bloomfield.
   Для Extreme версии охладитель, как и ранее, более продвинутый, и также не особенно сильно отличается от кулера для процессоров Core 2 Extreme:

   Стоит отметить, что из-за изменившихся габаритов сокета и расположения крепежных отверстий, старые кулеры и ватерблоки не будут подходить к новому разъему. Большинство производителей первого эшелона вроде Zalman, Thermaltake или Thermalright уже выпустили отдельные комплекты крепежа, а новые ревизии кулеров комплектуются ими уже штатно.

   Кстати говоря, коробка неэкстремальных процессоров будет выглядеть следующим образом:

   Источник:

www.tomshardware.com
www.anandtech.com [N4-Последствия некоторых архитектурных решений.Работа с памятью]    Во время написания теоретической статьи мы множество раз задумывались о характере изменений, внесенных инженерами в Nehalem относительно Core 2. Согласно формуле, которую избрали для себя сами проектировщики, на 1% увеличения энергопотребления должно было приходиться 2% увеличения производительности. Однако вопрос в том, как правильно измерять эту самую производительность. Ведь даже добавление шины QPI в одних задачах может не сказать вообще, а в других – проявить себя в полный рост. Тоже справедливо и для нового трехканального контроллера памяти, и для реструктурированной иерархии кэша.

   На самом деле больше всего вопросов вызывают именно изменения в работе с памятью, на них стоит остановиться подробнее. По опыту предыдущих тестирований несложно предугадать, например, в каких приложениях эффект от виртуальных ядер HyperThreading будет ощутим, а вот попытаться предсказать поведение Bloomfield при работе с памятью в обычных домашних приложениях – трудновато. Судите сами – с одной стороны полностью переработана кэш-память. Вместо простой, привычной и понятной структуры двухуровнего кэша перед нами механизм, работающий с тремя типами памяти разного размера и скорости. При этом крайне важный размер L2 сокращен до 256 Кб на ядро. Сможет ли это компенсировать большой, но медленный L3? Как поспособствует встроенный КП, в каких режимах он будет наиболее эффективен? Все это лишь предстоит выяснить. Чтобы не быть голословными, приведем для начала таблицу задержек кэшей различных уровней в Bloomfield и Penryn:

  Bloomfield Penryn
Размер L1/Задержки L1 64 Кб / 4 такта 64 Кб / 3 такта
Размер L2/Задержки L2 256 Кб / 11 тактов 6 Мб (на 2 ядра) / 15 тактов
Размер L3/Задержки L3 8 Мб / 39 тактов Нет
Задержки при работе с RAM (DDR3-1600 CAS7) 107 тактов (33.4 нс) 160 тактов (50.3 нс)

   Такое устройство характерно скорее для серверных CPU, Opteron давно использует схожую структуру с небольшим L2 и огромным L3. А вот самый первый Pentium 4 Extreme Edition, в котором добавили L3 в свое время не получил от этого существенной прибавки в скорости обычных приложений. Про базы данных и прочие серверные операции мы не говорим, так как перед нами все-таки процессор под торговой маркой Core, а не Xeon. Тем не менее, замерить непосредственно эффективность работы кэш-памяти проблематично. Необходимые инструменты отсутствуют, да и в любом случае неравные платформы (не забываем про месторасположение КП) даже с одинаковой памятью могут дать слишком большую погрешность измерений, сводящую полезность результатов на “нет”.

   А вот отдельно скорость работы с памятью измерить можно. Только посмотрите, насколько сократились задержки КП при работе с DDR3 от переноса последнего в ядро! Более того, как уже отмечалось, каналов памяти теперь целых три, и пиковую пропускную способность в 25.6 Гб/c CPU достигает только при установке модулей на все три 64-битных контроллера. Нельзя не сказать и об особенностях работы КП Nehalem, которые будут трактоваться производителями материнских плат на свой вкус. Дело в том, что “набрать” трехканальность можно будет двумя способами. На некоторых материнских платах будет установлено 4 слота, на некоторых – 6. В случае использования конфигурации 4х слотов, первые три будут соответствовать трем каналам контроллеров в CPU, а модуль RAM, установленный в четвертый слот, будет разделять пропускную способность одного из каналов. Другими словами, если у вас установлено 4 планки по гигабайту во все 4 слота, при доступе к первым трем гигабайтам пропускная способность будет на уровне заявленных 25.6 Гб/с, а как только потребуется обратиться к четвертому гигабайту, она упадет до уровня производительности при использовании одноканального режима. В любом случае даже в таком режиме общая производительность будет больше, чем при двухканальной памяти. Выглядеть это будет так:

   Более продвинутой является конфигурация с использованием 6 слотов для трех каналов по 2 модуля на каждый канал:

   Тут все понятно и прозрачно – для трехканалности следует устанавливать либо три, либо шесть модулей.

   Однако все это теория. Дополнительный третий канал памяти это, конечно, очень серьезно, однако будет ли заметен от него эффект, или же в реальных приложениях практическая ценность третей планки будет сводиться лишь к увеличенному объему? Проведя тестирование Nehalem с использованием двух и трехканального режима работы, можно сделать вывод, что это задел на будущее. Серьезный эффект от огромной пропускной способности могут получить лишь будущие серверные системы, построенные на базе CPU с числом физических ядер более шести и с несколькими такими процессорами, объединенными для параллельных вычислений. Сейчас же для домашних пользователей третий модуль является, фактически, пустой тратой денег. Хотя для получения максимальной отдачи от Nehalem и он, конечно, не лишний. Судите сами:

  Два канала DDR3-1066 (9-9-9-20) Три канала DDR3-1066 (9-9-9-20)
Тест памяти, Everest v. 1547    
Чтение 12859 Мб/c 13423 МБ/с
Запись 12410 Мб/с 12401 МБ/с
Копирование 16474 МБ/с 18074 МБ/с
Задержки 37.2 нс 44.2 нс
Cinebench R10 18499 18458
Кодирование x264 HD (1ый/2ой проходы) 83.8 FPS / 30.3 FPS 85.3 FPS / 30.3 FPS
WinRar 3.80 (Сжатие папки 602 МБ) 118 с 117 с
PCMark Vantage 7438 7490
Vantage – Память 6753 6712
Vantage – ТВ и видео 5601 5637
Vantage – Игры 10202 9849
Vantage – Музыка 5378 4593
Vantage – Связь 6671 6422
Vantage – Эффективность 7589 7676
WinRar (Встроенный бенчмарк) 3283 3306
Nero Recode – Обработка 7.55 Гб 131 с 130 с
SuperPi 32M (мин:с) 11:55 11:52

   Фактически результаты многих испытаний находятся в пределе погрешности испытаний, так что огромная пропускная способность Nehalem’а, работающего с памятью в трехканальном режиме, в домашних приложениях просто не используется.

   Итак, мы поняли, что высокий уровень производительности при работе с памятью достижим и без использования трех модулей памяти. Однако встает другой вопрос – какого типа памяти будет минимально достаточно для полного раскрытия потенциала Bloomfield? Ведь, скажем, многие пользователи на волне выхода первых чипсетов X38 и P35 с поддержкой DDR3 приобрели не самые производительные на текущий момент киты. Следующая таблица результатов даст ответ на этот вопрос.

  Три канала DDR3-1066 (9-9-9-20) Три канала DDR3-1333 (9-9-9-20) Три канала DDR3-1600 (9-9-9-24)
Тест памяти, Everest v. 1547      
Чтение 13423 МБ/с 14127 Мб/с 17374 Мб/с
Запись 12401 МБ/с 12404 Мб/с 14169 Мб/с
Задержки 44.2 нс 38.8 нс 33.5 нс
Кодирование x264 HD (1ый/2ой проходы) 85.3 FPS / 30.3 FPS 86.4 FPS / 30.6 FPS 88.1 FPS / 30.7 FPS
WinRar 3.80 (Сжатие папки 602 МБ) 117 с 111 с 106 с
PCMark Vantage 7490 7569 8102
Vantage – Память 6712 6809 6886
Vantage – ТВ и видео 5637 5716 5717
Vantage – Игры 9849 10570 11013
Vantage – Музыка 4593 4798 4896
Vantage – Связь 6422 6486 6630
Vantage – Эффективность 7676 7803 7819
WinRar (Встроенный бенчмарк) 3306 3520 3707
Nero Recode – Обработка 7.55 Гб 130 с 127 с 126 с
SuperPi 32M (мин:с) 11:52 11:36 11:25

   Сделаем небольшую оговорку для внимательных читателей – частота памяти 1600 МГц была получена на i7-965 EE путем установки множителя Uncore в положение x24.0, и, соответственно, памяти в x12.0,то есть, фактически, это уже нештатный режим работы и небольшой разгон.

    Как и следовало ожидать, бескомпромиссную производительность показывает кит из трех модулей быстрой DDR3-1600. Однако нельзя не заметить, что разница между DDR3-1066 и 1600 на сходных таймингах (а это, между прочим, полуторакратная разница в пропускной способности) не очень сильно влияет на результаты. Это только подтверждает выводы предыдущего абзаца – используя в повседневной работе стандартные неспециализированные приложения, не стоит гнаться за максимальной производительностью подсистемы памяти Core i7. Разница в цене между самым производительным и средним вариантом (не стоит уходить в крайности и оставлять одноканальную память) будет бросаться в глаза намного больше, чем разница в скорости работы реальных приложений.

   Источник:

www.tomshardware.com
www.anandtech.com [N5-Последствия некоторых архитектурных решений. Новый вариант реализации HyperThreading]    Еще одним важным нововведением в Nehalem стала реализация HyperThreading. В свое время, проектируя Core 2, инженеры отказались от данной технологии, так как софт был еще не оптимизирован даже под два реальных ядра, а уж о реальной пользе двух дополнительных виртуальных ядер можно было и не мечтать. Сейчас по мнению Intel ситуация иная, и самое время реализовать HT для обновленной архитектуры.

   Вспоминая первый вариант HyperThreading на Pentium 4, можно выделить два основных минуса: серьезное возрастание и без того немалого энергопотребления при активации технологии, и снижение производительности CPU в случае, если программа не задействует виртуальное ядро. С учетом того, что сегодня о соотношении производительности на Ватт разработчики не забывают, но и реальных ядер без того много, особенно интересно, как поведет себя новая версия HT. Скажем, что для получения полной картины мы провели достаточное количество тестов, однако приводить все результаты не имеет смысла. Технология работает хорошо, хотя и не идеально. Можно выделить 3 результата, соответственно отражающих максимальный эффект, среднее положение вещей, и наихудший вариант.

Core i7-965 POV-Ray 3.7 Beta 29 Race Driver: GRID Cinebench R10 1 Поток
С HyperThreading 4202 PPS 233.7 Вт 102.9 FPS 302 Вт 4452 CBMarks 169.1 Вт
Без HyperThreading 3239 PPS 207 Вт 103 FPS 300.7 Вт 4671 CBMarks 159.5 Вт

   Видно, что в приложениях, хорошо оптимизированных под многоядерность, эффект от включения HT может достигать 30%, что сопровождается 12% ростом энергопотребления (как раз вспоминается правило 1:2). При этом, в общем и целом, большинство приложений не получают никакого выигрыша от HT, так как не способны задействовать и 4 физических ядра. В худшем случае производительность немного падает, однако при этом хотя бы не возрастает энергопотребление, как было в случае с Pentium 4, да и случаи такие редки. Таким образом, выключать HT смысла нет – вы как минимум не проиграете в производительности, а, можете и существенно выиграть. Причем чем “тяжелее” приложения, запускаемые на Nehalem, тем выигрыш будет больше.

   Источник:

www.tomshardware.c

Источник: НИКС - Компьютерный Супермаркет

подписаться   |   обсудить в ВК   |