Каталог
3. Массовый Nehalem – интеграция контроллера PCI-Express и графического ядра на кристаллСегодняшняя платформа для Nehalem выглядит следующим образом: Как вы знаете, на кристалле располагается трехканальный контроллер DDR3, а с чипсетом X58 Core i7 связывается с помощью одного из линков QPI. При этом фактически, северный мост X58 выступает контроллером PCI-Express для связи с высокопроизводительными видеокартами и периферией через слоты PCIe 2.0. Такая конфигурация требует наличия LGA1366. Материнские платы с данным сокетом и X58 на борту обладают сложным дизайном и высокой стоимостью, что в сочетании с недешевой памятью DDR3 и самим CPU Core i7 поднимает и без того немалую конечную стоимость системы. Это автоматически ограничивает сферу возможного распространения i7 компьютерами энтузиастов и сегментом высокопроизводительных рабочих станций. Однако во второй половине наступившего года ситуация должна измениться, в планах Intel – LGA1156 для массового рынка. Новый процессор с ядром Lynnfield, который также несет в себе 4 ядра, которые благодаря технологии Hyper Threading превращаются в 8 виртуальных потоков, и 8 Мб кэша L3 станет первым CPU для LGA1156. Вместо трехканального контроллера памяти DDR3 он будет довольствоваться более разумным и экономичным двухканальным; QPI места в новом CPU не найдется, а с новым чипсетом P55 процессор будет соединяться по старому доброму интерфейсу DMI. Возникает логичный вопрос – зачем возвращаться к уже устаревшему протоколу, когда есть куда более широкая шина QPI? Ответ на него напрашивается сам собой, если знать еще одну ключевую особенность Lynnfield. Этому процессору просто не нужна большая пропускная способность для связи с чипсетом – в наличии интегрированный контроллер PCI-Express! Lynnfield обслуживает 16 линий PCIe 2.0, которые могут быть сконфигурированы либо в 1 слот x16, либо в 2 по x8, таким образом, обеспечена поддержка 2-way SLI/Crossfire (если, конечно, NVIDIA не будет вставлять Intel палки в колеса с лицензированием SLI). Близость контроллера PCIe к ядрам CPU может сыграть положительную роль, минимизация задержек еще никогда не была лишней. Конечно, речь не идет о 20% повышении производительности от простого переноса контроллера PCI-Express из отдельного чипа X58 в ядро Lynnfield, однако даже дополнительные 5% FPS лишними не бывают. Конечно, сокращение числа линий PCI-Express до 16 сделало невозможным использование трех и четырех видеокарт, но, для тех людей, которым такие конфигурации необходимы, и создан Bloomfield. Пожалуй, Lynnfield станет просто идеальным CPU для десктопа, реальной заменой наиболее распространенных сейчас LGA775. Производительность Bloomfield по нормальной цене без сверхсложных материнских плат – отличный повод задуматься о смене платформы и апгрейде. Пожалуй, единственным минусом для оверклокеров может стать увеличившееся тепловыделение (все-таки интегрированный PCIe контроллер это не 10 тысяч транзисторов на ядре), хотя, будем надеяться, это не повлияет на разгонный потенциал в худшую сторону. Далее на повестке дня – Havendale, двухядерный четырехпоточный CPU с 4 Мб разделяемого L3 (2 Мб L3 на ядро, как в Lynnfield и в Bloomfield). Процессор использует тот же LGA1156, сохранен двухканальный КП DDR3 и связь с P55 (или более новыми чипсетами) по DMI. Секрет Havendale в наличии интегрированного GPU. Скорее всего, это будет эволюционный вариант G45 (надеемся, серьезно переработанный и улучшенный, а не в стиле G35 -> G45), конечно же, произведенный по 45 нм нормам. Это должно послужить серьезным пинком AMD, которая долгое время собиралась стать первой компанией, выпустившей CPU с интегрированным GPU (Fusion). Однако, лавры первопроходца, похоже, достанутся Intel, так как AMD отложила выход такой связки до неблизкого 2011 года. В Havendale будет присутствовать такой же PCI-Express контроллер, как и в Lynnfield, 16 линий которого могут быть разделены в 1 x16 или 2 x8 слота.Похоже, из Havendale получится отличный универсальный процессор. Он хорошо подойдет для недорогих десктопов, где не нужна экстремальная производительность (но внешнюю быструю графическую карту, скажем, для игр, подключить все-таки можно). Ничуть не хуже двухядерный Nehalem может быть применим и в ноутбуках (упрощение дизайна материнской платы, снижение общего энергопотребления). Вспомните продвинутые технологии энергосбережения Bloomfield, добавьте к этому оптимизированные степпинги, пониженные специально для ноутбуков частоты... и перед нами отличный процессор для Centrino 3, быстрый и эффективный. К сожалению, в роадмэпе Intel выход Havendale запланирован лишь на первый квартал 2010. Производство самих процессоров начнется в конце 2009, однако готовые системы, построенные на базе этих CPU, придется подождать чуть дольше. Такое положение дел, кстати, оставляет простор для деятельности NVDIA, как производителя популярных чипсетов со встроенной графикой. Ведь между сегодняшним G45 для LGA775 и будущим Havendale у Intel не запланировано никаких новых интегрированных чипсетов (все силы сконцентрированы на Larrabee), так что можно ожидать интересных решений для HTPC на базе Nehalem от NV. [N4-4. Так что же покупать: LGA1366 vs. LGA1156] В общем и целом вырисовывается интересная картина, на рынке в довольно скором времени уже представленные High End Nehalem с сокетом LGA1366 (вышедшие Core i7) будут соседствовать с Middle End Lynnfield и Havendale. Насколько разграничены целевые группы потребителей CPU, не поспешили ли люди, уже купившие LGA1366 X58 платформу? Однозначно на этот вопрос ответить можно уже сейчас. Никакого смешения сокетов, которое, например, произошло у AMD (754, 939, AM2, AM2+), у Intel не предвидится. CPU с разным количеством контактных площадок предназначены для разных аудиторий. Так, при выходе Bloomfield он был ориентирован на максимальную производительность и предназначен для людей, которые за 20% превосходства новой платформы над старой готовы серьезно переплатить. С течением времени ничего измениться не должно. Процессоры LGA1366 останутся самыми быстрыми из Nehalem, именно для этого сокета в первую очередь будут появляться новинки, такие как 8/16-ядерные Nehalem и просто наиболее высокочастотных экстремальные CPU. Именно при таком количестве вычислительных потоков и проявит себя мощнейший трехканальный контроллер DDR3, заложенный в Bloomfield. Для LGA1156 ждать таких процессоров, скорее всего, просто не имеет смысла. Как не имеет смысла рассчитывать и на рекорды разгона. Это именно массовые процессоры, которые должны предложить оптимальное соотношение цены и качества, а значит, стать лучшим выбором для большинства потребителей, не гонящихся за наивысшими результатами. Самый быстрый Lynnfield, запланированный Intel, должен оказаться сходным по производительности с Core i7-940. Конечно, не стоит забывать о внештатных режимах работы, но мы все-таки сейчас говорим о массовом рынке. Middle End LGA1156 должен конкурировать с i7-920. Выйдут и более дешевые процессоры с пониженными тактовыми частотами на уровне 2.4/2.53 ГГц. Intel планирует поддерживать оба сокета длительное время, но все равно специализация выпускаемых для них процессоров должна сохранится. LGA1366 останется уделом энтузиастов, LGA1156 станут массовыми процессорами. При этом не стоит думать, что LGA1156 в чем-то реально хуже своего более дорогого собрата. Если вы выбрали для своего ПК Core 2 Quad Q9300/Q6600 – это именно та платформа, на которую стоит обратить внимание при апгрейде своего ПК в будущем. А вот покупатели Core 2 Extreme, скорее всего, в рекомендациях не нуждаются и уже обновили свои платформы на Bloomfield i7. Пожалуй, наибольший недостаток Lynnfield в том, что ожидать его выхода на рынок предстоит еще более полугода. Имеет ли смысл делать это, если уже существующие Core i7 смогут увеличить быстродействие ежедневно выполняемых задач? Зависит от индивидуальных предпочтений, но в любом случае не стоит забывать, что платформа i7 это не только ультимативные ASUS Rampage 2 Extreme в сочетании с i7-965 Extreme и 12 Гб DDR3, но и куда более простые материнские платы, да и задействовать 3 канала памяти вовсе необязательно. Серьезной революции в ноутбуках же ждать придется еще дольше. Зато похоже, что она того будет стоить. Так что можно порекомендовать сегодня без острой необходимости не приобретать дорогие производительные ноутбуки, а ограничиться решениями среднего уровня. Их можно будет без серьезной потери в цене через год продать, и уже в первом квартале 2010 приобрести мобильный компьютер на новейшей платформе Centrino 3, которая, похоже, станет наиболее интересной новинкой для ноутбуков со времен появления первого Centrino. [N5-5. А что же дальше: превью Westmere и Sandy Bridge] Выводя на рынок Conroe, Intel поставила цель получить превосходство в сегменте десктопов и еще более укрепить свои позиции в ноутбучном секторе рынка. Nehalem был призван потеснить AMD на поле высокопроизводительных рабочих станций и серверов. Что же дальше? Следующие два этапа развития микроархитектуры Intel базируются на 32 нм техпроцессе – Westmere и Sandy Bridge и призваны обеспечить прорыв в энергетической эффективности и скорости вычислений с плавающей запятой. Westmere станет несколько большим, чем простым переносом Bloomfield на 32 нм, стоит ожидать небольших архитектурных оптимизаций, дополнительной кэш-памяти. Однако, в общем и целом, основной вклад в увеличение быстродействия внесут повышенные частоты, которые станут доступными благодаря снижению энергопотребления и тепловыделения. Sandy Bridge будет первым с поддержкой новых инструкций AVX: В конце нынешнего года новые графические чипы от ведущих производителей (возможно, к AMD и NVIDIA успеет присоединиться и Intel с Larrabee) будут поддерживать OpenCL и DirectX 11. Эти API в комбинации с высоко-параллельной структурой современных GPU должны обеспечить серьезный скачок в производительности в хорошо оптимизированных под многопоточность приложениях. Хотя на данный момент пользу от таких нововведений можно наблюдать только в профессиональных пакетах, начинают появляться и первые домашние приложения, использующие возможности нескольких потоков параллельных вычислений на полную катушку (кодировщики видео, Photoshop CS4). Однако при этом не все приложения могут быть достаточно хорошо распараллелены, чтобы эффективно использовать ресурсы GPU. Мощности CPU же в вычислениях с плавающей запятой им уже недостаточно. Как раз для того, чтобы перекинуть мостик от CPU к GPU в таких задачах и был создан новый набор инструкций AVX. С его помощью разработчики смогут с легкостью портировать код как с CPU на GPU, так и GPU на CPU, выбирая оптимальный баланс между производительностью и загрузкой различных блоков видеокарты или процессора. Согласно представлениям Intel, в будущем Larrabee, основанная на x86-совместимых ядрах, встанет по вычислительной мощности в один ряд с центральными процессорами, а на пути к такому слиянию инструкции AVX – первый шаг. [N6-6. Выводы и финальные слова] Еще один день, еще одна статья про Nehalem. Пусть не слишком объемная, но от этого не менее важная и более подробно раскрывающая интересные моменты в архитектуре передовой микроархитектуры Intel. Несмотря на то, что процессоры уже вовсю продаются, радуя покупателей высокой производительностью, наша работа по освещению этого поколения бесспорно удачных CPU еще далека от завершения. Оставайтесь с нами! |
Источник: www.anandtech.com/