Что вы будете делать с большим количеством ядер? Этот вопрос задал представитель Intel на одном из мероприятий, и, по правде говоря, это достаточно сложный вопрос. Геймеру не нужно больше 4 или 6, сейчас в игровой индустрии все зависит от графического ускорителя. Кем бы ни был пользователь, ему вряд ли понадобится более 6 ядер.
Как же насчет виртуальных машин, комплексного кодирования, нелинейного расчета математических функций? Сколько ядер уже слишком много? Intel недавно выпустил Broadwell-EP, сделанный на процессорах Xeon E5-2600v4, в котором может быть до 22 ядер, и менее навороченный кристалл, используемый для 10-ядерных систем, который сегодня находится в сегменте high-end desktop (HEDT) и называется Core i7 6800, 6950X, 6850K и 6900. Сегодня мы рассмотрим все 4 кристалла.
В 2015 мы говорили об успехе Broadwell и Skylake, вышедшх на десктопный и мобильный рынки. Сейчас, в 2016, обсуждения HEDT снова приводят нас к разговору о Broadwell в форме Broadwell-E. Такой неожиданный шаг был вынужденным по нескольким причинам, прежде всего потому что рынок HEDT - это часть серверного рынка, а не обособленная часть общего рынка. На общем рынке все по-другому – покупатели хотят получить стабильность и регулярное обновление через одинаковые промежутки времени.
На рынке используется имя Broadwell-EP и эта технология идет в 3 разных сегмента, в зависимости от количества ядер в конечном продукте. Intel берет самый маленький 10 core дизайн и делит его на 4 SKU, чтобы затем использовать на потребительском рынке вместе с материнскими платами X99. Большинство производителей материнских плат выпустят свои платы на чипсете X99 специально под эти процессоры, и некоторые уже это сделали.
Четыре новых процессора: the 10-core i7-6950X, the 8-core i7-6900K, the 6-core i7-6850K и the 6-core i7-6800K:
Тут очень много информации, которую хочется изучить, поэтому давайте начнем с того, что привлекает больше всего внимания – с цены.
Для того, чтобы отделить high-end настольные платформы от других направлений рынка, Intel объявил цены на Broadwell-E, сопоставимые с предыдущими поколениями этой продуктовой линейки.
Топовый, 10-ядерный i7-6950X продается за $1723, при потребительских ожиданиях в диапазоне от $1749-$1799. Это заметное подорожание по сравнению с предыдущей топовой моделью процессора Extreme Edition, который Intel продавал за $1049. Не ясны причины такого разброса цен: кто-то может сказать, что это большее по площади ядро и его дороже изготовить, но это первая партия 14 нм HEDT и эти процессоры должны быть меньше предыдущих. Поэтому единственная мысль, которая приходит на ум – это обычный маркетинг и сегментирование рынков. Intel будет держать энтузиастов в своем маленьком high-end закутке, где даст им возможность разгонять процессоры.
Десятиъядерный процессор стоит на $634 больше, чем восьмиъядерный i7 6900K, более 58% роста цены при 25% приросте производительности.
В сравнении с другими процессорами, к i7-6950X идет более дорогая упаковка, черная с золотым тиснением. Данная комбинация цветов аппелирует к тем, кто любит золото, иными словами Intel ищет новый вид премиумных покупателей.
Возвращаясь к восьмиъядерному i7-6900K, его цена $1089 - сравнимая с $999. На первый взгляд кажется, что для любого владельца 5960X это отличный апгрейд, да и ядер там меньше. Хотя у 5960X меньше ядер, чем у i7-6950X, он все еще поддерживает разгон, для тех, кто использует его в штатном режиме. Процессор разлочен, но есть несколько уточнений для владельцев системы Haswell-E, сделанной на 5960X: трата $1000 не дает вам никаких дополнительных ядер и даже чипсет остается старый.
Некоторые полагают, что при продаже Broadwell-E, Intel больше ориентируется на владельцев Nehalem/Westmere и Sandy Bridge-E. Каждая презентация Intel говорит о том, что систему нужно обновлять раз в течение 3-5 лет.
I7-6850K и i7-6800K стоят $617 и $434 соответственно. Это шестиъядерные процессоры, как и i7-5930K и i7-5820K предыдущего поколения с теми же самыми ограничениями. Ситуация, в которую здесь попадает Intel в том, что i7-5820K все время работал на грани его возможностей, делают его искомым для любого пользователя, желающего приобрести HEDT систему. Делая i7-6800K частью системы за $434, пользователь платит около $600 (материнская плата + процессор), вместо ожидаемых $400, это делает такой набор намного менее привлекательным для верхнего диапазона рынка.
Глядя на ценовую политику Intel можно с легкостью сказать, что компания выбрала неправильную ценовую политику с ценой на i7 6950X. Недавно вышедший процессор Xeon Broadwell-EP состоит из 10 ядер 2.4 Ггц/3.4 Ггц потребляет 90 Вт, и стоит $939, что более, чем сравнимо с i7-6950X и его 10 ядрами по 3 Ггц/3.5 Ггц. А поскольку это Xeon E5 – при правильном выборе конфигураций пользователь может поставить два таких процессора в одну материнскую плату и получит 20 ядер/40 потоков всего лишь за $1878 или на $150 больше, чем стоит i7-6950X.
Единственным серьезным минусом может быть только то, что Xeon продается как OEM с лимитированной гарантией. Intel продают их через посредников, поэтому едва ли они попадут на ритейлерский рынок.
Когда Intel представляли Haswell-E, они экспериментировали с новым способом разделения продукта: также они варьировали с количеством PCIe. Эта практика продолжилась в Broadwell-E, по точно такому же сценарию. Нижний CPU имеет 28 PCIe 3.0 дорожек(lanes), в то время, как другой процессор обладает 40 PCIe 3.0 дорожек.
На практике количество пользователей, пользующихся SLI или CrossFire очень мало, зато много разработчиков, которые не хотят оптимизировать игры под эти технологии.
Как было сказано ранее, меньшее количество PCIe lanes означает, что некоторые слоты будут работать в пол силы. Но вот что такое продуктовое сегментирование – если пользователю нужно больше PCIe lanes, то ему нужно отдать $175 за процессор следующего поколения.
Возвращаясь к обзору Haswell-E, мы провели тестирование и сравнили 28 PCIe lanes с 40 PCIe lanes на SLI и Crossfire графических картах (PCIe 3.0x16/x8 compared to PCIe 3.0x16/x16). Мы нашли разницу в 1% при игре на двух видеокартах. Мы не стали делать такой же тест на Broadwell-E, и преполагаем, что с DX12 разница будет заметней, но для этого нам нужно больше игр, сделанных под DX12 с поддержкой нескольких GPU.
Благодаря тому, что на рынке доминирует односокетовая версия PC, мы не можем отследить изменения в поддержке памяти многопроцессорных машин Intel. Официальная поддержка памяти процессором определяет базовую JEDEC частоту и является гарантированной частотой для процессора, который встречается с неким количеством ошибок. Реальность такова, что большинство процессоров будут поддерживать быстрейшую память, какую производители вроде Corsair, G.Skill, Kingston будут им предлагать, например DDR4-3000 наборы памяти для толстосумов. Причина, по которой производитель CPU не поддерживает память на такой скорости в нескольких факторах, но как мы уже отметили, увидеть различия на одном сокете очень сложно.
Сокет LGA2011-3 поддерживает процессоры Haswell-E и Broadwell-E. Официальная поддержка скорости памяти для Haswell – DDR4-2133 и в своих тестах мы использовали именно эту частоту. Для Broadwell-E планка поднимается до DDR4-2400 и опять мы использовали именно эту частоту в своих тестах. На самом деле для большинства задач ускорение памяти не играет большой разницы, кроме специфических задач (архивирование и пр.), где прирост производительности заметен.
Даже глядя на спецификации, сейчас очень сложно оценить эффект от вложений в HEDT систему, сделанную на базе Broadwell-E. Заявления при запуске платформы и на протяжении ее существования были направлены на пользователей системы Nehalem/Werstmere (или Sandy Bridge-E/IvyBridge-E) тех, кто хочет перейти на 4/6 ядерные процессоры и начать пользоваться функциями платформы X99.
Очевидно, что стоимость десятиъядерной машины включая материнскую плату, оперативную память, память и графику ожидается в районе $2300 за систему с обычным CPU или около $3000 за high-end игровую платформу. Тем временем мы можем увидеть Haswell-E, продающимся на вторичном рынке за доступную цену и более привлекательную для потребителей.
Когда Intel выпустил процессор Broadwell-EP Xeon, было добавлено несколько новых функций из предыдущего поколения Haswell-EP.
Для Broadwell-EP, одной из новинок была возможность настраивать частоту каждого ядра по отдельности, в зависимости от загруженности AVX. Раньше, как только AVX был обнаружен, все ядра снижали частоту, но благодаря BDW-EP сейчас они работают отдельно. Intel взяли эту возможность, немного «докрутили» и назвали «Turbo Boost Max 3.0».
Turbo Boost 2.0 это то, что Intel называет своей максимальной частотой. Итак, в случае с i7-6950X, базовая частота составляет 3.0 Ггц, а Turbo Boost 2.0 составляет 3.5 Ггц. CPU будет использовать эту частоту когда это потребуется, и также будет снижать ее, когда потребуется. Turbo Boost 2.0 разрекламирована на коробке из-под процессора, в то время, как никто не рекламирует TBM3.
TBM3 будет увеличивать тактовую частоту одного ядра, когда этот процесс отдан какой-либо программе.
Такие возможности требуют особого драйвера, похожего на Skylake Speed Shift, который будет поставляться вместе с новыми материнскими платами на X99. У такой программы есть интерфейс и ей не сложно пользоваться:
С новым драйвером каждое ядро в процессоре может быть доступно из операционной системы, и каждое ядро будет работать на такой частоте, на которой от него требуется в данный момент. На картинке выше Core 9 оценен выше остальных, это значит, что для TBM3 драйвер будет использовать Core 9.
Будучи активированной, TBM3 работает в двух режимах: либо привязано к приложению, либо по приоритету. В первом режиме, когда драйвер находит однопоточную задачу, он попытается перекинуть ее на лучшее ядро, и затем увеличит частоту. В режиме приоритетов в случае появления программы с высоким приоритетом, она будет поставлена на лучшее ядро.
Главный вопрос: каков эффект от этого Boost’инга? И этот вопрос имеет ответ.
Intel отказывается признавать эффект TBM3, утверждая будто бы все ядра и так постоянно меняют свою частоту.
Turbo Boost 3.0 должен поддерживаться материнской платой через BIOS. Настройка TBM3 должна быть выставлена в BIOS, и это означает, что доступность этой функции зависит от производителя материнской платы, а не от Intel. Но они знают как делать это правильно.
Для большинства тестов мы использовали материнскую плату MSI, TBM3 был отключен в BIOS. Мы задали об этом вопрос и получили ответ, гласящий, что это решение кого-то из менеджмента. Это решение делает TBM3 бесполезным для любого, кто не в ладах с BIOS.
В BIOS так же выставляется частота, до которой может ускоряться процессор. Так что получается, что частота, с которой работает процессор, регулируется какой-то настройкой в BIOS’е. У платы MSI эта настройка стояла на Auto, что на практике означает нулевое ускорение. Был выставлен множитель 40x (4000Мгц) и все заработало.
Важно отметить, что у нас есть одна новая материнская плата ASUS для тестирования, однако у меня было мало времени перед поездкой на Computex. ASUS сообщили мне о том, что они планируют выпустить программу, которая активирует TBM3 и позволит контролировать все ядра сразу, в то время, как программа от Intel поддерживает только один поток (одну программу).
В настройках TBM3, две важных настройки о которых должен знать каждый. Первая – utilization threshold, которая выставляет пороговый процент загрузки, при котором программа будет переключена на отдельное ядро. По умолчанию стоит 90%.
Вторая опция вызывает множество вопросов. Это «количественный интервал», или период времени между проверками, который делается для того, чтобы ускорить программу. Стартует значение данной функции с 10 секунд. Это означает, что если ПО ускоряется на 1 секунду или на 10, то это отразиться на тестах. Решением в данном вопросе будет минимизировать интервал, но мы сможем выставить интервал только на 1 секунду. Итак, во время теста у нас либо не получится «поймать» ускорение, либо мы «поймаем» его всего лишь на несколько секунд.
Представим ситуацию, в которой тестирующий не знает включена ли TBM3. В этом случае результаты тестирования могут быть неверно интерпретированы.
Когда вышла мейнстримовая платформа Skylake, упаковка процессора была тоньше, если сравнивать с предыдущим поколением процессоров. Похоже, что Intel не изменяет себе в случае с Broadwell-E.
Слева мы видим Haswell-E процессор Core i7-5960X, а справа процессор Broadwell-E Core i7-6950X. Обе платформы используют FIVR, Fully Integrated Voltage Regulator, которая оптимизирует и понижает энергопотребление процессоров. Обычно FIVR требует нескольких дополнительных слоев для управления мощностью, но судя по фотографии был оптимизирован и это блок. Да, теперь каждый слой тоньше, но похоже, что им удалось сократить количество слоев микросхемы.
Ответим на несколько читательских вопрсов. Прежде всего, о риске повредить процессор, особенно в свете новости о SkyLake, где два процессора были повреждены слишком тяжелыми радиаторами. У Broadwell-E не замечено такой проблемы, сокет спроектирован с учетом всех прошлых ошибок. Давление на квадратный дюйм на процессор платформы HEDT Sandy Bridge-E должно быть на 30-40% выше, чем на процессор обыкновенного PC. В результате сокет был спроектирован со всеми необходимыми свойствами, при этом учтено давления защелки в момент закрытия/открытия.
Если мы сравним «крыло» Haswell-E и Broadwell-E процессоров, то увидим, что у последнего была добавлена зона для дополнительных контактов в промежутке между защелкой и PCB.
В данный момент Intel конкурирует с самим собой. Консьюмерскому рынку нужно постоянство, платформы HEDT рассчитаны на 3 года, 2 продуктовых цикла, что дает достаточно времени на совместимость сокетов и делает корпоративных заказчиков счастливыми. Когда Intel занимает 95% рынка HEDT и x86 корпоративного рынка, им нужно думать не о том, как занять еще большую часть, а постараться сделать так, чтобы пользователям старых систем было выгодно обновлять свои системы.
Изменения на рынок HEDT привносит новое профессиональное программное обеспечение, особенно то, которое начинает использовать PCIe ускорители. Всегда будет рынок HEDT, но в некоторой точке HEDT и Xeon рынки сталкиваются по двум критериям – цене и возможности приобретения.
Как было отмечено ранее, комплектующие к новому Broadwell-E Core i7 совпадают по цене с некоторыми комплектующими Broadwell-EP Xeon, что позволяет предположить, что Intel хочет направить покупателей (прежде всего профессионалов) в сторону систем, собранных корпоративными партнерами. Такие системы успешно продаются и их версии не сильно разнятся. Появляется вопрос: кто же тогда покупает HEDT: в первую очередь идут геймеры, им не интересны готовые рабочие станции.
Intel чудом сохраняет равновесие в такой ситуации. Все хотят больше – нужно им это или нет - это другой вопрос, но большая часть энтузиастов скажет, что им нужно больше. Intel заявляет, что как компания, она поддерживает геймеров и энтузиастов, которые хотят непрерывно совершенствовать свои системы. Именно для этого и нужен Broadwell-E. Тем не менее, высокая цена может отпугнуть некоторых энтузиастов, желающих играть на high-end.
В этом месяце многие производители либо анонсировали, либо выпустили материнскую плату под сокет LGA2011-3 на X99 чипсете. Если собрать все такие материнские платы, то список будет довольно-таки большим. Для тестов были взяты две платы, одна из которых называется MSI X99A Gaming Carbon:
Carbon это новый подбренд MSI для материнских плат high-end уровня.
Так же на нашем стенде побывала материнская плата ASUS X99-E-10G, high-end материнская карта для рабочих станций, в которую интегрирован Intel X550-T2 10 Гб/c Ethernet адаптер с двумя 10GBase-T портами. Мы уже видели такое ранее в материнской плате ASRock X99 WS-E/10G, которая использует X540-T2, и требует 8 PCIe 3.0 lanes от CPU, чтобы обеспечить необходимую скорость. У нас была возможность тестировать ASUS 10G только в течение нескольких дней.
У ASRock также есть карта, которая называется X99 Killer.
Динамика турбо режимов процессоров Intel и AMD может показывать непредсказуемые результаты во время работы. Так же есть проблема с материнскими платами. Каждый производитель «поддерживает» ускоряющие технологии так, как он считает нужным. Чтобы избежать данной проблемы мы используем высокопроизводительный режим на уровне операционной системы, при котором все CPU работают в одинаковых условиях.
Многие эмуляторы обычно ограничены одним потоком CPU, и тесты показывают, что Haswell показывает серьезное ускорение производительности эмулятора. Этот тест запускает Wii программу, которая «считает» 3D сцену внутри эмулятора Dolphin Wii.
WinRAR тест 2013 года, последняя версия обновления от 2014. Мы компрессируем 2867 файлов, большая часть из которых это обычные веб-страницы или короткие 720p ролики.
3DPM самодостаточный бенчмарк, который считает 3D перемещения, используя симуляцию Броуновского движения и тестирует их скорость.
Agisoft Photoscam создает 3D изображения из 2D картинок, очень сложный процесс для компьютера. Алгоритм разделен на 4 части и разные стадии создания изображения, каждая из четырех стадий требует более быстрой памяти, больше ядер и тд. Этот тест обычно занимает около 15-20 минут.
Данная программа берет два видео 640x266 DVD rip и десятиминутный ролик double UHD 3840x4320 и конвертирует все три ролика в формат x264 в mp4 контейнер. Результаты даются в виде кадров в секунду.
Для этого обзора, с помощью программы Prime95 мы также замерили энергопотребление при пиковой нагрузке на процессоры.
Источник: www.anandtech.com/