Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Пятница, 24 мая 2024 08:44

Что мы выяснили в ходе тестирования однопроцессорной платформы 5-го поколения Intel Xeon Scalable

короткая ссылка на новость:
Последние несколько недель мы работаем над модернизацией старых малопотребляющих стоек в одном из наших серверных помещений. Ориентация на уменьшение энергопотребления стойки означает, что мы больше не можем осуществлять минимизацию размеров кластера за счет использования самых мощных процессоров. Поэтому в этом году мы решили организовать собственный эффективный облачный компьютинг и в рамках этого проекта протестировали односокетные решения на базе 5-го поколения Intel Xeon “Emerald Rapids”. И были настолько удивлены результатами в части улучшения показателей производительности и энергетической эффективности в новом поколении процессоров, что нам пришлось продолжить путешествие по кроличьей норе и слегка усовершенствовать также свою тестовую конфигурацию, чтобы провести второе контрольное тестирование. Большая корпусировка XCC (Extreme Core Count) с начинкой Emerald Rapids стала намного лучше. Это будет интересно многим: от тех, кто собирается развертывать стоечные серверы со сравнительно низкой плотностью (как мы, например), до тех, кто подыскивает ноды для лабораторий на будущее. Давайте смотреть, что у нас получилось.

xeon-1

Прежде чем идти дальше, поясним, как мы пришли к Intel в процессе реализации нашей идеи с односокетными серверами. Intel не рекламирует эти платформы так усиленно, как это делает AMD, поэтому мы решили к ним присмотреться. Компания предоставила нам два самых продвинутых образца чипов серии U: 4-го и 5-го поколения Intel Xeon. Так что мы должны уведомить читателей о том, что данный обзор спонсирован Intel, но представители компании не читали эту статью до ее публикации. Нам нужны были процессоры для опробования нашей собственной концепции, и было предположение, что чипы 5-го поколения Gen 1P/UP могут нам подойти, но никто не мог дать точную количественную оценку – насколько они лучше потенциальных альтернатив. Сразу отметим, что это не самые высокопроизводительные процессоры для односокетных серверов. Мы знаем, что у Intel есть более быстрые SKU. И, как покажет бенчмарк SPEC CPU2017, 128-ядерные чипы AMD EPYC Bergamo тоже быстрее. Наша задача здесь – сравнить производительность и энергетическую эффективность соответствующих чипов соседних поколений.

2

Итак, давайте посмотрим более внимательно на три процессора (один из которых у нас уже был), которые мы сегодня будем тестировать.

Отличительные особенности чипов 5-го поколения Intel Xeon XCC

Когда мы впервые увидели только что вышедшие процессоры 5-го поколения Intel Xeon под кодовым наименованием “Emerald Rapids”, то обратили внимание на значительный прогресс в части энергетической эффективности по сравнению с Sapphire Rapids. Не забываем, что и 4-е, и 5-е поколение процессоров Xeon были выпущены в 2024 году. И те и другие используют один и тот же сокет и имеют сходный функционал I/O.

3

Хотя у нас есть традиционные слайды с показателями производительности на ватт потребляемой мощности, кое-что осталось за кадром, как то: энергопотребление в режиме простоя и энергопотребление интерконнекта SoC.

4

Чтобы понять, что здесь происходит, нужно заглянуть в корпусировку чипов. В чипах для массовых серверов используется схема MCC Intel с меньшим количеством ядер (до 32). Это монолитная микросхема, включающая в себя сразу все ядра процессора на одном кристалле, что упрощает процесс производства. В более продвинутых чипах Intel использует схему с несколькими плитками, соединенными между собой быстрыми мостами EMIB.

5

Для иллюстрации мы выбрали слайд, приведенный ниже. На нем представлены чипы XCC 4-го и 5-го поколения Intel Xeon соответственно с 4-плиточной и 2-плиточной архитектурой с мостами EMIB.

6

На момент релиза мы узнали от Intel, что практически те же самые ядра были просто распределены по двум плиткам. Более новые чипы XCC 5-го поколения имеют больший кэш и, что важно, эта компоновка имеет меньшее энергопотребление простоя по сравнению с 4-плиточной компоновкой 4-го поколения. На рисунке ниже показан пример плитки (compute tile) XCC 5-го поколения Xeon, если вам интересно, как выглядят эти плитки.

7

Это один из аспектов, которые мы собирались прояснить. Второй касается производительности. В Intel сделали заметный шаг вперед в части увеличения максимального количеств ядер чипов UP – с 32 в Intel Xeon Gold 6414U до 48 в Intel Xeon Platinum 8558U. Обратите внимание: U здесь означает Uni-Processor, то есть это процессоры с отключенным межсокетным интерфейсом UPI, предназначенные сугубо для односокетных систем. Эта номенклатура примерно аналогична номенклатуре AMD EPYC “P”, где суффиксом P обозначаются сугубо односокетные компоненты. Intel также использует суффикс U для обозначения мобильных чипов с ультранизким энергопотреблением. Буква одна и та же, но обозначает разные вещи, в зависимости от того, о каких чипах Intel идет речь: о пользовательских или о чипах для дата-центров.

8

Так как у нас был еще компонент для двухсокетных систем Intel Xeon Platinum 8458P серии 8х58, мы решили использовать его как еще один образец для сравнения. Итак, мы имеем два процессора 4-го поколения: 32-ядерный 250-ваттный и 44-ядерный 350-ваттный, и один 48-ядерный 300-ваттный процессор 5-го поколения. Этот Xeon 5-го поколения также располагает 260-мегабайтным кэшем L3 – это на потрясающие 200 МБ больше, чем у топового представителя линейки UP предыдущего поколения, чипа Gold 6414U. В полтора раза большее число ядер, на 20% больший номинал TDP и в 3.3 раза больший кэш – все это определенно должно обеспечивать и большую производительность, но вопрос в том, дает ли новая корпусировка XCC что-нибудь еще, кроме большего размера кэша. Да, дает.

Переходим к результатам тестов.

Сравнение производительности чипов Intel Xeon XCC 5-го и 4-го поколений

Говоря о производительности, мы прежде всего сравниваем вышеупомянутые три процессора, тестируя их на одной и той же системной конфигурации. Наша задача – определить фактический прирост производительности, который обеспечивает 5-е поколение относительно 4-го на примере топовых процессоров серии U.

Оценочные результаты SPEC CPU2017

SPEC CPU2017 – вероятно, самый популярный бенчмарк, используемый при составлении RFP на серверы. Мы давно проводим независимое тестирование в SPEC CPU2017, и наши результаты обычно на несколько процентов ниже официальных результатов из презентаций OEM-фирм. Поскольку для Intel Xeon Platinum 8458P опубликованы официальные результаты только 2-процессорных конфигураций, мы используем свои, которые будем называть «оценочными». Мы просто отмечаем, что для чипов Gold 6414U и Platinum 8558U наши результаты согласуются с опубликованными, так что можно предположить, что если бы публиковались официальные результаты для однопроцессорных платформ Platinum 8458P, они были бы близки к нашим, которые приведены ниже.

Сначала рассмотрим наиболее общий для корпоративных и облачных приложений бенчмарк – производительность в целочисленных операциях SPEC CPU2017.

9

Теперь посмотрим на вещественные вычисления:

10

В целом, для компонентов серии U это очень солидные показатели. Дополнительные ядра здесь помогают, обеспечивая лучший результат даже при меньшей номинальной мощности (TDP) процессора – в сравнении с Platinum 8458P. Превосходное достижение.

Производительность в сетях дистрибуции контента STH Nginx CDN

В тесте Nginx CDN мы используем старый снапшот и шаблон доступа с сайта STH. Отметим, что здесь мы использовали также высокоскоростную сетевую карту, поскольку тестирование проводилось по сети; так что эти результаты, в отличие от результатов локальных тестов, относятся не к одной «голой» системной конфигурации.

11

И снова мы видим, что большее число ядер и больший кэш здесь действительно обеспечивают преимущество Intel Xeon Platinum 8558U. А с учетом того, что одним из целевых сегментов рынка для односокетных процессоров является веб-хостинг, это тем более весомый результат.

GROMACS AVX-512

GROMACS – популярный программный пакет для моделирования молекулярной динамики. Мы просто хотели посмотреть, что получится, если запустить его на этих трех процессорах.

12

Эти результаты не столь яркие, как другие, но, тем не менее, они показывают стабильное преимущество нового поколения односокетных процессоров.

Анализ ценообразования в MariaDB

Эта задача очень интересна лично мне. Этот тест создан на базе нагрузки, представляющей собой приложение для анализа аспектов ценообразования на основе анонимизированных данных одного из ведущих ЦОД OEM. Приложение фактически анализирует в реальном времени многопараметрические тенденции в ценообразовании по данным продуктовых линеек, регионов и каналов поставок и определяет выгодность или невыгодность конкретных BOM-спецификаций (перечней элементов) устройств. Если эта задача представляется вам слишком специфической, то разница между ней и тем, что считают крупные производители, заключается в конкретных данных, используемых для анализа. Приложение такого типа методологически можно заменить ИИ-инференсами, но само по себе оно представляет наглядный пример сценария, который реальные предприятия могут запускать в облаке.

13

И снова очень хороший результат. Большее число ядер, больший кэш и пиковая turbo-частота 4.0 ГГц здесь являются весьма полезным подспорьем.

В целом, в части производительности вывод очевиден: колоссальный прирост показателей в новом поколении односокетных процессоров. В то же время мы хотели выяснить: не достигается ли этот прирост производительности новых процессоров просто за счет увеличения энергопотребления. Об этом – в следующем разделе.

Сравнение энергопотребления чипов Intel Xeon XCC 5-го и 4-го поколений

Первый вопрос стоял так: каким образом можно надежно измерить не только производительность, но и энергопотребление – всей системы и самих процессоров. Это целая эпопея. Мы начали как бы с баребона Supermicro SYS-111C-NR.

14

Мы отсоединили все сетевые карты и заполнили только восемь из 16 DIMM-слотов DDR5, чтобы обеспечить максимум пропускной способности памяти при минимуме энергопотребления. Потом мы снова подключили сетевую карту ASUS USB 3 2.5GbE для нашей малопотребляющей сети. Этот сетевой результат соответствует минимальной конфигурации, какую мы только могли организовать, чтобы получить «изолированное» энергопотребление процессора. Мы ничего не могли поделать в части чипсета, плюс BMC-контроллер ASPEED потребляет 5-7 Вт, даже когда сервер выключен. Кроме того, мы использовали SSD-накопитель Kioxia CM6.

15

Тем не менее, мы постарались получить максимально «чистое» энергопотребление CPU (Package). Вот результаты:

16

В режиме простоя, даже при большем числе ядер и большем кэше, чип 5-го поколения Intel Xeon Platinum 8558U потребляет всего 67 Вт – против 81 Вт у Xeon Gold 6414U. То есть увеличение числа ядер в полтора раза, 20%-ное увеличение TDP и 200-мегабайтный кэш L3 фактически позволили снизить энергопотребления простоя на 17%.

Стоит отметить, что на чипе Gold 6414U под нагрузкой мы систематически получали 238-240 Вт. Мы подумали, что это может быть связано с прошивкой, но мы использовали одну и ту же платформу и прошивку и с Gold 6414U, и с Platinum 8458P, так что это не является проблемой конкретного поколения процессоров. Тем не менее, в нагрузочном тесте это наблюдалось систематически, а в других программах мы получали близкие к номиналу 249-250 Вт, так что это, вероятно, обусловлено какой-то проблемой в нагрузочной утилите stress-ng, которая проявляется на этом чипе.

Итак, мы видим, что производительность выросла, а энергопотребление простоя уменьшилось. Максимум 24%-ное увеличение энергопотребления под нагрузкой на минимальной системной конфигурации (сервер со всеми сетевыми картами, дисковыми накопителями и т.д. потребляет больше) при намного большем увеличении производительности – это сравнительно немного.

Основные выводы

Честно говоря, когда мы запрашивали у Intel образцы чипов, я был настроен скептически. Я очень сомневался, что повышение номинала TDP всего на 50 Вт позволит новым топовым односокетным процессорам Intel Xeon обеспечивать существенно большую производительность, даже при увеличении числа ядер с 32 до 48.

xeon-1

Но я ошибался. Новый чип Intel Xeon Platinum 8558U оказался значительно быстрее Xeon Gold 6414U. Полуторакратное увеличение производительности всего за дополнительные 50 Вт к TDP (или 85 Вт на уровне сервера) – это суперрезультат. И даже при таком фантастическом прогрессе относительно предыдущего поколения односокетных процессоров, новая серия рекламируется не особенно интенсивно. Чемпионом по количеству ядер на сокет в настоящий момент является AMD (пока не вышла серия Xeon 6 Sierra Forest, выпуск которой запланирован на 2-й квартал 2024 года). Но, даже не претендуя на лидерство в части производительности одного сокета, с точки зрения прогресса относительно предыдущего поколения топовый представитель новой односокетной линейки Intel демонстрирует выдающиеся достижения.

Вместе с ростом производительности мы получаем и рост цены полуторакратный по сравнению с Gold 6414U. Это адекватно приросту производительности, и практически в односокетном сервере такого класса стоимость CPU составляет менее половины стоимости всей конфигурации. Для типовой конфигурации это означает увеличение производительности на 50-70% при увеличении потребляемой мощности на 85 Вт и увеличении стоимости системы примерно на 20%.

17

Единственное, чего здесь еще можно пожелать, – это включение ускорителей типа QuickAssist. Поддержка Intel QAT уже есть в Ubuntu, мы ее протестировали и получили солидную прибавку к производительности. Если бы эти ускорители были включены на односокетных чипах, это очень существенно повысило бы конкурентоспособность этих процессоров с меньшим числом ядер в сравнении с предложениями AMD и Arm.

Тем не менее, прогресс EMR относительно SPR действительно впечатляет. Вероятнее всего, Intel удалось сэкономить часть энергии на уровне перехода от 4-плиточной схемы к более эффективной 2-плиточной, и эта энергия была использована для повышения тактовых частот ядер CPU.

Заключение

Конечно, мир серверных процессоров постоянно меняется. Однако это хороший пример, показывающий, как Intel расширяет свое односокетное портфолио. Надеемся, в будущих поколениях своих процессоров Intel продолжит развивать это направление. Это обеспечит массовое развертывание малопотребляющих стоечных серверов, в эффективности которых мы убедились на собственном опыте. Для этой категории серверов односокетная платформа – самое актуальное решение, где бы они ни развертывались, в сегодняшних полевых условиях или в лабораториях будущего в качестве нод.

18

Мы надеемся увидеть пополнение односокетной линейки Intel в ближайших поколениях. Вот мы смотрим на энергопотребление современных серверов, где у нас будут более чем 500-ваттные процессоры уже в обозримом будущем, в то время как можно просто взять ряд стоек, которые работают на менее энергоемком «железе». Простой способ снизить энергопотребление – перейти на односокетные платформы. Даже в условиях сегодняшних препятствий, очевидным преимуществом серии 5-го поколения Xeon является фантастическое увеличение производительности без значительного роста энергопотребления. Как минимум, мы теперь знаем, что 5-е поколение чипов XCC намного эффективнее 4-го.

Источник: www.servethehome.com

подписаться   |   обсудить в ВК   |