Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Среда, 26 июля 2023 16:31

Серверные процессоры AMD EPYC Bergamo: необычайно свежий подход к облачному компьютингу

короткая ссылка на новость:
У современных процессоров есть одна очевидная проблема, и AMD со своей стороны предпринимает первые шаги к ее решению. AMD EPYC Bergamo – новейшая линейка процессоров, которая предлагает до 128 ядер в одном процессоре. Типовой современный подход подразумевает разработку более быстрых ядер с большим количеством транзисторов, однако AMD идет другим путем и преднамеренно снижает тактовую частоту ядра, предлагая новые характеристики, которых мы раньше не видели. Это начало наступления процессоров x86 на королевство облачных вычислений, где ранее доминировали процессоры ARM. В этой статье мы рассмотрим этот марш-бросок более подробно.

1

Чип AMD EPYC 9754 Bergamo.

“Какой серверный процессор самый быстрый?” Сложный вопрос.

Пять лет назад ответ на вопрос – какой серверный процессор из доступных на открытом рынке является самым быстрым – по сути, сводился к поиску чипа Intel с самой высокой стартовой ценой (MSRP). Но времена меняются. Сегодня при ответе на этот вопрос в большей степени учитывается специфика вычислительной нагрузки. И AMD сегодня в рамках платформы с сокетом AMD SP5 предлагает три линейки процессоров EPYC, специализированные под конкретные виды нагрузки.

2

AMD EPYC 9754 Bergamo, AMD EPYC 9684X Genoa X и AMD EPYC 9654 Genoa – какой процессор самый быстрый?

В этой статье основное внимание будет уделено серии Bergamo, которая предлагает большое число ядер, но при этом более низкие тактовые частоты и меньший объем кэша. Обзор массового процессора Genoa мы уже делали – этот чип в потрясающем стиле опередил Intel Xeon.

Мы также рассмотрим вкратце чип Genoa-X, подробный обзор которого планируем сделать позднее – как и чипа Intel Xeon Max с 64 ГБ памяти HBM2e на борту.

3

Процессоры AMD EPYC 9684X Genoa X и EPYC 7773X Milan X.

По аналогии с Milan-X и настольными чипами в Genoa-X был добавлен 3D V-Cache, что позволило довести объем кэша L3 до 1.1 ГБ на один процессор. Чтобы вы могли оценить этот объем, отметим здесь комментарий одного из читателей нашего блога в Twitter, обратившего внимание на то, что 1.1 ГБ – это количество системной памяти, достаточное для соответствия минимальным системным требованиям для 32-разрядной Windows 7.

4

Обсуждение AMD Genoa X в Twitter.

Так как технологию кэширования мы уже подробно обсудили, в этой статье мы сфокусируемся на новой оптимизированной архитектуре Zen 4c и посмотрим, какой вклад линейка EPYC Bergamo вносит в портфолио рекордов AMD.

Спецификации процессоров AMD EPYC Bergamo и кое-что еще

Давайте освежим в памяти спецификации моделей серии AMD EPYC Bergamo, а также отметим некоторые другие вещи, не вошедшие в презентацию AMD, но которые мы выявили в ходе тестирования трех различных систем с тремя разными чипами этой серии. Итак, во-первых, процессоры новой линейки предлагают или 112, или 128 ядер.

5

Слайд из презентации серии AMD EPYC 97X4 Bergamo.

При создании архитектурной модификации Zen 4c AMD удалось уменьшить площадь каждого модуля CCD. В Zen 4c уменьшен кэш L3 (вдвое – с 4 до 2 МБ), и это позволило компании пропорционально уменьшить площадь кристалла. Также AMD удалось оптимизировать такие вещи, как длина дорожек в кристалле и т.д. В результате площадь каждого ядра в Zen 4c получилась намного меньше, чем в Zen 4.

6

Сравнение площадей кристаллов AMD Zen 4 и Zen 4c.

Именно уменьшение кэша L3, а не сокращение функционала, является одним из главных коммерческих аргументов AMD. Intel в поколении Sierra Forest планирует осуществить переход с ядер P на ядра E. В то же время AMD использует здесь полный набор инструкций x86 Zen 4, а не «фиговый лист» по образцу многих предложений Arm.

7

Основные спецификации AMD Zen 4 и Zen 4c.

AMD также демонстрирует здесь свой чиплетный подход. Мы видим тот же самый кристалл I/O с поддержкой PCIe Gen5 и DDR5, который мы уже видели в чипах Genoa и Genoa-X. Это подразумевает известное количество памяти и значительно упрощает валидацию платформы. Контроллеры DDR5 и PCIe Gen5 также остаются без изменений. Существенное изменение, отличающее серию Bergamo, – переход от схемы Genoa с 12-ю 8-ядерными CCD (96 физических ядер) к схеме с 8-ю 16-ядерными CCD (128 физических ядер).

8

Компоновка чипа AMD EPYC Bergamo.

Кроме того, эта компоновка остается в рамках сокета AMD SP5, так что мы могли тестировать новые процессоры на имеющихся у нас серверах и материнских платах.

9

Контактные площадки чипа AMD EPYC Bergamo.

Что касается линейки процессоров, то флагманский AMD EPYC 9754 предлагает 128 ядер/ 256 потоков и стоит $11900. Это, вероятно, лучший вариант для виртуальных машин с двумя виртуальными процессорами. Для тех, кто не использует SMT, есть 128-ядерный/ 128-поточный процессор AMD EPYC 9754S за $10200. Наконец, AMD EPYC 9734 предлагает 112 ядер и стоит $9600. В этой линейке AMD нет SKU с числом ядер ниже 112, так как это диапазон линейки Genoa (до 96 ядер).

10

Процессоры серии AMD EPYC 97X4 Bergamo.

Теперь о том, что мы выявили самостоятельно в ходе тестирования. Ниже приведен наглядный скриншот. Одна из претензий к традиционным схемам x86 – значительный разброс тактовых частот ядер в многоядерном режиме turbo boost: некоторые ядра могут работать с низкими частотами, тогда как другие разгоняются до более высоких скоростей.

Результаты Htop для AMD EPYC 9754 Bergamo.

Для 100%-ной загрузки всех 256 потоков мы использовали утилиту stress-ng. Результаты получились впечатляющие.

Результаты 22.5-часового нагрузочного тестирования AMD EPYC 9754.

В спецификациях заявлена boost-частота 3.1 ГГц. И, в отличие от многих других серверных процессоров, здесь все 128 ядер в течение многих часов стабильно удерживали частоту 3.1 ГГц – причем в сервере с не самой лучшей системой охлаждения, где температура процессора держалась в районе 75°C. Тем не менее, все 256 потоков были загружены и все 128 ядер работали с частотой 3.1 ГГц.

Снижение максимальной тактовой частоты фактически обеспечивает одинаковую скорость всех ядер, что особенно важно для специализированных облачных процессоров. Более того, этот облачный процессор не представляет собой голые ядра. Он предлагает ISA поколения AMD Zen 4 с поддержкой AVX-512 и такие вещи, как bfloat16 и VNNI для машинного обучения.

Результаты Lscpu для AMD EPYC 9754 Bergamo.

Все это достигается ценой двух относительных издержек в части спецификаций:

  • уполовинивания кэша L3;
  • снижения максимальной тактовой частоты.

В то же время серия Bergamo повышает общекомандный рекорд процессоров AMD в части количества ядер.

Переходим к показателям производительности.

Производительность процессора AMD EPYC 9754

Наша концепция бенчмаркинга переживает переходный период. У нас есть несколько одноинстансовых нагрузок, но, если подходить к вопросу реалистично, то систем, которые распределяют одиночную нагрузку по 60- или 96-ядерным виртуальным процессорам, становится все меньше. Пример таких вычислений – область HPC, но в виртуализированных средах большинство виртуальных машин (ВМ) содержат не более восьми виртуальных процессоров (vCPU). Контейнеры и микросервисы предполагают еще большую диверсификацию. В конце этого года мы планируем сделать нашу вычислительную среду еще более разнообразной, чем в настоящий момент, поскольку обработка масштабируемых одиночных нагрузок, становящихся все более сложными, – это вызов сегодняшнего дня.

14

Чип AMD EPYC 9754 Bergamo.

Bergamo – наглядный пример платформы, на которой многие относительно старые приложения, рассчитанные на распределение нагрузки по всем имеющимся ядрам, могут просто не запуститься, поскольку они не рассчитаны на масштаб 256 ядер/ 512 потоков.

Компиляция ядра Linux 4.4.2 в Python

Это один из самых запрашиваемых бенчмарков на протяжении последних нескольких лет. Задача простая – мы берем стандартный конфигурационный файл Linux 4.4.2 kernel с сайта kernel.org и запускаем процесс автоконфигурации с задействованием всех потоков системы. Результаты выражены в единицах компиляции в час.

15

В этом примере ключевую роль играет масштабирование. Используя большие 96- и 128-ядерные чипы AMD EPYC, мы получаем громадное преимущество, особенно в двухсокетных системах, при групповом распределении нагрузки по ядрам и потокам. Хотя здесь процессор Genoa-X выигрывает у EPYC 9654 за счет своего супербыстрого кэша, эпизодическая однопоточная составляющая нагрузки не играет на руку процессорам Bergamo. И это одна из причин того, почему производительность заметно возрастает при выделении в составе Bergamo 64-ядерных/128-поточных рабочих сегментов. Процессор AMD EPYC 9754 был изначально разработан для облачных вычислений, подразумевающих одновременное выполнение многих задач, а не распределение одной задачи по всем 128 ядрам с риском пробуксовки на однопоточных операциях.

Бенчмарк c-ray

Бенчмарк c-ray мы используем уже давно. Эта программа осуществляет рейтрейсинг, который является крайне популярным видом многопоточной нагрузки для дифференцирования процессоров по производительности. Мы предлагаем вашему вниманию результаты, полученные на разрешении 8K, которые наглядно показывают разницу в производительности у процессоров серверного класса.

16

Бенчмарк c-ray 8K можно рассматривать как аналог Cinebench в среде Windows. Когда мы только начинали его использовать, время выполнения порядка нескольких минут для большинства систем было отличным результатом. Сегодня он выполняется за секунды на достаточно высоком разрешении. Здесь все ядра AMD EPYC 9754 равномерно загружаются, так что мы получаем лучшую производительность. Эта задача не требует большого объема кэша, поэтому EPYC 9684X, который имеет более низкую тактовую частоту и 1.1-гигабайтный 3D V-кэш, остается на третьем месте.

Сжатие файлов в 7-zip

7-zip – популярное приложение для упаковки/ распаковки файлов, которое работает на различных программных платформах. Мы начали использовать 7-zip давным-давно в тестах под Windows. Сегодня это часть Linux-Bench.

17

Если вы все еще используете чипы Intel Xeon E5 V3/ V4, или даже Platinum 8180 поколения Skylake, то можете убедиться, что сегодня в задачах архивирования возможны в 4-7 раз большие скорости. И даже при условии более высокого энергопотребления этих современных серверов результирующее энергопотребление ЦОД получается намного меньше.

SPEC CPU2017

SPEC CPU2017 – вероятно, самый известный и широко используемый в RFP на серверы бенчмарк. Мы давно проводим независимое тестирование в SPEC CPU2017, и наши результаты обычно на несколько процентов ниже официальных результатов из презентаций OEM-фирм. Разница стабильно составляет около 5%, поскольку OEM проводят целенаправленную оптимизацию своих систем под эти важные бенчмарки. В отличие от «стандартных» выпусков, OEM в этих случаях публикуют результаты своих тестов до выхода продукта на рынок, и на эти официальные результаты можно ориентироваться. На некоторых новых чипах из этого обзора, как то – Intel Xeon Max 9480, AMD EPYC 9684X и EPYC 9754, мы получили результаты примерно на 5% ниже по сравнению с лучшими опубликованными показателями.

Сначала рассмотрим наиболее общий для корпоративных и облачных приложений бенчмарк – производительность в целочисленных операциях SPEC CPU2017.

18

SPEC CPU2017 распределяет нагрузку по всем ядрам системы, поэтому 128-ядерный процессор здесь закономерно показывает лучший результат.

Теперь посмотрим на вещественные вычисления:

19

Когда мы увидели свои результаты, то первым делом усомнились в их корректности. Сравнили их с результатами OEM – там такая же картина. Хотя Intel и заявляет, что их клиентские нагрузки больше не соответствуют SPEC CPU2017, это по-прежнему важный бенчмарк. Однако по этой причине здесь не представлены бенчмарки для сжатия/шифрования QAT и машинного обучения AMX. Тем не менее, на крупных предприятиях и в правительственных организациях это общепризнанный критерий, используемый в RFP.

Еще один вопрос, который мы хотели бы здесь затронуть, касается “специализированно облачного” сегмента. Так как OEM в своих оптимизациях ориентированы на максимально возможные результаты, это не базовый уровень GCC. С одной стороны, набор компиляторов GCC и так не обеспечивает лучшую производительность чипов Intel и AMD. С другой стороны, в связи с повсеместным внедрением ИИ, пользователи часто просят нас проконсультировать их по вопросам применения более проприетарных компиляторов и ускорителей. Три года назад все говорили только про GCC. Возможно, маятник качнулся в другую сторону под влиянием NVIDIA CUDA и других проприетарных технологий оптимизации. Как бы то ни было, за последнее время произошли весьма значительные изменения. Набор GCC еще имеет значение, но в мире, где люди обсуждают актуальность перехода на водяное охлаждение ради снижения энергопотребления на 12-15%, 20%-ная прибавка к производительности за счет одной только оптимизации программного обеспечения выглядит привлекательным и легкодостижимым решением.

20

Чипы AMD EPYC 9754 Bergamo и Ampere Altra Max M128 30.

Это важно, поскольку процессор Ampere Altra Max на базе Arm существенно отстал от AMD EPYC 9754. Производительность AMD в SPEC CPU2017 примерно втрое выше, чем у Altra Max при одинаковом количестве ядер (128). Это нужно иметь в виду в плане энергопотребления, так как чип AMD потребляет далеко не в три раза большую мощность. В настоящее время Ampere отгружает процессоры AmpereOne для гипермасштабируемых сред, но 128-ядерный Altra Max был выпущен примерно за два года до выпуска 128-ядерного Bergamo.

Производительность в сетях дистрибуции контента STH Nginx CDN

В тесте Nginx CDN мы используем старый снапшот и шаблон доступа с сайта STH, с отключенным DRAM-кэшированием, чтобы проиллюстрировать производительность в аспекте передачи данных с дисковых накопителей. Для этого требуется низкая задержка операций Nginx, а также низкая задержка на дополнительном шаге доступа к интерфейсу I/O, что делает задачу интересной на уровне сервера. Вот как выглядит скорость дистрибуции:

21

Переход к нагрузкам, более близким к реальным приложениям, является нашей текущей задачей. Для тестирования производительности новых чипов мы используем актуальные данные с сайта STH. Результаты чипа Genoa-X нас слегка удивили. По-видимому, некоторый недобор в скорости обработки запросов объясняется более низкой тактовой частотой. И снова мы получаем похожую картину у Milan и Milan-X.

Такое впечатление, что это чисто облачная нагрузка, относящаяся к основному сайту STH. И результаты AMD EPYC Bergamo просто потрясают.

Анализ ценообразования в MariaDB

Эта задача очень интересна лично мне. Этот тест создан на базе нагрузки, представляющей собой приложение для анализа аспектов ценообразования на основе анонимизированных данных одного из ведущих ЦОД OEM. Приложение фактически анализирует в реальном времени многопараметрические тенденции в ценообразовании по данным продуктовых линеек, регионов и каналов поставок и определяет выгодность или невыгодность конкретных BOM-спецификаций (перечней элементов) устройств. Если эта задача представляется вам слишком специфической, то разница между ней и тем, что считают крупные производители, заключается в конкретных данных, используемых для анализа. Приложение этого типа можно переключить на методологию машинного обучения, но само по себе оно представляет наглядный пример сценария, который реальные предприятия могут запускать в облаке.

22

Процессоры Milan-X и Genoa-X здесь настоящие монстры. С другой стороны, в этом виде нагрузки меньший кэш и меньшие тактовые частоты не приносят чипам Bergamo никакого преимущества. В то же время использование этого приложения позволяет крупным OEM-компаниям экономить на торговых операциях до нескольких миллионов долларов в год. Хотя чипы класса high-end могут стоить дорого, в приложениях этого типа они окупаются в часовом эквиваленте.

Виртуализация в среде STH STFB KVM

Еще один пример, который мы хотели бы здесь привести, – из практики одного из клиентов нашей лаборатории DemoEval, который разрешил нам опубликовать результаты, хотя само тестируемое приложение относится к закрытым источникам. Рабочий сценарий использует систему виртуализации KVM (Kernel-based Virtual Machine), а задача заключается в том, чтобы выяснить, сколько виртуальных машин могут параллельно работать онлайн в течение времени, требующегося для выполнения работ в соответствии с условиями SLA (соглашения об уровне сервиса). Каждая виртуальная машина работает независимо от остальных. В части решаемых задач это очень похоже на VMware VMark, просто сценарий с использованием KVM более общий.

23

Часто производительность ВМ больших размеров ограничивается со стороны памяти. Так как мы заполнили все каналы памяти на всех тестируемых платформах, чипы Intel при увеличении размера ВМ демонстрировали более низкие результаты – из-за лимита памяти в 1 ТБ при использовании 64-гигабайтных DIMM-модулей (8 каналов, 2 процессора, 64 ГБ на канал), тогда как AMD располагает 1.5 ТБ в 12-канальной конфигурации.

При уменьшении размеров ВМ чипы Bergamo проявляют себя блестяще.

24

128-ядерный AMD EPYC 9754 просто повергает в восхищение. Этот тест вызывал у нас наибольшее беспокойство: мы видели, что чип Bergamo может стабильно держать частоту 3.1 ГГц на всех ядрах, но в этом тесте мог заколебаться. Однако специализированный облачный чип Bergamo одержал здесь еще одну победу. Возможно, это и не должно удивлять, так как он был разработан именно в расчете на интенсивную нагрузку в виртуализированной среде.

Теперь давайте посмотрим на энергопотребление этого процессора.

Энергопотребление чипа AMD EPYC 9754

Новейшие чипы AMD семейства SP5 потребляют мощность, довольно близкую к спецификациям TDP. В этом отношении они похожи на видеокарты NVIDIA и процессоры Ampere. С 360-ваттным чипом AMD EPYC 9654 мы могли бы рассчитывать на максимальное энергопотребление в районе 450-550 Вт в односокетной конфигурации. В двухсокетной – от 800 Вт до 1.1 кВт, в зависимости от конкретных особенностей конфигурации. На AMD EPYC 9754 мы и получили примерно такие показатели, тогда как с Genoa-X энергопотребление было несколько выше.

В части энергопотребления мы получили, возможно, наиболее впечатляющие результаты. Мы часто слышим, что серверы на базе Arm по энергетической эффективности всегда будут превосходить серверы на базе x86, но в облачном сегменте это уже не абсолютная истина. В тесте SPEC CPU2017 чип AMD EPYC 9754 по производительности примерно в 3 раза превзошел свой единственный аналог по числу ядер, 128-ядерный Ampere Altra Max M128-30. А разница в энергопотреблении – далеко не трехкратная. В недавнем обзоре сервера HPE ProLiant RL300 Gen11 мы получили максимум энергопотребления в районе 350-400 Вт. В обзоре двухъюнитового сервера Supermicro ARS-210ME-FNR 2U Edge на Ampere Altra Max Arm мы получили 132 Вт в простое и 365-400 Вт максимум. Чип Bergamo мы тестировали на нескольких односокетных двухъюнитовых серверах Supermicro, включая Supermicro CloudDC AS-2015CS-TNR, и получали 117-125 Вт в простое и 550-600 Вт максимум.

Итак, фишка в том, что AMD сегодня предлагает втрое большую производительность в SPEC CPU2017 при близких показателях энергопотребления в простое и всего на 50% (в полтора раза) больших в режиме максимальной нагрузки. Мы уверены, что новые чипы AmpereOne постараются изменить этот счет в свою пользу, но у скептиков в отношении применения чипов x86 в облачном сегменте есть повод задуматься.

Переходим к основным выводам и заключению.

Чем удивляет процессор AMD EPYC 9754?

Сегодня, когда в нашем распоряжении имеются обе линейки AMD EPYC – Genoa-X и Bergamo, мы со всей очевидностью можем заключить, что последняя является более впечатляющей. Хотя мы знаем, что Microsoft Azure в восторге от Milan-X и Genoa-X. Давайте отметим ключевые пункты:

  • во-первых, ядра Zen 4c располагают вдвоем меньшим кэшем L3, чем у Zen 4;
  • чип AMD EPYC 9754 продемонстрировал втрое большую производительность по сравнению со своим 128-ядерным Arm-аналогом и только в полтора раза большее энергопотребление;
  • во многих сценариях AMD EPYC 9754 демонстрирует вдвое большую производительность по сравнению с 64-ядерными чипами AMD EPYC 7002 “Rome” 2019 года выпуска;
  • в большинстве сценариев, не относящихся к области HPC, можно ожидать, что AMD EPYC 9754 будет на 15-20% быстрее AMD EPYC 9654. Это не прямо пропорциональная увеличению числа ядер прибавка (которая в этом случае составила бы 33%), но она весьма существенна, если учесть, что одновременно с увеличением числа ядер AMD резко сократила емкость кэша L3;
  • похоже, что в AMD нашли какой-то элегантный способ уменьшить разброс тактовых частот в режиме максимальной загрузки всех ядер. Это повысит надежность высоконагруженных систем, в том числе в части SLA;
  • специализированные облачные процессоры в перспективе могут составить большой сегмент рынка.

В данном обзоре AMD EPYC 9754 особое внимание хотелось бы обратить на следующую иллюстрацию:

Результаты 22.5-часового нагрузочного тестирования AMD EPYC 9754.

Каждое ядро в режиме стрессовой загрузки всех 256 потоков стабильно работает с частотой 3.1 ГГц; тепловыделение максимально, но тактовая частота всех ядер остается постоянной даже при высоких температурах CPU. Для сегмента облачных вычислений, где уменьшение разброса производительности является одним из приоритетов, этот результат крайне важен: он показывает, что все ядра могут синхронно обеспечивать одну и ту же скорость. Это не является общим свойством серверных процессоров EPYC и Xeon.

25

Чип AMD EPYC 9754.

Мы предполагаем, что через пять лет сверхмногоядерные облачные процессоры будут представлять не менее 25% рынка CPU. Сегодня это узкоспециализированный сегмент, составляющий менее 10% процессорного рынка. Подход AMD отличается оригинальностью во многих аспектах. Например, зачем процессору AMD EPYC 9754 нужны расширения AVX-512? Другие облачные процессоры пренебрегают производительностью вещественных операций и фокусируются на целочисленных. Корневое отличие заключается в размере кэша.

В перспективе архитектура Zen 4c может перевернуть отрасль. Чиплетную методологию AMD очень легко перенять. У нас есть линейка Genoa, а также Genoa-X с «многоэтажным» кэшем 3D V-Cache. А теперь у нас есть еще и Bergamo. В следующем поколении легко представить себе сочетание большого числа ядер, урезанного кэша L3 на том же уровне компоновки и 3D V-кэша поверх него. Это напрашивающееся решение в будущем позволит еще больше увеличить число ядер.

26

Чип Ampere AmpereOne A160 30 на Computex 2023.

Еще один вопрос, который стоит прояснить, – плотность вычислительной среды. Ampere со своей серией AmpereOne тоже затевает что-то небанальное. Они предлагают 192 ядра без SMT. Это значит, что облачные провайдеры смогут предлагать до 192-х (минус какой-то запас) однопроцессорных (vCPU) инстансов на один физический чип. В случае AMD, то есть двух потоков на каждое ядро чипа, можно предложить до 128-ми двухпроцессорных инстансов на чип. К слабым местам линейки Bergamo можно отнести энергетически «прожорливый» кристалл I/O. Уже в ходе разработки Ampere Altra Max компания Ampere ориентировалась на ТЗ, полученное от облачных провайдеров, таких как Microsoft, Oracle и Google. Поэтому чипы Ampere специально подгонялись под это ТЗ, плюс некоторый запас. Чип AMD разрабатывался без ТЗ заказчиков, но предлагает примерно втрое большую производительность на ядро. Это может иметь больший вес, чем заданные в ТЗ целевые требования к облачному процессору.

Вы, возможно, обратили внимание на то, что мы не упомянули в этом разделе процессоры Intel Xeon. Это потому, что Intel в настоящее время занимается ядрами full-performance, а выпуск серии Intel Sierra Forest E-Core Xeon запланирован на 2024 год. Если вам нужен специализированный облачный процессор прямо сегодня, то выбирать придется между линейкой Ampere Altra Max (которую скоро сменит AmpereOne) и линейкой AMD EPYC Bergamo. На данный момент таково положение дел в этом развивающемся сегменте. Мы уже заждались выхода Xeon’ов на энергетически эффективных ядрах E.

Резюме

При всех достоинствах нового чипа AMD EPYC Genoa-X (результаты которого мы включили в этот обзор), чип Bergamo – это компонент, который точно не останется незамеченным. Это пример для других чипов x86. Здесь не идет речь о копировании решений Arm. Сниженная до 3.1 ГГц максимальная тактовая частота чипа AMD, тем не менее, позволяет ему обеспечивать солидную производительность без гонки скоростей. И вообще, облачные процессоры сегодня являются объектом всеобщего внимания, что по определению делает чип Bergamo еще более значимым для отрасли.

На мой взгляд, значение серии AMD EPYC Bergamo трудно переоценить. Заказчик может использовать массовые 32- и 64-ядерные чипы Genoa для популярных приложений x86. Более специализированные 16-ядерные SKU Genoa-X с 48 МБ кэша L3 на ядро или 96-ядерные компоненты с 1.1 ГБ L3 на ядро могут добавляться в кластеры для лицензирования программного обеспечения или HPC-нагрузок. А чип AMD EPYC 7954 предлагает множеству 4- и 8-процессорных ВМ значительный апгрейд в части плотности вычислений и снижения стоимости ВМ с точки зрения энергопотребления и размера системы. В части ISA вся линейка полностью аналогично Zen 4, что выделяет ее на фоне концепции Intel с ядрами P и E и тем более концепции Arm.

27

Чип AMD EPYC 9754 Bergamo.

AMD сегодня предлагает экосистему высококлассных и полностью совместимых друг с другом чипов. Выпуск Bergamo – это мощный посыл и новое слово в отрасли.

Источник: www.servethehome.com

подписаться   |   обсудить в ВК   |