Суббота, 15 мая 2021 10:03
От Rome к Milan: обзор производительности процессоров AMD серии EPYC 7003 поколения Zen 3
Недавно компания AMD выпустила третье поколение серверных процессоров серии EPYC, известное также под общим наименованием Milan. Это обновление серии EPYC несет дата-центрам преимущества архитектуры AMD Zen 3 – улучшенную энергетическую эффективность, более высокую производительность и более надежную защиту данных. Сегодня мы на примере нескольких чипов посмотрим, как новейшее поколение серверных процессоров AMD справляется с рабочей нагрузкой, предъявляющей самые высокие требования к производительности.
Введение: краткий обзор преимуществ Zen 3
Четыре года назад AMD представила серию процессоров EPYC, которая ознаменовала собой триумфальное возвращение компании в корпоративный сегмент. В тот раз AMD предложила 32-ядерные опции с поддержкой двух сокетов (2P), обеспечивающие 128- поточную обработку данных в одном вычислительном узле. И все это время максимальное число ядер в аналогичных топовых компонентах Intel оставалось на отметке 28, хотя грядущие процессоры с архитектурой Ice Lake должны наконец изменить эту ситуацию.
За время, прошедшее с момента выхода в 2017 году первого поколения EPYC Naples, AMD выпустила уже два поколения серверных процессоров на базе усовершенствованной архитектуры Zen. Второе поколение Rome отличали меньшие значения задержки, более высокая производительность и наличие чипов с вдвое большим числом ядер. Выпуск третьего поколения EPYC (Milan) представляет первые серверные чипы, базирующиеся на наиболее продвинутой на сегодняшний день архитектуре AMD – Zen 3.
Процессор AMD EPYC 7763 в ожидании установки
Когда в 2019 году AMD только выпустила линейку процессоров Rome, в ней не было моделей с номинальной мощностью 280 Вт, но позднее такая опция появилась – это EPYC 7H12. А в новой линейке 3-го поколения уже не один высокопроизводительный 280-ваттный компонент, а целых два. И, как и в предыдущем поколении, AMD предлагает здесь специализированные SKU серии "F", в которой акцент сделан не только на повышение тактовых частот, но и на увеличение объема кэша (относительно числа ядер).
Процессоры серии AMD EPYC 7003
Процессор | Число ядер/ потоков | Тактовая частота базовая/ Turbo, ГГц | Объем кэша, МБ | Min cTDP, Вт | Max cTDP, Вт | Цена 1Ku, $ |
7763 | 64/ 128 | 2.45/ 3.50 | 256 | 225 | 280 | 7890 |
7713 | 64/ 128 | 2.000/ 3.675 | 256 | 225 | 240 | 7060 |
7713P | 64/ 128 | 2.000/ 3.675 | 256 | 225 | 240 | 5010 |
7663 | 56/ 112 | 2.0/ 3.5 | 256 | 225 | 240 | 6366 |
7643 | 48/ 96 | 2.3/ 3.6 | 256 | 225 | 240 | 4995 |
7543 | 32/ 64 | 2.8/ 3.7 | 256 | 225 | 240 | 3761 |
7543P | 32/ 64 | 2.8/ 3.7 | 256 | 225 | 240 | 2730 |
7513 | 32/ 64 | 2.60/ 3.65 | 128 | 165 | 200 | 2840 |
7453 | 28/ 56 | 2.75/ 3.45 | 64 | 225 | 240 | 1570 |
7443 | 24/ 48 | 2.85/ 4.00 | 128 | 165 | 200 | 2010 |
7443P | 24/ 48 | 2.85/ 4.00 | 128 | 165 | 200 | 1337 |
7413 | 24/ 48 | 2.65/ 3.60 | 128 | 165 | 200 | 1825 |
7343 | 16/ 32 | 3.2/ 3.9 | 128 | 165 | 200 | 1565 |
7313 | 16/ 32 | 3.0/ 3.7 | 128 | 155 | 180 | 1083 |
7313P | 16/ 32 | 3.0/ 3.7 | 128 | 155 | 180 | 913 |
Серия F | ||||||
75F3 | 32/ 64 | 2.95/ 4.00 | 256 | 225 | 280 | 4860 |
74F3 | 24/ 48 | 3.2/ 4.0 | 256 | 225 | 240 | 2900 |
73F3 | 16/ 32 | 3.5/ 4.0 | 256 | 225 | 240 | 3521 |
72F3 | 8/ 16 | 3.7/ 4.1 | 256 | 165 | 200 | 2468 |
Все процессоры EPYC 7003 поддерживают интерфейс x128 PCIe 4.0 и восьмиканальную конфигурацию памяти объемом до 4 ТБ (DDR4-3200, 128 ГБ на DIMM-модуль) |
В предыдущем поколении у AMD было больше 8-ядерных SKU, а здесь только один, но он более интересен, даже если на первый взгляд это неочевидно. Для всех чипов серии "F" приоритетной характеристикой является тактовая частота, но 8-ядерный 72F3 под капотом также имеет 256-мегабайтный кэш – по 32 МБ на ядро. Это вдвое больше максимального для 8-ядерных опций объема кэша, который был в предыдущем поколении, поэтому чип 72F3 можно назвать интригующим.
Топовый компонент новой линейки AMD, процессор EPYC 7763, является эффективным аналогом 7H12 – самого мощного представителя предыдущего поколения AMD с таким же 280-ваттным TDP. Все новые чипы EPYC предлагают настраиваемый TDP, при этом оба 280-ваттных процессора можно настроить на меньшую мощность – до 225 Вт. И, хотя в части TDP многие аналогичные модели предыдущего и нового поколений AMD имеют одинаковые характеристики, более свежие аналоги, как мы видим, имеют более высокие тактовые частоты – во всех случаях.
Еще один интересный SKU в этой линейке – первый 56-ядерный процессор EPYC: 7663. По количеству поддерживаемых вычислительных потоков – 112 – процессор 7663 соответствует топовому 2P-серверу Intel, и это только одиночный процессор. Хотя вы можете сказать, что AMD в данном случае применяет силовой прием – давит количеством ядер.
Большое число ядер может быть оптимальным для определенных видов нагрузки, но в линейке AMD EPYC, естественно, широко представлены модели, подходящие для самых разных задач.
Как и процессоры EPYC предыдущего поколения, эти новейшие модели могут поддерживать до 32 модулей L/RDIMM по 128 ГБ, то есть в общей сложности до 4 ТБ памяти DDR4-3200. В свою очередь восьмиканальный контроллер памяти, как мы увидим далее, тоже обеспечивает весьма серьезную пропускную способность. Наконец, все процессоры 3-го поколения EPYC могут использоваться как в одно-, так и в двухсокетных конфигурациях, за исключением моделей с суффиксом P, область применения которых ограничивается односокетными конфигурациями.
Модернизация архитектуры в поколении EPYC Milan
Со времени выпуска в 2017 году архитектуры Zen AMD проделала весьма успешную работу в направлении повышения показателей IPC (количества выполняемых за такт инструкций) своих чипов, что можно заметить, сравнивая каждое последующее поколение процессоров с предыдущим. Ядра третьего “от начала времен” поколения Zen дают наибольшую прибавку к IPC относительно своих предшественников, и вот AMD уже наступает на пятки Intel, чье лидерство в этой области до сего момента было бесспорным.
Как было и в предыдущем поколении чипов EPYC, более мощные процессоры 3-го поколения Milan наделены 256-мегабайтным кэшем, при этом на одно ядро может приходится до 32 МБ (как, например, в модели 72F3). Это стало возможным благодаря переходу AMD от 4-ядерной к 8-ядерной схеме CCX.
По словам AMD, процессоры Milan дают плюс 19% к IPC относительно предыдущего поколения, и, если принять во внимание ту производительность, которую уже показали процессоры AMD Zen 3 в пользовательских настольных ПК и рабочих станциях, это заявление вероятнее всего соответствует действительности. В новой архитектуре было усовершенствовано очень многое, в том числе: улучшена пропускная способность блоков целочисленных операций (а следовательно, выросла и скорость их выполнения), оптимизирован блок прогнозирования ветвлений TAGE, заметно снизились задержки в части обращений к памяти.
AMD существенно улучшила блок прогнозирования ветвлений еще во время перехода от Zen 1 к Zen 2 и продолжила его совершенствование в поколении Zen 3. Во-первых, размер L1 BTB увеличен вдвое – до 1024 записей, а благодаря новому механизму “no bubble” конечные результаты ветвей могут вычисляться в каждом такте. Кроме того, оптимизация блока прогнозирования ветвлений позволила снизить время задержки, являющееся «штрафом» за ошибочный прогноз.
В части исполнительных блоков были усовершенствованы блоки как целочисленных, так и вещественных операций. Целочисленные блоки получили отдельный сортировщик ветвлений и записываемых данных, в то время как реорганизация буфера позволила увеличить размер окна для большего количества обрабатываемых «на лету» инструкций. Что касается вещественных блоков, то здесь была удвоена пропускная способность каналов IMAC и ALU, для FMAC теперь требуется на один такт меньше (четыре вместо пяти), а вход и выход исполнительной части (целочисленной или вещественной) были расширены до шести операций за такт (вместо двух в схеме Zen 2).
Блок Load/Store в Zen 3 обеспечивает дополнительные обращения к памяти с большим числом операций загрузки и записи – три загрузки и две записи за один такт. Буфер трансляции-просмотра (TLB), осуществляющий трансляцию виртуальных адресов памяти в физические, также был серьезно усовершенствован: добавлено четыре дополнительных обходчика таблиц (теперь их шесть), что позволило уменьшить задержку при редких и/или случайных обращениях к памяти.
Все эти усовершенствования вносят свой вклад в 19%-ный прирост IPC, еще раз подтверждая тот факт, что для достижения подобного результата требуется тщательная проработка архитектуры процессора по многим различным аспектам.
Одно из наиболее заметных отличий процессоров EPYC Milan – дополнительная функция Secure Nested Paging, или, как ее представляет AMD, SEV-SNP. Это продвинутая защита истории обращений к памяти от возможного отслеживания злоумышленниками. Также компания добавила функцию Shadow Stack для защиты от вредоносного ПО типа ROP (return-oriented programming).
AMD представила новую инструкцию под названием Invalidate Page Broadcast, которая позволяет не прибегать к внутренним прерываниям в работе CPU в случае появления в TLB некорректных адресов; вместо этого информация об ошибке передается операционной системе, что в конечном счете повышает эффективность работы. В дополнение к поддержке шифрования AVX2 добавлены расширения VAES и VPCLMULQDQ с 256-разрядным форматом данных.
Далее мы исследуем производительность нескольких новых чипов AMD EPYC в ряде тестов, где будем сравнивать ее с производительностью 64-ядерного представителя предыдущего поколения EPYC – 7742, а также 28-ядерного процессора Intel Xeon Platinum 8280.
Тестовая конфигурация системы
В этом тестировании мы использовали последнюю версию серверной ОС Ubuntu Server с обновленным ядром. На платформе 3-го поколения использовалось новейшее ядро 5.11, хотя в ходе блиц-тестирования мы не заметили разницы в производительности при переходе с ядра 5.8 на 5.11. Последняя версия Ubuntu Server поставляется вообще с относительно старым ядром 5.4, которое мы сами решили обновить.
Поскольку нам нужны точные, воспроизводимые и по возможности соответствующие максимальной производительности результаты, мы всегда, перед началом каждого тестирования, подбираем конфигурацию, отвечающую потенциальной производительности CPU. Для платформы Xeon Platinum мы выбрали память DDR4-2933, так как это максимум, что может поддерживать это поколение процессоров (более современные процессоры 3-го поколения наравне с новыми EPYC поддерживают DDR4-3200), хотя на платформе предыдущего (2-го) поколения EPYC с процессором 7742 мы тоже использовали DDR4-3200 – хотя и в меньшем объеме, чем на новейшей платформе EPYC.
Все тесты мы запускали минимум по три раза, а в некоторых случаях – даже большее число раз, если это требовалось для уточнения результатов. Специфика многопоточных тестов такова, что они не всегда выполняются одинаково каждый раз, поэтому в некоторых случаях нам пришлось провести серию запусков (или парочку таких серий), прежде чем мы вышли на нужный доверительный уровень. Если вы хотели бы видеть здесь результаты каких-то других тестов, которые мы не включили в данную подборку, напишите об этом в комментариях.
Мы также хотели бы публично поблагодарить нашего друга Майкла Ларабела (Michael Larabel) из Phoronix за помощь в организации свежего тестирования процессоров предыдущих поколений – AMD EPYC 7742 и Intel Xeon Platinum 8280. Мы не располагаем собственными платформами на базе этих процессоров, и Майкл любезно предоставил нам свою систему, на которой мы и провели весь набор тестов, актуальные результаты которых вы найдете в нашем сегодняшнем обзоре.
Тестовые платформы | |
Процессор | 2x AMD EPYC 7763 (128C/256T) 2x AMD EPYC 7713 (128C/256T) 2x AMD EPYC 75F3 (64C/128T) 2x AMD EPYC 7742 (128C/256T) 2x Intel Xeon Platinum 8280 (56C/112T) |
Память | AMD EPYC 7003: 16 x 32GB Micron 36ASF4G72PZ-3G2E2 AMD EPYC 7742: 16 x 8GB Hynix HMA81GR7CJR8N-XN Intel Xeon: 12 x 32GB Hynix HMA84GR7CJR4N-WM |
Операционная система | AMD EPYC 7003: Ubuntu 20.04.2 (5.11 kernel) AMD EPYC 7742: Ubuntu 20.04.2 (5.8 kernel) Intel Xeon: Ubuntu 20.04.2 (5.8 kernel) |
Скорость компиляции программного кода
Обзор производительности новейших чипов AMD серии EPYC 7003 мы начнем с популярнейшей задачи – компиляции программного кода. Широко распространено мнение, что потенциал CPU полнее всего раскрывается в 3D-рендеринге, но компиляция также представляет собой очень показательный пример. Чем больше потоков доступно для обработки отдельных программных блоков, тем быстрее выполняется компиляция всего проекта – даже если весь процесс не требует задействования всего потенциала CPU, как некоторые другие задачи из разряда «хардкор».
Пока AMD не выпустила свои первые процессоры с числом ядер 32 и больше, было не вполне очевидно, будет ли компиляция осуществляться быстрее в соответствии с увеличением числа ядер, но, как мы сейчас можем убедиться, это действительно так, причем определенный прогресс виден и при переходе от предыдущего поколения к следующему. А новый «высокочастотный» процессор AMD EPYC 75F3 не только с легкостью опережает Intel Xeon Platinum 8280, но и превосходит 256-поточные опции в компиляции LLVM.
Научные расчеты
Как и в случае со многими другими видами рабочей нагрузки, не все приложения для решения задач молекулярной динамики написаны одинаково, но общим для них является то, что чем больше ядер в вашем распоряжении, тем быстрее решается задача. В тестах NAMD и GROMACS новый топовый процессор EPYC 7763 безоговорочно занимает первое место, обеспечивая себе комфортное преимущество и перед представителем предыдущего поколения 7742, и перед менее мощным современником 7713.
Несмотря на сравнительно небольшую разницу в числе ядер в пользу процессоров AMD, пара 32-ядерных чипов 75F3 заметно опережает пару 28-ядерных чипов Intel 8280. В LAMMPS процессор 7763 выступил на одном уровне с процессором предыдущего поколения 7742, хотя в тесте 20K Atoms продемонстрировал явное превосходство в производительности.
Как ни странно, в тесте OpenFOAM представитель предыдущего поколения 7742 оказался слегка впереди нового 7763, хотя, если учесть типичный для многопоточных тестов большой разброс результатов, многократное повторение этого теста может выровнять эту разницу. А связанный тест HPCG поставил все новые чипы примерно на один уровень, который, однако, находится заметно выше уровня компонентов предыдущего поколения.
В этом обзоре мы впервые применили тест toyBrot и получили настоящее удовольствие от распределения результатов, которое мы здесь видим. Топовый процессор AMD 7763 поднимается на верхнюю строчку итогового протокола, а чип 7713 располагается сразу за ним. В нашей реальной практике двухпроцессорная платформа 7713 потребляет примерно на 200 Вт меньше, чем аналогичная платформа 7763, поэтому такое положение вещей нас очень порадовало. Кроме того, как показывают тесты вроде этого, в Intel могли бы добавить больше ядер, если они хотят занимать высокие места в наших рейтингах производительности.
Кодирование изображений и видео
Далее мы займемся кодированием видео, а потом рендерингом. На первый взгляд – просто два вида нагрузки, но мы знаем, что для каждого из этих видов разработано множество разнообразных приложений, и это дает нам возможность убедиться, что результаты тестирования процессоров в этих приложениях тоже могут быть весьма разнообразными.
Кодирование мы рассмотрим на двух примерах: кодирование изображений в WebP2 (да, это свежий аналог WebP, а не опечатка)и кодирование видео в Intel SVT (VP9).
Кодирование всегда дает интересные результаты, особенно на многоядерных чипах. Чтобы преимущество в виде дополнительных ядер вылилось в фактическое увеличение скорости кодирования, нужно, чтобы решаемые процессором задачи были правильно распараллелены по потокам. Это большое искусство, которое намного эффективнее реализуется в таких решениях, как SVT, нежели в продуктах пользовательского сегмента.
В данных примерах и кодирование видео, и кодирование изображений дают нам похожую картину. Конкретно в этих случаях более высоких тактовых частот 75F3 оказалось достаточно для того, чтобы пара этих 32-ядерных компонентов обошла аналогичные пары 64-ядерных. Как обычно, при выборе процессора для этих задач нужно ориентироваться на конкретные приложения, с которыми вы работаете. И, хотя 7713 смог опередить 7763, мы относим это на счет нормального разброса, который всегда имеет место в бенчмарках. Тест SVT стал первым, где представитель предыдущего поколения Intel 8280 все-таки обогнал представителя предыдущего поколения EPYC 7742.
Рендеринг
В некоторых видах нагрузки чипы наподобие супербыстрого 75F3 могут справиться с заданием быстрее чипов с большим числом ядер, но рендеринг к таким видам не относится. В рендеринге будут задействованы все вычислительные мощности CPU, которые вы предоставите, поэтому, хотя более высокие частоты в ряде случаев могут ускорить процесс, дополнительные ядра дают здесь более ощутимое преимущество.
Во всех представленных здесь примерах новый топовый процессор EPYC 7763 прочно занимает первое место, уверенно опережая представителя предыдущего поколения 7742. Процессор Intel, который в тесте SVT выступил достаточно сильно для того, чтобы не оказаться на последнем месте, в рендеринге стабильно оказывается именно там. Ядра имеют значение – чем их больше, тем лучше. В случае одинакового числа ядер преимущество будет иметь процессор с более высокими тактовыми частотами, что мы наблюдаем здесь на примере новых чипов.
А вот другой пример влияния специфики нагрузки: в тесте Embree процессор Intel Xeon Platinum продемонстрировал в проекте Asian Dragon более высокую производительность, чем в Crown, а чипы AMD – наоборот. В то же время новейший 32-ядерный чип AMD 75F3 в обоих проектах был лучше процессоров предыдущего поколения.
Итак, мы рассмотрели такие специфические сценарии, как компиляция программ, научные расчеты и рендеринг. Далее мы посмотрим на более общие показатели производительности процессоров 3-го поколения EPYC: скорость сжатия файлов и фактически обеспечиваемую пропускную способность памяти.
Также мы рассмотрим более редкие для наших обзоров тесты, в том числе синтетические тесты NAS Parallel, а также CoreMark и даже John the Ripper. И везде работает общее правило: все нагрузки разные, поэтому полезно будет пройтись по всем результатам и посмотреть, как проявляет себя тот или другой чип в том или другом тесте.
Сжатие файлов
И снова мы наблюдаем пример того, как два приложения одинакового назначения (архивирование файлов) дают разные результаты с точки зрения производительности процессоров. В 7-Zip число ядер имеет определяющее значение, поэтому неудивительно, что верхние строчки турнирной таблицы заняли чипы AMD. Интересно, что 32-ядерный «высокочастотный» чип нового поколения 75F3 показал практически одинаковый результат с 64-ядерным чипом предыдущего поколения 7742, но что касается более новых 64-ядерных опций, то более совершенная по сравнению с Zen 2 архитектура позволила им занять высокие места с заметным отрывом от остальных.
А в Zstd больший вес имеют тактовые частоты, и первое место здесь занимает 32-ядерный чип 75F3, при этом оба 64-ядерных компонента нового поколения показывают примерно одинаковые результаты (здесь 7713 слегка опережает 7763, но с разницей такого порядка они могут меняться местами при многократных повторениях данного теста).
Производительность в шахматах (Chess Engine)
Шахматы, конечно, не самый актуальный вид нагрузки для большинства из тех, кто собирается покупать серверный процессор, но такой тест может служить отличным примером работы с ветвлениями, в которой задействуются все вычислительные мощности многоядерных процессоров. Ранее мы проводили только тест Stockfish, но теперь с удовольствием добавляем к нему еще и Crafty – потому что, как мы с вами видим в очередной раз, в ряде случаев 32-ядерный 75F3 может оказаться эффективнее более тяжелых опций. Повторяем еще раз – прежде чем покупать процессор, изучите как следует ту нагрузку, с которой он будет работать.
Также стоит отметить, что тест Crafty оказался более расположен к 28-ядерным чипам Intel, чем большинство других тестов. И он наглядно показывает, что ни один чип не может быть лучшим абсолютно везде.
Производительность памяти
Представленные на этой диаграмме результаты, достигнутые AMD, сложно переоценить. Мощный восьмиканальный контроллер памяти обеспечивает топовым процессорам AMD огромное преимущество в части пропускной способности памяти перед конкурирующими чипами Xeon. Это преимущество настолько велико, что можно было бы предположить, что Intel использует здесь только четырехканальный контроллер – но на самом деле шестиканальный. Обратите внимание также на рост обеспечиваемой процессорами AMD производительности памяти относительно показателей предыдущего поколения EPYC.
Жаль, что у нас не было возможности включить в этот обзор новейшие процессоры Intel Xeon, поскольку у них поддержка памяти поднята на уровень 3200 МГц, но, скорее всего, этого вряд ли хватило бы для того, чтобы существенно приблизиться к EPYC. Эти результаты обязательно нужно принять во внимание тем, кто серьезно заинтересован в повышении потенциала пропускной способности памяти.
Учтите также, что процессоры серии EPYC 7003 с кэшем менее 128 МБ могут использовать только четырехканальную память, тогда как все остальные – шести- или восьмиканальную.
Другие тесты
И даже не все синтетические бенчмарки работают одинаково. Тесты из пакета NAS Parallel (от NASA) по своей сути являются синтетическими, но они предназначены для выявления областей, где один процессор будет иметь преимущество перед другим. В тестах Embarrassingly Parallel картина результатов не содержит ничего неожиданного. Процессор нового поколения 7713 умеренно превзошел более мощного представителя предыдущего поколения 7742. А в тесте LU.C более высокие частоты 75F3 помогли ему опередить и 7713, и 7742.
Результаты тестов CoreMark и John the Ripper в целом соответствуют нашим ожиданиям, за исключением того факта, что в JTR процессор 7713 очень сильно опередил 7742. Все эти результаты очень наглядно показывают, что архитектура Zen 3 обеспечивает новым процессорам AMD явное преимущество в довольно широком диапазоне нагрузок.
Энергопотребление
Поскольку в ходе тестирования новейших EPYC’ов на платформе AMD Daytona не все датчики работали корректно, мы можем предложить вам результаты измерения энергопотребления только трех новых чипов EPYC. Мы применили здесь различные методики измерения, а наш нагрузочный тест представлял собой рендеринг сцены в Blender с большим числом итераций, чтобы любой процессор имел возможность поработать в режиме длительной интенсивной нагрузки.
32-ядерный и 64-ядерный компоненты потребляют примерно одинаковую мощность, что ожидаемо, поскольку в спецификациях AMD для обоих указаны одинаковые максимальные значения TDP. Интересно здесь то, что 64-ядерный 7713 потребляет намного меньшую мощность по сравнению с 7763 – эта разница намного больше, чем можно было бы предположить исходя из официальных спецификаций TDP этих процессоров. Действительно, 637 Вт для 256 потоков – это впечатляющий результат. Но не беспокойтесь: сервер все равно будет шуметь так, как положено серверу.
Заключение
Это говорилось уже многократно, но стоит еще раз отметить, что рынок процессоров действительно стал интереснее после выхода четыре года назад первых AMD EPYC. И, хотя эти компоненты уже были впечатляющими в своей области, AMD продолжила их последовательное совершенствование от поколения к поколению. Новые чипы Milan еще раз это подтверждают.
Как было и в предыдущем поколении EPYC, AMD включила в линейку Milan различные модели, отвечающие разнообразным потребностям дата-центров. Для эффективной работы с нагрузкой, привязанной к объему кэша или тактовой частоте, лучше всего подойдут компоненты серии F. Нам очень нравится факт наличия восьмиядерной опции с 256-мегабайтным кэшем, не говоря уже о рекордно высоких тактовых частотах.
Процессоры Milan не только обогатили семейство AMD EPYC новой архитектурой Zen 3 – тактовые частоты также были увеличены во всей линейке. Каждое частное усовершенствование повышает производительность в том или ином аспекте, не говоря уже об уменьшении задержек. Максимальное число ядер в этом поколении не было увеличено, но AMD в настоящее время лидирует в части плотности упаковки ядер, предлагая больше ядер в серверном решении 1P, чем у Intel в 2P, и, соответственно, больше ядер в 2P, чем у Intel в 4P.
Конечно, не всем нужна система с 256 вычислительными потоками, поэтому AMD в своей новой линейке предлагает большой набор опций по числу ядер. Отметим, что 12-ядерных моделей в линейке нет, а восьмиядерный процессор – только один. Зато нам впервые представили 56-ядерную модель, что само по себе интересно. Закрадывается мысль, что на создание процессора 7663 AMD вдохновило то обстоятельство, что по общему числу потоков он в точности эквивалентен топовому 2P-серверу Intel.
И мы просто не можем не отметить тот факт, что самый «бюджетный» процессор 3-го поколения EPYC стоит $913, тогда как чипы 2-го поколения (Rome) на выходе стоили от $450. Мы можем предположить, что позднее AMD добавит в эту новейшую линейку менее дорогие модели, но в настоящий момент они, по-видимому, сосредоточились на продвижении высокочастотных процессоров серии F, особенно если вам нужен вариант с числом ядер не более 16. Таким образом, если вы хотите процессор EPYC начального уровня, то вам нужно выбирать из линейки предыдущего поколения Rome.
Итак, чипы нового поколения EPYC стоят дороже своих предшественников – возможно, это связано с текущим уровнем цен, или же AMD просто знает, что может получить от своих новых процессоров больший доход. Последнее, впрочем, вряд ли, потому что Intel до сих пор назначает своим топовым чипам еще более высокую цену – несмотря на меньшее число ядер.
Желающие модернизировать свои платформы EPYC предыдущего поколения путем установки новейших чипов могут это сделать вкупе с обновлением прошивки. Однако имейте в виду, что если вы обновите прошивку под процессоры Milan, то можете потерять поддержку Rome – пока не восстановите предыдущую прошивку. Мы не слишком часто с этим сталкивались, но в любом случае вероятность такого развития событий стоит иметь в виду.
Процессоры серии EPYC 7003 становятся уже вторым (в серверном сегменте) предложением AMD, включающим поддержку PCIe 4.0, которую Intel не собирается вводить до выхода процессоров Xeon на базе Ice Lake, запланированных на конец текущего года. Благодаря 128 линиям PCIe 4.0, доступным на каждом новом процессоре EPYC, эти процессоры могут обеспечить очень впечатляющий прирост производительности за счет повышения пропускной способности интерфейса. В части памяти (в тесте Stream) мы получили 230 ГБ/с, а если подкрутить еще и программные настройки, можно достичь еще больших высот.
Что касается усиления защиты данных, то здесь изменений не так много, но и то, что сделано, тоже неплохо, особенно если учесть высокий уровень комплексной защиты данных, который AMD обеспечила еще в серии Rome. Из нововведений поколения Milan стоит отметить функцию Secure Nested Paging, которая обеспечивает защиту истории обращений к памяти от возможного несанкционированного отслеживания. Также в этом поколении возвращается технология AMD Secure Processor, которая позволяет сборщикам серверов устанавливать надежную аппаратную защиту root-of-trust, предохраняющую критические данные от возможного вредоносного воздействия со стороны прошивок или программ из непроверенных источников.
Процессор EPYC 7763 установлен на референсную платформу AMD Daytona
Итак, после всестороннего анализа потенциала процессоров 3-го поколения EPYC и их расширенного тестирования мы можем сказать, что они действительно хорошие. Здорово, что архитектура AMD Zen 3 наконец-то приходит в корпоративный сегмент, неся с собой более высокие тактовые частоты и производительность IPC. Самые быстрые серверные процессоры просто стали еще быстрее – вот основной аргумент в пользу Milan.
Точно не известно, когда Intel будет выпускать свои процессоры следующего поколения Xeon Scalable на базе Ice Lake, но можно предположить, что с новой архитектурой, большим числом ядер и поддержкой PCIe 4.0 эти новые чипы в конце года смогут составить конкуренцию процессорам 3-го поколения EPYC.
Источник: techgage.com