В прошлом году компания AMD расширила свою линейку серверных процессоров, выпустив 4-е поколение EPYC. Место топового процессора в этом поколении занимает 128-ядерный 256-поточный чип EPYC 9754, а прямо под ним в модельном перечне располагается чип AMD EPYC 9754S. Разницу между этими двумя процессорами определить просто – она сразу бросается в глаза: в чипе 9754S отключена технология «одновременной многопоточности» Simultaneous Multithreading (SMT). Это значит, что у процессора 9754S столько же ядер, сколько у 9754, а именно – 128, но без SMT и потоков тоже только 128, против 256 у процессора 9754. И этим обусловлена приятная разница в цене, для тех заказчиков, которые и так не пользуются SMT.
Модель | Число ядер | Число потоков | Номинал TDP, Вт | Базовая частота, ГГц | Boost-частота, ГГц | Кэш L3, МБ |
9754 | 128 | 256 | 360 | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360 | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320 | 2.2 | 3.0 | 256 |
Одно ядро процессора EPYC с поддержкой SMT может обрабатывать два потока одновременно, что потенциально означает более эффективное использование ресурсов CPU. Пока один поток находится в режиме ожидания загрузки данных из памяти или простаивает по какой-либо другой причине, второй поток может выполнять команды. Это значит, что ядро в целом меньше простаивает и потенциально обеспечивает более высокую производительность процессора. Особенно наглядно это работает в таких сценариях, как виртуализация и рендеринг.
Отключение SMT позволяет производителям продавать эти чипы как продукты начального уровня, в то же время гарантируя, что они отвечают определенным критериям производительности и стабильности. На попадание чипов в категорию процессоров без SMT влияют такие факторы, как биннинг, стратегии сегментирования рынка и желание создать продукт, отвечающий конкретным требованиям производительности или эффективности; таким образом, выявляются нюансы, которые учитывают производители при планировании производства и маркетинга готовой продукции.
Вместе с тем, не все нагрузки используют преимущества SMT, и во многих случаях в серверах AMD поддержку SMT отключают вручную в настройках BIOS. Хотя это мощная опция настройки, есть еще один важный момент. Чип 9754S с заводским «пожизненным» отключением SMT стоит существенно дешевле, чем 9754. И в любом случае однопоточные приложения, вычислительные нагрузки и вообще любые сценарии, чувствительные к задержкам CPU, более эффективно выполняются на процессорах без SMT.
Мы проведем два стандартных теста – y-cruncher и Cinebench 2024 – и посмотрим, насколько различается производительность процессора с SMT и без SMT. Мы сравним друг с другом процессоры 9754S и 9754, причем 9754 будем запускать как с SMT, так и без SMT, чтобы посмотреть, какие преимущества имеет 9754S, у которого SMT нет вообще.
Тестовая платформа
Начнем с Cinebench 2024, запустив оба процессора «как есть»: модель S – без SMT, модель без S – с SMT. Разница результатов в режиме одного ядра сопоставима со статистическим разбросом.
Cinebench 2024 CPU | 2x EPYC 9754S | 2x EPYC 9754 |
CPU Multi-Core | 2682 | 2587 |
CPU Single-Core | 68 | 69 |
MP Ratio | 39.19x | 37.64x |
Выбор y-cruncher обусловлен архитектурой этой программы, позиционируемой как общесистемный тест. Вычисляя число «пи» с точностью, какую только позволяет системная память, мы проверяем наше интуитивное предположение о том, что SMT может негативно влиять на скорость выполнения сценариев, в которых лимитирующими факторами выступают ресурсы памяти и производительность ядра CPU. Давайте посмотрим на результаты, прежде чем переходить к выводам.
Время вычисления «пи» (в секундах) в y-cruncher 0.8.3 с указанной точностью (кол-во знаков) | 2x EPYC 9754S | 2x EPYC 9754 (SMT Off) | 2x EPYC 9754 (SMT On) | Увеличение производительности 9754 после выключения SMT |
1 млрд | 13.481 | 13.546 | 14.139 | 4.65% |
2.5 млрд | 23.818 | 24.144 | 28.111 | 15.27% |
5 млрд | 40.760 | 40.797 | 49.271 | 17.27% |
10 млрд | 77.409 | 77.959 | 95.420 | 18.88% |
25 млрд | 203.303 | 202.124 | 233.629 | 12.98% |
50 млрд | 475.557 | 476.949 | 520.349 | 8.61% |
100 млрд | 1248.458 | 1251.36 | 1242.419 | -0.49% |
Время вычисления «пи» (в секундах) в y-cruncher 0.8.4 с указанной точностью (кол-во знаков) | 2x EPYC 9754S | 2x EPYC 9754 (SMT Off) | 2x EPYC 9754 (SMT On) | Увеличение производительности 9754 после выключения SMT |
1 млрд | 13.480 | 13.56 | 14.573 | 7.50% |
2.5 млрд | 23.680 | 23.501 | 28.649 | 17.34% |
5 млрд | 40.819 | 40.547 | 50.082 | 18.50% |
10 млрд | 78.523 | 77.466 | 93.842 | 16.32% |
25 млрд | 206.399 | 206.078 | 236.070 | 12.57% |
50 млрд | 483.797 | 482.79 | 521.867 | 7.29% |
100 млрд | 1269.484 | 1266.83 | 1253.446 | -1.28% |
В техническом сообществе ведутся глубокомысленные споры о специфических хитростях технологии AMD SMT и ее вкладе в системную производительность. По идее, SMT представляется очевидным выбором для тех, кто заинтересован в повышении производительности. Теоретически: если подключение SMT переводится в идеальную масштабируемость, почему бы не рассматривать процессоры с SMT как более предпочтительный выбор вообще?
Эффективность SMT и архитектура ядра соотносятся между собой не как черное и белое. Невнятная масштабируемость SMT не обязательно означает плохую реализацию этой технологии. Это может указывать и на то, что архитектура ядра сама по себе мощная и на фоне этой мощности влияние SMT не так заметно. Этот парадокс только подчеркивает давно известную истину: производители процессоров не могут заявить универсальное «безразмерное» преимущество для всех приложений, которое обеспечивалось бы SMT или аналогичной технологией. Они признают, что, хотя в определенных сценариях из SMT можно извлечь дополнительную производительность, это достигается ценой некоторых издержек в других сценариях.
Сквозь призму высокопроизводительных вычислений и суперкомпьютинга ограничения SMT видны более четко. Хотя идея удвоения числа потоков относительно числа ядер звучит заманчиво, в действительности это не эквивалентно удвоению количества ядер. В некоторых случаях это даже может приводить к спадам производительности, так как потоки конкурируют между собой за ресурсы кэша. Тем не менее, в большинстве многопоточных приложений, особенно в тех, где отсутствует конкуренция за кэш, технология SMT повышает производительность и просто блестяще проявляет себя в задачах, полностью задействующих ее потенциал.
Технология AMD SMT бывает крайне полезна в широком диапазоне корпоративных приложений. Но не все виды нагрузки нуждаются в преимуществах SMT. Как показывают результаты тестов, AMD вполне может выгодно использовать вариативность своего производства, предлагая солидный продукт с уникальными характеристиками производительности и цены. Разработчики платформ для специфических видов нагрузки, использующих чистую производительность ядра без SMT, могут сэкономить на процессорах, покупая чипы AMD EPYC 9754S, в которых технология SMT «пожизненно» отключена производителем.
Источник: www.storagereview.com