Специалисты из Барселонского суперкомпьютерного центра (Barcelona Supercomputing Center, BSC) и университета штата Нью-Йорк (State University of New York, SUNY, кампусы Стони-Брук и Буффало) протестировали относительно новый суперчип NVIDIA CG100 "Grace", сравнив его с несколькими конкурирующими аналогами "в широком диапазоне бенчмарков для сегментов HPC (высокопроизводительных вычислений) и ИИ".
В своих маркетинговых материалах «команда зеленых» делает основной акцент на серии GH200 "Grace Hopper" – и тем интереснее тот факт, что технические университеты уделили внимание "первому настоящему" (на базе ARM) серверному процессору компании, а не неизменно популярным графическим ускорителям. Сайт Next Platform в своей статье резюмирует потенциал этого чипа следующим образом: "Процессор NVIDIA Grace отличается сравнительно высоким числом ядер и сравнительно низким тепловыделением; кроме того, он оснащен банками памяти DDR5 с низким энергопотреблением (LPDDR5) – которая обычно используется в ноутбуках, но здесь благодаря функции коррекции ошибок доведена до серверного класса – в объеме, достаточном для систем HPC, где сегодня обычно используется 256 или 512 ГБ на ноду, а иногда меньше."
Результаты бенчмарков были представлены на прошлой неделе на конференции HPC Asia 2024 (проходившей в Нагое, Япония). Также исследователи из BSC и SUNY загрузили эти данные в базу ACM Digital Library. Суперкомпьютер BSC MareNostrum 5 содержит экспериментальный кластер, состоящий из суперчипов NVIDIA Grace-Grace и Grace-Hopper. Мы много слышали о последнем, но новаторскую концепцию представляет первый – как пишут на Next Platform: "Объединяем два процессора Grace в один суперчип Grace-Grace, используем для внутренней коммуникации NVLink, обеспечивая, таким образом, когерентность банков памяти LPDDR5 при энергопотреблении всего около 500 Вт, и получаем весьма интересное решение для HPC, которое предлагает в общей сложности 144 ядра Arm Neoverse "Demeter" V2 на базе архитектуры Armv9 и 1 ТБ физической памяти с максимальной теоретической пропускной способностью 1.1 ТБ/с. По ряду причин, вероятно, связанных с особенностями использования памяти LPDDR5, фактически доступно 960 ГБ памяти с пропускной способностью 1 ТБ/с."
Более старый суперкомпьютер BSC MareNostrum 4 включал в себя "ноды на основе двух 24-ядерных процессоров Skylake-X Xeon SP-8160 Platinum с частотой 2.1 ГГц." И вот, система на базе решения от «команды синих» почти семилетней давности была модернизирована и трансформирована в MareNostrum 5 на аппаратных мощностях NVIDIA: худший результат предыдущей машины был улучшен на 67%, а лучший – в 4.49 раза. Северный филиал SUNY (Upstate New York Institute) для своей супермашины на базе суперчипов NVIDIA "Grace-Grace" (CPU-CPU) и "Grace-Hopper" (CPU-GPU) расширил группу конкурирующих решений, включив в нее процессоры Intel Sapphire Rapids и Ice Lake, AMD Milan, а также Amazon Graviton 3 and Fujitsu A64FX на базе ARM. На Tom's Hardware комментируют результаты SUNY: "Суперчип Grace легко превосходит Graviton 3, A64FX, 80-ядерную конфигурацию Ice Lake и даже 128-ядерную конфигурацию Milan во всех бенчмарках. Однако сервер Sapphire Rapids с двумя 48-ядерными Xeon Max 9468 прервал победную серию Grace."
Далее они пишут: "В режиме HBM система Grace превосходит Sapphire Rapids только в трех тестах из восьми, хотя в режиме DDR5 – в пяти тестах из восьми. Для Nvidia этот смешанный расклад можно считать неожиданным, принимая во внимание, что Grace имеет на 50% больше ядер и базируется на более продвинутом техпроцессе TSMC 4 нм, против более старого техпроцесса Intel 7 (бывший 10 нм). И это еще не всё: Sapphire Rapids также заметно превосходят чипы AMD EPYC Genoa в инстансе Azure MI300X, и это говорит о том, что, несмотря на свои недостатки, процессоры Sapphire Rapid обладают довольно высоким потенциалом для HPC... С другой стороны, NVIDIA, по всей вероятности, одерживает убедительную победу в части энергетической эффективности. Суперчип Grace имеет номинал TDP 500 Вт, тогда как Xeon Max 9468 – 350 Вт, то есть для двух чипов Xeon получается 700 Вт. Опубликованные результаты исследования не содержат детальной информации об энергопотреблении этих чипов, но если предположить, что каждый чип работает на уровне своего номинального TDP, то картина очевидно складывается в пользу NVIDIA."
На Next Platform полагают, что высокие результаты серверного процессора CG100 от «зеленых» на самом деле обусловлены поддержкой со стороны соседа: "Любой чип CPU в паре с GPU Hopper, скорей всего, работал бы с таким же успехом. Суперчип Grace-Grace, собранный только из CPU-компонентов, в Gromacs демонстрирует производительность почти на уровне пары процессоров Xeon Max 'Sapphire Rapids'. Стоит отметить, что память HBM на этом чипе в Gromacs работает не столь эффективно. В общем, с точки зрения использования CPU Grace в сценариях HPC тут есть над чем подумать."
Источник: www.techpowerup.com