На международной конференции по суперкомпьютингу ISC High Performance 2024 компания Intel совместно с Аргоннской национальной лабораторией (Argonne National Laboratory) и корпорацией Hewlett Packard Enterprise (HPE) объявили, что суперкомпьютер Aurora преодолел экзафлопсный барьер вычислительной мощности, достигнув показателя 1.012 экзафлопс, и стал быстрейшей в мире вычислительной системой для ИИ, специализирующейся на применении ИИ в открытых научных исследованиях, с результатом 10.6 экзафлопс в ИИ-приложениях.
Intel также будет изучать критическую роль открытых экосистем в развитии отрасли высокопроизводительных вычислений (HPC) с применением ускоряемых моделей ИИ (AI). "Суперкомпьютер Aurora вышел на уровень экзавычислений, что позволит ему подготовить почву для будущих открытий. От понимания механизмов климата до раскрытия загадок вселенной – во всех этих областях суперкомпьютеры послужат компасом, указывающим нам правильный путь к решению действительно сложных научных проблем и, возможно, к усовершенствованию человечества," – сказал Оги Бркич (Ogi Brkic), вице-президент Intel и генеральный менеджер Data Center AI Solutions.
Изначально разработанный как система преимущественно для ИИ, суперкомпьютер Aurora позволит исследователям использовать потенциал генеративных моделей AI для ускорения научных открытий. Значительный прогресс уже достигнут в первых исследованиях Аргоннской лаборатории с применением ИИ-движков. В числе успешно решенных задач – картографирование 80 миллиардов нейронов человеческого мозга, уточненные физические расчеты частиц с высокими энергиями, сделанные с применением глубокого обучения, ускоренная разработка лекарственных препаратов на базе машинного обучения и др. Aurora представляет собой масштабную вычислительную систему, которая включает в себя 166 стоек, 10624 вычислительных лезвия, 21248 процессоров Intel Xeon Max и 63744 графических ускорителя Intel Data Center GPU Max, предлагая один из крупнейший в мире графических вычислительных кластеров.
Aurora также включает в себя самый большой открытый суперкомпьютерный интерконнект на базе Ethernet, объединяющий в систему 84992 сетевых адаптера HPE Slingshot. В высокопроизводительном бенчмарке LINPACK (HPL) суперкомпьютер Aurora уложился в секунду, но преодолел экзафлопсный барьер с результатом 1.012 экзафлопс, используя 9234 ноды, то есть только 87% своих вычислительных ресурсов. Aurora также отстояла третье место в высокопроизводительном бенчмарке HPCG, использующем численный метод сопряженных градиентов, с результатом 5612 терафлопс в секунду (TF/s), задействуя 39% машинных ресурсов. Этот бенчмарк оценивает эффективность сценариев нахождения решений в паттернах коммуникаций и доступа к памяти, которые являются важными факторами в реальных приложениях HPC. Он дополняет такие бенчмарки, как LINPACK, обеспечивая полную картину возможностей системы.
Ключевым компонентом суперкомпьютера Aurora является графический ускоритель Intel Data Center GPU Max. В основе серии ускорителей Max лежит графическая архитектура Intel Xe, включающая в себя специализированные аппаратные блоки поддержки матричных и векторных вычислений, оптимизированные под задачи AI и HPC. Именно благодаря архитектуре Intel Xe, обеспечивающей беспрецедентную скорость вычислений, суперкомпьютер Aurora удержал топовую позицию в высокопроизводительном бенчмарке LINPACK со смешанной точностью (HPL-MxP) – который наиболее наглядно показывает значимость AI-нагрузок в HPC.
Потенциал параллельного процессинга архитектуры Xe отлично раскрывается в обработке сложных матрично-векторных операций, являющихся неотъемлемой частью вычислений в нейросетевых моделях ИИ. Вычислительные ядра Xe играют ключевую роль в ускорении матричных операций, которое имеет критически важное значение для моделей глубокого обучения. В сочетании с набором программных инструментов Intel, куда входит компилятор Intel oneAPI DPC++/C++ Compiler, богатый ассортимент библиотек и оптимизированные фреймворки для ИИ, архитектура Xe способствует развитию открытой экосистемы для разработчиков, характеризующейся гибкостью и масштабируемостью в широком диапазоне устройств и форм-факторов.
В своем специальном докладе на ISC 2024, который состоится во вторник 14 мая в 18.45 по местному времени в Гамбургском конгресс-центре (Германия), генеральный директор Codeplay Эндрю Ричардс (Andrew Richards), компания Intel, расскажет о растущем спросе на программные и аппаратные средства ускорения вычислений в сегменте HPC и AI. Он подчеркнет важность платформы oneAPI, которая предлагает унифицированную программную модель для различных (разнородных) архитектур. Базируясь на открытых стандартах, oneAPI дает разработчикам возможность писать код, который будет работать на различных аппаратных платформах без значительных модификаций или необходимости использования проприетарных продуктов. Это также соответствует целям консорциума Linux Foundation и группы поддержки унифицированного ускорения Unified Acceleration (UXL) Foundation, куда вошли Arm, Google, Intel, Qualcomm и другие, заявленным как создание открытой экосистемы для всех типов ускорителей и унифицированного гетерогенного компьютинга на основе открытых стандартов, которая должна положить конец господству проприетарных решений. Группа UXL Foundation расширяется и пополняется новыми членами.
В то же время платформа Intel Tiber Developer Cloud наращивает свой вычислительный потенциал за счет передовых аппаратных решений и новых сервисов, позволяющих предприятиям и разработчикам оценить последнюю архитектуру Intel c точки зрения быстрой модернизации и оптимизации моделей ИИ и рабочих нагрузок и последующего развертывания моделей ИИ в нужном масштабе. Новые аппаратные предложения включают в себя презентации систем Intel Xeon 6 на базе ядер E или ядер P для определенных заказчиков и масштабные кластеры на базе ускорителей Intel Gaudi 2 и Intel Data Center GPU Max. К новым возможностям относится также сервис Intel Kubernetes для облачного обучения ИИ и запуска инференсов с поддержкой многопользовательских аккаунтов.
Новые суперкомпьютеры, развертываемые на базе процессоров Intel Xeon Max и графических ускорителей Intel Data Center GPU Max, подчеркивают стремление Intel к усовершенствованию сегментов HPC и AI. В числе этих суперкомпьютеров – такие системы, как Cassandra (Европейский средиземноморский центр исследований изменений климата, CMCC), предназначенная для ускорения моделирования климатических изменений; CRESCO 8 (Итальянское национальное агентство по новым технологиям, энергетике и устойчивому экономическому развитию, ENEA), предназначенная для инновационных разработок в области альтернативных источников энергии; суперкомпьютер Техасского вычислительного центра (Texas Advanced Computing Center, TACC), который занимается анализом данных в различных областях, от биологии до моделирования сверхзвуковых турбулентных потоков и поведения атомов в различных материалах; а также суперкомпьютер Британского управления атомной энергетики (UKAEA), предназначенный для решения проблем ограничений со стороны памяти, с которыми сопряжена разработка будущих электростанций на смешанных источниках энергии.
Результат ИИ-бенчмарка со смешанной точностью ляжет в основу следующего поколения графических ускорителей Intel для AI и HPC, под кодовым наименованием Falcon Shores. Ускорители Falcon Shores будут опираться на архитектуру следующего поколения Intel Xe и заимствуют лучшее от семейства Intel Gaudi. Такая интеграция позволит использовать унифицированный программный интерфейс.
Первые результаты систем Intel Xeon 6 с ядрами P и двухранговыми модулями памяти MCR (Multiplexer Combined Ranks) составили 8800 мегатрансферов в секунду (MT/s), что потенциально позволяет в 2.3 раза повысить производительность в реальных приложениях HPC, таких как океанологическая модель NEMO (Nucleus for European Modeling of the Ocean), по сравнению с предыдущим поколением Xeon. Это дает веские основания для выбора Xeon 6 в качестве хост-процессора для систем HPC.
Источник: www.techpowerup.com