Стратегию Intel в отношении дата-центров наилучшим образом характеризует формула «трех китов», которая дает целостное представление обо всех задачах, с которыми сталкиваются заказчики в мире непрерывно растущих коммуникаций. Создаваемое программное и аппаратное обеспечение служит для решения задач перемещения, хранения и обработки данных наиболее эффективным способом из всех возможных. Это может звучать как реклама, но это действительно наиболее точно описывает ту позицию, которой в последнее время придерживается Intel. И все их последние разработки, ориентированные на специфику дата-центров, опираются как минимум на одного из этих «китов».
Это также объясняет, почему компания отошла от политики сосредоточения всех сил на линейке процессоров Xeon – хотя тут есть чем заняться впечатляющим чипам AMD EPYC – и уделяет много внимания системному подходу к аппаратному обеспечению и расширению своего портфолио. И в данный момент, в соответствии с этой концепцией, Intel выпускает ряд продуктов, оптимизированных под аналитику и ИИ-приложения, а также программное обеспечение 2020 года.
Intel ставит на то, что основным двигателем общего развития программного и аппаратного обеспечения дата-центров станет спрос на технологии для искусственного интеллекта (ИИ). Применение ИИ требует оптимизации чипов различного назначения – CPU, GPU, VPU, FPGA – и все они завязываются на общую структуру программного обеспечения, позволяющую упростить схему гетерогенных вычислений.
Очевидно, что основное внимание уделяется продукции, анонсируемой сегодня, и давайте начнем с процессоров 3-го поколения Xeon Scalable.
Сначала нужно определить положение этих Xeon’ов на карте выпуска, которая все время изменяется, поскольку Intel все время взвешивает свои архитектуры, соотнося их с производственными и конкурентными задачами. В настоящее время доступна широкая линейка 2-го поколения Xeon Scalable, в которой есть 56-ядерные процессоры (серия 9200), хотя более массовая серия 8200 ограничивается 28 ядрами. Эти процессоры обладают очень большой гибкостью, поскольку могут занимать от одного до восьми сокетов на одной платформе.
И несколько дней назад были анонсированы чипы 3-го поколения Xeon Scalable под кодовым наименованием Cooper Lake, сокращенное окно выпуска которых с ограниченным числом SKU красноречиво свидетельствует о той специфике, которая сопровождает выпуск Xeon’ов в 2020 г. Основополагающие спецификации остаются теми же, что и в текущей серии 8200, а именно: максимум 28 ядер/ 56 потоков на процессор и техпроцесс 14 нм. Однако, что самое важное, для Cooper Lake потребуется новая платформа под названием Cedar Island, поскольку эти чипы скорее будут использовать интерфейс сокета LGA4189 P+, чем текущего сокета LGA3467.
График выхода Cooper Lake подразумевает, что эта серия премиум-класса будет закрывать все потенциальные целевые ниши. Почему? Потому что, хотя официально для процессоров этой серии с большей вероятностью потребуются платы с поддержкой четырех или восьми сокетов, чем типовые одно-двухсокетные решения, занимающие большую часть рынка Xeon, это не значит, что никто не попытается собрать с Cooper Lake двухсокетную платформу. Обосновывая число сокетов от четырех и выше, Intel ссылается на следующее поколение Xeon под кодовым наименованием Ice Lake, с новой архитектурой на базе передового 10-нм техпроцесса, которое также должно выйти в этом году и заменить текущую серию Cascade Lake в одно-двухсокетных платформах LGA4189. Таким образом, 2020-й год для Xeon получается очень насыщенным и разнообразным.
Полный диапазон числа сокетов – от одного до восьми – будет восстановлен в серии Sapphire Rapids, запланированной на следующий год, и Intel уже объявила, что базовый кристалл готов, прозрачно намекая на более чем вероятный выход Sapphire Rapids в 2021 г. Предположительно, процессоры Sapphire Rapids будут использовать ядро Willow Cove на базе техпроцесса 10 нм++ и поддерживать память DDR5.
Вернемся к настоящему моменту. С первого взгляда на спецификации видно, что фундаментальные характеристики процессоров 3-го поколения Xeon Cooper Lake – те же, что и у текущих моделей: техпроцесс, число ядер, размеры кэша, интерфейсы, поддерживаемый объем и число каналов памяти, поддержка Optane и восьмипоточных вычислений – все это перешло и в новое поколение.
Вы можете спросить: а из-за чего тогда, собственно, столько шума? Отличительная особенность Cooper Lake – дополнительный акцент на ускорении вычислений с применением ИИ на основе технологии Deep Learning Boost. И, хотя в перечне основных спецификаций она не упоминается, новая технология Bfloat16 была представлена Intel отдельно как предмет особой гордости.
Bfloat16 предлагает значительное ускорение обработки потоков данных в задачах, не требующих высокой точности вычислений с плавающей точкой. Например, точность FP32 практически не требуется в таких задачах для ИИ, как обучение нейросети, и тем более в работе нейросети-вывода. Снижение количества операций позволяет оптимизировать вычисления и ускорить процессы обработки огромных объемов данных. Эту технологию Intel также собирается использовать в процессорах общего назначения, начиная с Cascade Lake.
В части точности Bfloat16 занимает промежуточное положение между точностью быстрых вычислений INT8, с которой главным образом работают выводы, и стандартной точностью FP32. Технически это подразумевает сохранение 8-разрядного экспоненциального формата FP32 со снижением разрядности мантиссы числа (точности) до 16 бит, которых для ИИ более чем достаточно. То есть, хотя процессоры Xeon Cooper Lake в обычных задачах (с точностью FP32) только слегка быстрее соответствующих моделей Cascade Lake (за счет более высоких тактовых частот), можно предложить, что в приложениях для ИИ они будут намного быстрее. Intel с удовольствием рассказывает об этой технологии, потому что у конкурирующих чипов AMD EPYC ничего подобного нет.
Выше приведен перечень из 11 SKU, входящих в данный выпуск. Мы видим здесь TDP 250 Вт у двух топовых процессоров, а также более высокие по сравнению с предшественниками (Cascade Lake) максимальные turbo-частоты и (у некоторых моделей) технологию второго поколения Speed Select для оптимальной настройки частоты каждого ядра. Кроме того, немного увеличилась частота памяти DDR4 (до 3200 МГц) при использовании одного модуля DIMM на канал.
В целом процессоры 3-го поколения Xeon Scalable, уже известные как Cooper Lake, ориентированы на сегмент high-end и крупных заказчиков, специфика работы которых предполагает получение преимуществ от ускоренных вычислений с применением ИИ. Цены не объявлены, возможно, потому, что эти чипы будут поставляться заказчикам вместе с серверными стойками от компаний Alibaba, Tencent и др.
При том, что Intel делает ставку на ускорение ИИ в новых Xeon’ах, в компании также отмечают, что некоторым заказчикам нужны чипы, справляющиеся со спецвычислениями быстрее, чем процессоры общего назначения, и в большей степени подходящие для программирования, чем узкоспециализированные аппаратные решения типа ASIC. Это как раз область применения FPGA и конкретно линейки Stratix 10, появившейся после приобретения Intel в 2015 г. компании Altera, специализирующейся на FPGA.
Анонсированная вместе с Xeon’ами оптимизированная под ИИ модель FPGA Stratix 10 NX предлагает в 15 раз большую вычислительную мощность INT8 по сравнению с текущей микросхемой DSP Stratix 10 MX. Как мы уже отметили, INT8 является ключевым фактором повышения производительности нейросетей-выводов, а значительное увеличение скорости этих вычислений достигается благодаря архитектуре Tensor Block, единственное назначение которой – обеспечивать как можно более плотное заполнение FPGA множителями низкого уровня; эффективная работа ИИ осуществляется через огромное количество матричных вычислений – это гигантский многофункциональный калькулятор. Память HBM приближает ИИ-модели к вычислительным движкам, а низкая задержка при перемещении данных обеспечивается сетевыми интерфейсами с высокой пропускной способностью.
Intel оптимистично оценивает перспективы модели Stratix 10 NX, которая выйдет также в этом году, но позднее, и пополнит собой сегмент высокопроизводительного «железа» для ИИ с широким спектром применения, в настоящее время занимаемый Nvidia V100. Время покажет, насколько эффективным окажется это решение в реальных приложениях.
В общем, Intel в этом году делает крупную ставку на ИИ, и в результате мы получаем процессоры Cooper Lake 3-го поколения Xeon Scalable со встроенными технологиями для ИИ, а также первые оптимизированные под ИИ чипы FPGA.
Источник: www.hexus.net