12-е поколение процессоров Intel Core Alder Lake стало первым поколением процессоров Intel, где компания отказалась от традиционной спецификации мощности TDP (Thermal Design Power, расчетная тепловая мощность). Это не единственное нововведение, которое отличает эту серию, представившую нам также гибридную схему ядер, набор интерфейсов I/O нового поколения и т.д. В течение последних нескольких недель мы изучали различные аспекты производительности процессоров Alder Lake, и сегодня, наконец, публикуем обзор, раскрывающий производительность этих чипов в свете новой хитроумной иерархии лимитов мощности.
Раньше, в более спокойный период истории микропроцессоров, значение TDP было практически равно тепловыделению чипа, которое, в свою очередь, практически равняется его энергопотреблению. По мере усложнения процессоров – увеличения числа ядер, добавления в схему логических и графических блоков и т.д. – в результате которого современные чипы по сути стали представлять собой так называемые "системы на кристалле" (SoC), спецификация TDP фактически стала формальной характеристикой, которая во многих ситуациях не соответствует реальному энергопотреблению и тепловыделению процессора. Процессор с указанной на упаковке мощностью TDP "65 W" не обязательно будет все время оставаться на этом энергетическом уровне. Идея в том, что радиатор кулера обладает достаточной массой, чтобы успеть поглотить определенное количество тепла, прежде чем температура чипа существенно повысится. Таким образом, если кулер этого процессора будет получать тепловую нагрузку 200 Вт в течение только нескольких секунд, на общую температуру это практически не повлияет, то есть производительность кулера будет оставаться адекватной тепловыделению процессора.
Приведенный выше график иллюстрирует принцип работы такой системы "с добавочным тепловыделением" (на примере Intel Core i9-10900K). При высокой вычислительной нагрузке процессор переходит на уровень лимита мощности PL2, который намного выше номинального значения TDP: 250 Вт против 125 Вт. Через несколько секунд, так называемое время "тау", запас по тепловыделению процессора исчерпывается, и процессор переходит обратно на уровень PL1, то есть в стандартный режим энергопотребления, в котором он работает по умолчанию. Режим работы с тепловыделением, соответствующим значению PL1, может поддерживаться неограниченно долго.
Вместо TDP для процессоров 12-го поколения Alder Lake введены две новые спецификации: "базовая мощность процессора" (Processor Base Power, PBP) and "максимальная мощность Turbo" (Maximum Turbo Power, MTP). Сама компания Intel определяет эти термины следующим образом.
Processor Base Power, PBP – это среднее по времени значение рассеиваемой мощности, утвержденное для данного процессора и не подлежащее изменению (повышению) в спецификациях готовых систем, которое соответствует определяемому Intel уровню сложности рабочей нагрузки, выполняемой на базовой тактовой частоте (Base Frequency) и при температуре ядра, не превышающей значения, указанного в документации на процессор (Datasheet) для соответствующего сегмента и конфигурации SKU.
Maximum Turbo Power, MTP – это максимальное значение мощности, которую процессор может рассеивать в долговременном (длительностью более 1 секунды) режиме работы, контролируемое системой ограничителей тока и/или датчиков температуры. Мгновенная мощность, рассеиваемая в течение кратковременного интервала (не более 10 миллисекунд), может превышать значение MTP.
Примечание: значение MTP может устанавливаться системными интеграторами и зависеть от конкретной системы.
Поясняем. "Базовая мощность процессора" (PBP) – это довольно неопределенное "типовое" значение энергопотребления процессора, работающего с нагрузкой, которую Intel относит к стандартному уровню сложности по неизвестным нам критериям; очевидно, эта нагрузка должна быть как-то "заточена" под желаемое энергопотребление 125 Вт. Интересно, что процессоры i9-12900K, i7-12700K и i5-12600K все имеют в спецификациях одинаковое значение PBP 125 Вт, подразумевающее эту самую нагрузку, несмотря на совершенно разные характеристики производительности. "Максимальная мощность Turbo" (MTP) – это реальный лимит мощности, соответствующий максимальному энергопотреблению процессора с заводскими настройками в течение неограниченно долгого времени работы.
У процессора i9-12900K лимит MTP составляет 241 Вт. В отличие от процессоров предыдущих поколений, которые могли работать в режиме максимального энергопотребления, или лимита мощности PL2, в течение ограниченного времени "тау", процессоры Alder Lake сегодня могут работать на этом уровне мощности сколь угодно долго, если этого требует нагрузка и температура процессора при этом не превышает максимально допустимое значение 105°C. Это достигается без каких-либо принципиальных нововведений в схеме питания процессора: в Intel просто отрегулировали уровни PL1 и PL2, установив и там и там максимальное значение 241 Вт, что фактически означает для процессора возможность работы на уровне мощности 241 Вт в течение сколь угодно долгого времени, пока он не начнет перегреваться. Таким образом, "лимит" 125 Вт существует исключительно на бумаге – в технической документации и маркетинговых материалах.
Как и процессоры Intel предыдущих поколений, процессоры Alder Lake, включая SKU "не-K", допускают пользовательскую регулировку уровней PL1 и PL2 во всем диапазоне допустимых значений. В рамках данного обзора мы протестировали процессор Core i9-12900K на нескольких уровнях мощности (энергопотребления) в диапазоне от 50 до 241 Вт с промежуточными значениями 75, 100, 125, а также 190 Вт – последнее, по слухам, должно стать лимитом мощности в грядущем выпуске процессоров Alder Lake "не-K". Все указанные значения устанавливались для обоих лимитов мощности – и PL1, и PL2. Заводская конфигурация (PL1 = PL2 = 241 Вт) на диаграммах результатов выделена зеленым цветом. Кроме того, для сравнения мы протестировали процессор Core i9-12900K в «классической» конфигурации лимитов мощности: PL1 = 125 Вт, PL2 = 241 Вт (на диаграммах результатов выделена темно-красным). Также для сравнения мы приводим здесь результаты других процессоров. Intel со своей стороны настоятельно рекомендует оставлять заводские настройки мощности для получения "лучшей" производительности, однако во многих практических ситуациях, например, при питании компьютера от портативного источника где-нибудь в экспедиции или когда вы оставляете машину считать на ночь, требуется ограничить энергопотребление, чтобы не расходовать энергию на фоновые приложения и обновления Windows.
Компонент | Модель |
Процессор | Intel Core i9-12900K 8+8 ядер / 24 потока 3.9 ГГц – базовая частота, 5.2 ГГц – Boost |
Материнская плата | ASUS Z690 Maximus Hero / BIOS 0702 |
Память | 2 модуля 16 ГБ G.SKILL Trident Z5 RGB DDR5-6000 36-36-36-76 2T / Gear 2 |
Видеокарта | EVGA GeForce RTX 3080 FTW3 Ultra |
Накопитель | Neo Forza NFP065 1 TB M.2 NVMe SSD |
Воздушное охлаждение | Noctua NH-U14S |
Водяное охлаждение | Arctic Liquid Freezer II 360 мм |
Термопаста | Arctic MX-5 |
Блок питания | Seasonic SS-860XP |
Операционная система | Windows 10 Professional 64-bit / 21H1 Windows 11 Professional 64-bit / 10.0.22000.282 |
Драйвер видеокарты | NVIDIA GeForce 496.49 WHQL |
Super Pi – один из наиболее популярных бенчмарков у оверклокеров и доводчиков. Он уже очень давно используется в соревнованиях на мировые рекорды. Это в чистом виде однопоточный тест для CPU, который вычисляет число «пи» с высокой точностью – в нашем случае до 32 млн значащих цифр. Выпущенный в 1995 г., этот тест в вычислениях с плавающей точкой поддерживает только инструкции x86 и поэтому хорошо подходит для выявления потенциальной производительности процессора в однопоточных приложениях.
В отличие от Super Pi , где вычисляется число «пи», программа wPrime решает другую математическую задачу: нахождение простых чисел. Для этого в wPrime применяется метод Ньютона. А основная цель теста wPrime – решить эту задачу так, чтобы задействовать оптимальным образом все доступные ядра и потоки процессора.
Cinebench – еще один бенчмарк для современных процессоров, являющийся суперпопулярным, поскольку создан на основе рендерера программного приложения Maxon Cinema 4D. И AMD, и Intel часто демонстрируют результаты этого теста на различных официальных мероприятиях, так что он уже практически стал стандартом в этой отрасли. Для данного обзора мы протестировали однопоточную и многопоточную производительность процессоров в версии Cinebench R23.
Blender – одна из немногочисленных программ для рендеринга профессионального уровня, которая является бесплатной и доступна в открытых источниках. Уже один только этот факт цементирует сообщество поклонников этой программы и делает ее популярным бенчмарком, которым к тому же легко пользоваться. Для сегодняшнего обзора мы взяли версию Blender v2.92 и тестовую сцену "BMW 2.7".
Corona Renderer – это современный, дающий фотографическую реалистичность изображения рендерер, который доступен в пакетах Autodesk 3ds Max и Cinema 4D. Он обеспечивает физически правдоподобные и ожидаемые результаты благодаря применению алгоритмов для создания реалистичных эффектов глобального освещения и воспроизведения качества материалов. Corona не поддерживает рендеринг силами GPU, поэтому для пользователей этой программы производительность CPU имеет архиважное значение. Устаревший бенчмарк Corona Benchmark, который не поддерживает новые архитектуры, мы здесь не использовали, взяв вместо него последнюю версию Corona Renderer 6.1.
Автономная программа для рендеринга KeyShot быстро и эффективно обрабатывает потоки данных, благодаря чему вы получаете реалистичные сцены с высоким качеством изображения при максимально коротком времени отрисовки кадра. Рейтрейсинг в реальном времени, фотонное проецирование (photon mapping), адаптивный сэмплинг и динамическое освещение обеспечивают картинку высокого качества, которая мгновенно обновляется даже в интерактивном режиме работы над сценой. Версия KeyShot 10 поддерживает и рендеринг силами CPU, и рендеринг силами GPU. Мы здесь использовали CPU-рендерер, так как возможности GPU-рендерера в этом приложении все-таки ограничены.
V-Ray – популярная во всем мире программа для трехмерного рендеринга, в которой применяется глобальное освещение, трассировка траекторий, фотонное проецирование и карты распространения лучей, благодаря чему на выходе получается суперреалистичная объемная картинка. Она используется при создании движущегося изображения в компьютерных играх и на телевидении. V-Ray поддерживает все основные 3D-приложения – это отличный инструмент для любого вида деятельности, в котором рендеринг поставлен на поток. Мы здесь использовали встроенный бенчмарк V-Ray 5 в режиме "только CPU"; результат теста показывает количество элементов ("v-сэмплов"), которое может быть обработано на конкретном «железе» (чем больше – тем лучше).
Unreal Engine 4 – один из ведущих мультиплатформенных движков в игровой отрасли. Помимо общей продвинутости, он также предлагает множество опций, позволяющих получить результат быстрее, чем при использовании аналогичных конкурирующих продуктов: время – деньги. Прежде чем выпустить игру, необходимо проделать длительную работу по созданию готовых карт освещения (light baking). Они включают в себя всю геометрию статических объектов и расположение фиксированных источников света с предварительно вычисленными текстурами – это позволяет высвободить громадный ресурс производительности, поскольку уже не нужно будет производить все эти вычисления в режиме реального времени на машине пользователя. Конкретно в этих тестах мы делали карты освещения для сравнительно простой сцены, но обычно этот процесс занимает несколько часов.
Microsoft Visual C++ – вероятно, самый популярный язык программирования для создания профессиональных Windows-приложений. Он входит в пакет для разработчиков ПО Microsoft Visual Studio, который имеет солидную историю и получил широкое распространение как золотой стандарт интегрированной среды разработки (IDE). Компиляция программы – это достаточно долгий процесс, превращающий исходный программный код в исполняемый, и программисты обычно терпеть не могут ждать, пока этот процесс завершится. Мы пропустили через компилятор и линковщик C++ (версия Visual Studio 2019 16.9) приложение среднего размера, а также выполнили компиляцию ресурсов. Сборка приложения производилась в режиме "release" со всеми включенными оптимизациями и активной опцией мультипроцессорной компиляции.
Google Octane определяет производительность при работе с веб-браузером в ряде тестов на основе Javascript, которые отражают типовые пользовательские сценарии в современных динамичных интерактивных веб-приложениях.
Mozilla Kraken похож на Octane тем, что он также измеряет время выполнения Java-скриптов, но он использует другой набор тестов – на базе бенчмарка SunSpider. Тестовые сценарии включают аудиопроцессинг, алгоритмизированный поиск, фильтрацию изображений, синтаксический анализ JSON и криптографию.
WebXPRT 3 – это браузер-бенчмарк, определяющий производительность в типовых веб-приложениях, включая такие задачи, как обработка фотографий, управление медиаконтентом с использованием ИИ, представление опций прайс-листов интернет-магазинов, шифрование, оптическое распознавание (OCR), создание опросов и рейтингов и вывод результатов. Этим он отличается от двух предыдущих бенчмарков, которые в большей степени фокусируются на локальных сценариях и определяют производительность при выполнении конкретных алгоритмов.
Искусственный интеллект (ИИ) и машинное обучение позволяют нам создавать приложения с почти волшебными возможностями. Наш первый бенчмарк здесь – ИИ-приложение Topaz Gigapixel, с помощью которого можно повышать разрешение фотографий с одновременным улучшением проработки мелких деталей.
Научить ИИ точно распознавать содержание изображений – одна из важнейших задач машинного обучения. Приложение пользовательского уровня Nero AI Photo Tagger предлагает сравнительно простой вариант реализации этих алгоритмов. Мы дали этой программе следующее задание: классифицировать 2500 фотографий по тэгам "автомобиль", "собака", "цветок" и т.п.
Чтобы ИИ со способностью к глубокому обучению мог решать достаточно сложные задачи, он должен быть сначала обучен на большом массиве обучающих данных, которые многократно оцениваются; в результате получается нейросеть с устойчивыми связями (также называемая выводом), способная в дальнейшем выполнять соответствующую работу. Наиболее популярный программный пакет для машинного обучения – Google Tensorflow на основе Python – поддерживает как CPU, так и GPU. Настройка Tensorflow на работу с графическим процессором представляет некоторую сложность, поэтому большинство алгоритмов с обучением на небольших массивах данных разрабатывается для CPU. Кроме того, обучение на CPU происходит быстрее в тех ситуациях, когда задача требует больших, чем у типовых GPU, ресурсов памяти.
COMSOL – это золотой стандарт в области точного моделирования физических явлений и один из главных конкурентов Ansys. Эта программа особенно эффективна в тех случаях, когда моделируются сложные явления, включающие в себя компоненты различной физической природы – вы можете моделировать что угодно, включая черные дыры. Модульный подход к решению задач в COMSOL позволяет специалистам запускать программу как для одного модуля, так и сразу для нескольких взаимодействующих между собой модулей, относящихся к взаимосвязанным задачам, с возможностью двусторонней коммуникации с внешними программами – например, CAD-приложениями.
Программа NAMD разработана в Иллинойском университете и позволяет ученым моделировать динамическое взаимодействие между молекулами и атомами. Это признанное специалистами программное средство моделирования молекулярной динамики в любых масштабах – от поведения отдельных групп молекул до взаимодействия фракций в разнофазных средах. От аналогичных программ NAMD отличает режим параллельного моделирования, позволяющий эффективно решать задачи в больших системах на основе модели параллельного программирования Charm++.
Пакет Microsoft Office в представлении не нуждается – это, возможно, наиболее широко используемый во всем мире программный продукт для ПК, установленный на каждом офисном компьютере независимо от специализации. Наши тесты здесь охватывают широкий диапазон задач по созданию и редактированию различных документов в Word, PowerPoint и Excel.
Программа Adobe Photoshop тоже стала своего рода стандартом в сфере обработки фотографий и других изображений. Мы использовали здесь последнюю версию Photoshop CC, в которой запускали такие типовые задачи, как изменение размера изображения, применение различных опций размытия, эффектов освещения, настроек резкости и цветности, а также экспорт изображений. Кроме того, мы применяли и более сложные опции, такие как «умная» заливка (с распознаванием области), коррекция объектива, «умная» резкость, выделение объекта и изменение ракурса (tilt shift).
Adobe Premiere Pro CC – основная рабочая программа, используемая в видеоиндустрии для создания высококачественного контента для кино, ТВ и веб-ресурсов. Она работает практически со всеми форматами записи видеофайлов и поддерживает редактирование на разрешении Full HD, 4K и 8K, а также редактирование контента для виртуальной реальности. К сожалению, большинство задач в Premiere Pro являются однопоточными, а кодирование медиаконтента в значительной степени осуществляется силами GPU; поэтому тестирование CPU в режиме "export" большого интереса не представляет. Для тестирования мы использовали программную функцию "object tracking", которая автоматически отслеживает на протяжении всего видеофайла конкретного человека или объект, – эта задача задействует более одного ядра CPU, но полностью не масштабируется. Этот процесс включает в себя многократные обращения к памяти, в нашем тесте в общей сложности использовалось свыше 10 ГБ RAM.
Создание 3D-моделей – это сложная и трудоемкая задача, которая требует больших затрат времени и высокой квалификации художника. Поэтому в 3D-моделировании уже давно ищут способ реконструкции 3D-объектов непосредственно из серии фотографий. Именно это и делает фотограмметрия. Фотограмметрический метод также используется при реконструкции рельефа местности по данным фотографий, полученных путем аэрофотосъемки.
Оптическое распознавание текста (Optical Character Recognition, OCR) – это способ перевода текста из формата картинки (скана или фотографии) в актуальный текстовый формат, например, для последующего редактирования. Хотя большинство программ для OCR являются однопоточными приложениями, движок Google Tesseract может работать сразу с несколькими страницами отсканированного документа, распределяя нагрузку между несколькими ядрами процессора. Эта программа, которую можно рассматривать в качестве одного из самых точных программных средств для OCR, доступных в открытых источниках, автоматически запускает проверку правописания в первичных результатах распознавания, что дополнительно усложняет вычислительную нагрузку.
Виртуальная машина (ВМ) – это функциональная модель компьютера, создаваемая на компьютере-хосте и работающая независимо от него как полностью автономная система. Это не только повышает безопасность, но также позволяет использовать ПО, написанное для разных операционных систем, физически на одной машине. Виртуализация является основой «облачных» технологий и помогает снизить стоимость совокупного владения системой за счет динамического распределения виртуальных машин по нескольким компьютерам с целью оптимального использования аппаратных ресурсов. Для тестирования производительности ВМ мы использовали пакет VMWare Workstation, поддерживающий виртуализацию как в системах на процессорах Intel, так и в системах на процессорах AMD. Любопытно, что многие материнские платы отгружаются с отключенной по умолчанию настройкой виртуализации, которую мы включили самостоятельно.
Сегодня данных собирается и обрабатывается больше, чем когда-либо ранее в истории человечества. Опорой этому служат системы баз данных, которые используются для управления хранением и доступом к большим массивам данных. Всякий раз, когда вы вводите интерактивный запрос на веб-сайте или другом цифровом сервисе, почти гарантированно можно утверждать, что результат вам выдается при помощи как минимум одной базы данных. Здесь в качестве бенчмарка мы взяли тест TPC-C с наиболее популярной системой баз данных MySQL, в котором моделируется большое количество магазинов со складами и постоянно обновляющимся ассортиментом товаров. Результат показывает число транзакций в секунду, которых чем больше, тем лучше.
Язык программирования Java создавался как язык, обеспечивающий следующие основные свойства разрабатываемых приложений: независимость от платформы; высокая масштабируемость; устойчивость к ошибкам пользователей. Этим объясняется его высокая популярность среди корпоративных сервисов, которые имеют дело с большими объемами данных и большим количеством одновременных пользовательских запросов. Наш набор тестов включает в себя множество различных Java-бенчмарков, некоторые из которых являются однопоточными, некоторые – частично масштабируемыми, и некоторые – полностью масштабируемыми, то есть вычислительная нагрузка в них распределяется на все доступные ядра процессора.
Данные практически всегда передаются в предварительно сжатом виде, поскольку это позволяет уменьшить размер и время загрузки пересылаемых файлов. Архиватор WinRAR использует более продвинутый алгоритм сжатия по сравнению с классическим ZIP, поэтому для тестирования мы выбрали его. Он также может распределять нагрузку на все ядра процессора.
Еще один популярный архиватор – 7-Zip, который содержит встроенный бенчмарк, определяющий кол-во инструкций (MIPS), использующих алгоритм ZIP. Он особенно эффективен в многопоточном режиме, если таковой доступен.
Шифрование данных – это основа безопасности интернет-коммуникаций. Стандарт AES использует один из наиболее популярных на сегодняшний день алгоритмов шифрования, что обусловлено его простотой и устойчивостью к атакам. В отличие от многих других методов шифрования, AES является симметричным, то есть в нем для шифровки и дешифровки данных используется один и тот же ключ. Возможность быстрой шифровки и дешифровки информации важна, поэтому современные процессоры содержат расширение набора инструкций под названием "AES-NI", которое ускоряет эти операции.
Технически "SHA" представляет собой не шифрование, а хэширование. В основе криптографической функции хэширования лежит математический алгоритм, создающий для существующих данных аналог отпечатков пальцев. Это односторонняя процедура, которую практически невозможно обратить. Еще одно обязательное требование к хорошему алгоритму хэширования заключается в том, что он должен исключать возможность возникновения следующей коллизии – создания сообщения, которое открывало бы специфический идентификационный хэш-код. Алгоритм SHA3 удовлетворяет всем этим требованиям и часто используется для установления подлинности передаваемых данных, которые могли быть предварительно зашифрованы с помощью AES.
В настоящее время весь потребляемый видеоконтент – транслируемый на ТВ, в Интернете, «живьем» или в записи» – сжимается при помощи различных кодеков. AV1 – это видеокодек нового поколения, который к тому же является открытым и абсолютно бесплатным, в отличие от ряда других аналогичных алгоритмов, появившихся в последнее время. Ведущие игроки целевой индустрии, такие как YouTube, Netflix и Facebook, с некоторым отставанием, но все-таки вводят поддержку этого нового формата. По сравнению с более ранними алгоритмами, например, H.264, AV1 предлагает намного лучшую скорость сжатия или – лучшее качество изображение при том же битрейте. В качестве тестовой задачи мы взяли перекодирование видеофайла с разрешением 4K в AV1 с помощью SVT-AV1.
Еще один сравнительно новый кодек – H.265, также известный как HEVC. Используя последнюю версию кодировщика X265, мы сжали 4K-видеофайл со следующими настройками сжатия: 8-битная глубина цвета, режим "slow" и качество изображения crf20.
Кодек H.264, или AVC, представляет относительно старый формат сжатия, хотя, скорей всего, и наиболее широко используемый, поскольку он поддерживается в том числе и относительно старым «железом». Здесь мы сжимали тот же самый файл, что и в тесте с H.265, используя программный кодировщик X264 с настройками "slower" и crf20.
Формат MP3, появившийся в 90-е годы прошлого века, произвел в музыкальной индустрии настоящую революцию. Он позволил значительно уменьшить размер аудиофайлов без заметного влияния на качество звука, что, в свою очередь, позволило массово загружать и транслировать музыкальный контент через Интернет. В ходе тестирования процессоров мы конвертировали в MP3-файл с переменным битрейтом 2.5-часовую стереозапись в диапазоне 44.1 кГц. Конвертация MP3 представляет собой однопоточный процесс.
Начнем с самого «контрастного» сценария: сравним заводскую конфигурацию процессора с фактическим лимитом мощности 241 Вт и конфигурацию, перенастроенную на лимит мощности 50 Вт – существенное ограничение для процессора данного класса, которое вряд ли будет использоваться на практике, но, тем не менее, представляет интерес с точки зрения исследования влияния ограничения потребляемой процессором мощности на время отрисовки кадра.
Теперь рассмотрим более реалистичный вариант: 241 Вт против 125 Вт, где большее значение соответствует спецификации MTP ("максимальная мощность Turbo"), а меньшее – спецификации PBP ("базовая мощность процессора"). Разница в результатах здесь очень незначительная, можно сказать – практически незаметная, если говорить о визуальном восприятии игровой картинки.
В этом разделе мы измерили общее количество энергии, потребленное системой за один прогон теста Cinebench (многопоточного). Идея здесь в том, что более быстрый процессор выполнит поставленную задачу быстрее и общее количество использованной энергии у него может оказаться меньше, чем у менее мощного процессора с меньшим номинальным энергопотреблением, который будет работать над этой же задачей дольше.
Это, возможно, наш последний специализированный обзор процессоров Alder Lake. Он посвящен исследованию производительности топового процессора этой линейки при установке различных значений лимитов мощности. Процессоры 12-го поколения Intel Alder Lake изготавливаются на базе 10-нм техпроцесса Intel, который недавно получил название "Intel 7". Переход на новый техпроцесс позволил значительно повысить эффективность поколения Alder Lake по сравнению с предшествующими процессорами, базировавшимися на техпроцессе 14 нм. Тем не менее, как показали наши первые исследования, процессоры AMD все-таки более эффективны, отчасти благодаря 7-нм техпроцессу TSMC, но также и потому, что процессорам 12-го поколения серии K (с разблокированным множителем частоты) в Intel накрутили очень высокие лимиты мощности. Эти процессоры с лимитом мощности 241 Вт потребляют много энергии, что не только отрицательно сказывается на их общей энергетической эффективности, но также повышает требования к системе охлаждения, поскольку физически почти вся эта энергия преобразуется в тепло.
После публикации первых обзоров мы получили многочисленные просьбы протестировать эти процессоры с различными настройками мощности, чтобы выяснить, действительно ли процессоры Alder Lake настолько «прожорливы», и каковы перспективы энергетической эффективности процессоров "не-K", у которых будут менее высокие лимиты мощности. Провести такое исследование не составляет труда, поскольку Intel предоставляет возможность полной регулировки лимитов мощности PL1 и PL2 для полного контроля над величиной потребляемой процессором мощности. Важно отметить, что возможность такой регулировки есть и у процессоров с заблокированным множителем частоты ("не-K"). Как показал наш прошлогодний обзор процессора Core i9-10900 (не-K), это позволяет получить довольно приличную прибавку к производительности.
Мы протестировали заводскую конфигурацию с лимитами мощности PL1 = PL2 = 241 Вт, а также «классическую» конфигурацию с PL1 = 125 Вт и PL2 = 241 Вт, соответствующую заводским настройкам предыдущих моделей процессоров серии K. Также мы посмотрели, что будет, если оставить лимиты мощности на уровне стандартного TDP: PL1 = PL2 = 125 Вт. И, наконец, мы понизили уровень потребляемой мощности до 50 Вт и далее повышали его с шагом 25 Вт, чтобы посмотреть, как это повлияет на производительность и энергетическую эффективность процессора. Конечно, крайне маловероятно, чтобы такой процессор работал на 50 ваттах, но эти результаты дают некоторое представление о том, чего можно ожидать от мобильных процессоров этого поколения.
Если мы посмотрим на производительность в приложениях, становится понятно, почему в Intel перешли на новую систему лимитов мощности. Если бы они взяли за основу классическую конфигурацию с PL1 = 125 Вт и PL2 = 241 Вт, результаты процессора Core i9-12900K во всех обзорах были бы существенно ниже. В обзорах, как правило, рассматриваются виды нагрузки, загружающие процессор на 100%, например, рендеринг. В этих ситуация разница между двумя конфигурациями – новой и классической – довольно велика. Кроме того, в большинстве обзоров в качестве такой тестовой нагрузки используют Cinebench, который в своей последней версии включает в себя 10-минутную «разминку», что сводит на нет преимущества классической концепции PL1 и PL2 при работе с «основной» нагрузкой. Хотя этот сценарий, возможно, соответствует сложным задачам из репертуара рабочих станций, складывается впечатление, что он совершенно не учитывает реалии современных пользовательских приложений. Некоторые даже могут сказать, что в Intel перешли на схему PL1 = PL2 = 241 Вт исключительно для того, чтобы победить процессоры AMD Ryzen Zen 3 в Cinebench. Если мы посмотрим на результаты, полученные в других приложениях, то не увидим там столь заметного преимущества высоких настроек лимитов мощности. Классическая конфигурация 125/241 дает очень приличные результаты, и даже 125/125 работает вполне хорошо, разница здесь небольшая. Но, как только мы устанавливаем лимиты мощности ниже 100 Вт, это заметно сказывается на производительности. На уровне 75 Вт процессор теряет 35%, а на уровне 50 Вт – половину той скорости, которую мы получаем на уровне 241 Вт. С другой стороны, энергопотребление 75 Вт – это только треть от 241 Вт, но при этом мы все-таки получаем две трети от исходной производительности. Здесь суть в том, что некоторые приложения в нашей тестовой подборке представляют собой однопоточную (или малопоточную) нагрузку, а при загрузке только одного ядра процессора лимиты мощности вообще не имеют значения.
И наиболее наглядно это проявляется в играх. Здесь мы практически не видим разницы между уровнями мощности 241 и 125 Вт, в независимости от разрешения рендеринга. Потому что игры представляют собой сравнительно легкую нагрузку в плане задействования вычислительных ресурсов CPU; большинство из них не может одновременно использовать столько потоков, сколько предлагает процессор. На что здесь стоит обратить внимание, так это на то, что даже при ограничении энергопотребления до 100 Вт процессор Core i9-12900K все-таки оказывается быстрее представителей линейки AMD Zen 3. Если бы в Intel ставили своей целью дать нам "лучшие в мире игровые процессоры", то они настроили бы i9-12900K на 125, а не на 241 Вт.
Мы также рассмотрели эти настраиваемые лимиты мощности с точки зрения расхода энергии и энергетической эффективности и можем сказать, что путем снижения настроек лимитов мощности можно ОЧЕНЬ СУЩЕСТВЕННО повысить «КПД» этих процессоров. Заводская конфигурация 241/241 по энергетической эффективности проигрывает всем представителям Zen 3, переход на уровень 190/190 уже позволяет опередить Ryzen 7 5800X и Ryzen 5 5600X. Наиболее экономичной опцией оказывается конфигурация 75/75, позволяющая процессору Core i9-12900K занять второе место по энергетической эффективности, после Ryzen 9 5950X. Конечно, такое снижение лимитов мощности заметно снизит и производительность – вы получите меньший расход электричества взамен на большее время выполнения задач. Мы сказали бы, что оптимальный лимит мощности – это 125 Вт, но это зависит еще и от приложения.
Итоги этого обзора выглядят весьма обнадеживающими для грядущей серии процессоров Alder Lake "не-K", которые должны выйти в первом квартале 2022 года. Очень вероятно, что эти процессоры по эффективности будут заметно превосходить K-модели, поскольку – благодаря менее высоким настройкам лимитов мощности – будут работать в области максимального КПД кристалла. Эти новые модели, как ожидается, будут работать с меньшими тактовыми частотами, что должно дополнительно способствовать более высокой эффективности. И последний, но немаловажный фактор – цены на эти модели сделают их намного привлекательнее для большинства пользователей, особенно в сочетании с бюджетными чипсетами, которые тоже выйдут в начале следующего года.
Источник: www.techpowerup.com