В основном
процессоры занимаются целочисленными вычислениями, но для некоторых
приложений чрезвычайно важны вычисления с плавающей запятой. На этой неделе компания AMD рассказала о том, как она планирует сбалансировать два типа рабочей нагрузки в предстоящих процессорах Bulldozer, и почему она считает, что новые ядра будет более функциональны и более эффективны, чем какие-либо конкурирующие решения.
Новый подход, который использует AMD, был назван Flex FP. В то время как традиционно у каждого блока обработки целочисленных данных был свой собственный блок для 128-битных вычислений с плавающей точкой (floating-point unit, FPU), два ядра Bulldozer будут делить один FPU на 256-бит. Так как 256-битных команд нет, а есть только 32-битные и 64-битные, то разработчики смогут использовать новые инструкции AVX для обработки восьми 32-битных или четырёх 64-битных команд за такт.
Очевидно, производитель не ожидает увидеть очень широкое распространение AVX сразу после появления этого решения на рынке. Однако со временем разработчики программного обеспечения оценят преимущества гибкости Bulldozer. Как уже упоминалось, основная работа процессора заключается в обработке целых чисел, то есть один очень большой и прожорливый FPU будет много времени сидеть сложа руки. С другой стороны, несколько маленьких FPU создают узкое место при обработке большого числа операций с плавающей запятой.
Flex FP может динамически перераспределять свои ресурсы между двумя ядрами, в зависимости от текущей нагрузки. Это означает, что в один цикл одно ядро может выполнить 256-битную AVX операцию, а в следующий цикл оба ядра могут одновременно обработать 128-битные операции FMUL. Джон Фруе (John Fruehe), директор по маркетингу продуктов для серверов и рабочих станций в компании AMD, говорит, что такая система обеспечит лучшую производительность и бóльшую эффективность, а это означает, что будущие
процессоры AMD будут потреблять меньше энергии, чем конкурирующие решения.
Другим изменением в FPU процессора Bulldozer стал выделенный планировщик, не связанный с планировщиком для целочисленных операций. Это должно ещё сильнее увеличить эффективность использования ресурсов и уменьшить задержки.
Очевидно, что эти изменения обеспечат реальную выгоду для
серверов и рабочих станций. Однако если увеличение производительности столь значительно, как утверждает AMD, то будущие процессоры смогут обеспечить серьёзную конкуренцию для следующего поколения
процессоров Intel Xeon.
Появление процессоров на основе архитектуры Bulldozer, предназначенных для серверов, рабочих станций и высокопроизводительных настольных
компьютеров, ожидается во втором или в третьем квартале следующего года.