С появлением графических процессоров от AMD серии Radeon HD 6000 многие ожидали значительных архитектурных изменений в том, как AMD организует свои унифицированные шейдеры. Это, однако, не произошло с серией Radeon HD 6800, основанной на 40нм GPU Barts, которые по-прежнему поддерживают конфигурацию VLIW5 (SIMD блоки с 4 простыми и 1 сложным потоковыми процессорами). Данные с недавней презентации, появившиеся в интернете, показывают, что столь активно обсуждаемые архитектурные изменения отложены для Cayman, предстоящих GPU высокого класса, на которых будут основываться
видеокарты серии Radeon HD 6900.
В архитектуре VLIW4 равномощные единицы потоковой обработки, шейдера, расположены в группы по четыре штуки вместе с регистрами общего назначения. Хотя четыре шейдера имеют равные возможности, для двух из четырёх, занимающих 3 и 4 места, назначаются некоторые специальные функции. Кажется, AMD консервативно относится к преимуществам новой архитектуры SIMD. Производитель утверждает, что VLIW4 даёт аналогичные вычислительные мощности, как VLIW5, с сокращением площади кристалла на 10%. Кроме того, новая архитектура упрощает распределение задач внутри чипа.
Презентация также проливает свет на общую архитектуру Cayman, которая показывает более высокий уровень распараллеливания по сравнению с Cypress (Radeon серии HD 5800,
HD 5970). Хотя Barts был шагом вперёд от архитектуры Cypress в направлении назначения отдельных процессоров для каждого из двух блоков SIMD Engine, похоже на то, что с Cayman производитель делает следующий шаг, используя два движка графической обработки (graphics processing engine, GPE) и назначая каждому по блоку SIMD. Это фактически означает, что у Cayman будет два физических блока тесселяции. Barts, используя единый блок тесселяции, повышает свою эффективность для увеличения производительности тесселяции до 2x по сравнению с предыдущим поколением, по крайней мере, так утверждает AMD. Если у Cayman будет два таких блока, то это может означать увеличение производительности тесселяции в 3-4 раза по сравнению с предыдущим поколением.
Cayman также имеет переработанный движок рендеринга, состоящий из 128 Z/Stencil ROP и 32 пиксельных ROP, с ускорением 16-битных целочисленных операций до 2x и ускорением 32-разрядных операций с плавающей точкой в 2-4 раза.