Один из посетителей форума Xtremesystems, известный как largon, глядя на схему GPU RV770, заметил интересную вещь. У этого чипа 180 базовых единиц, а не 160, то есть 900 универсальных процессоров вместо 800. На иллюстрации показана схема ядра RV770. По горизонтали расположены 10 SIMD-ядер этого GPU. В каждом из них расположено по 18 суперскалярных универсальных процессоров, расположенных попарно. То есть всего в RV770 есть 180 (10х18) суперскалярных процессоров, иначе называемых vec5-юнитами. Так как каждый vec5-юнит включает в себя пять различных скалярных единиц, то можно говорить, что одно ядро RV770 включает в себя 900 (180х5) универсальных процессоров.
Но в реальных
видеокартах, сделанных на основе ядра
RV770, работает только 800 универсальных процессоров, то есть в каждом SIMD используется по 16 суперскалярных процессоров вместо 18-ти. Возможно, производитель блокировал часть суперскалярных процессоров для того, чтобы повысить срок работы каждого отдельного чипа. Возможно, при выходе из строя одного-двух суперскалярных процессоров, в работу включается запасной суперскалярный процессор соответствующего SIMD, и GPU продолжает работать. Кроме того, это означает, что у AMD есть замечательная возможность разблокировать все суперскалярные процессоры и выпустить высокопроизводительный чип с 900 универсальными процессорами. Теоретически это может повысить производительность GPU на 10-15%, но практически прирост производительности будет меньше 10%, так как для эффективной работы над GPGPU-приложениями требуется сопряжение суперскалярных процессоров в блоки по 4 штуки.