Архитектура RV770Существует еще и пятый процессорный блок, обозначаемый t (transcendental - обрабатывающий трансцендентные операции). AMD группирует 4 потоковых процессорных блока (x,y,z и w) с t-блоком и получается потоковый процессор (Streaming Processor - SP): Потоковым процессором является закрашенная красным область. В отличие от потокового процессора NVIDIA, процессор AMD может обрабатывать до 5 инструкций одновременно. Затем AMD группирует 16 таких потоковых процессоров в ядро SIMD.
Ядро SIMD очень похоже на потоковый мультипроцессор NVIDIA со следующими исключениями.
Обратите внимание, что по рассмотренным до данного момента параметрам RV770 не отличается от RV670 (который используется в Radeon HD 3870). На следующем шаге AMD и NVIDIA расходятся: в NVIDIA GT200 по 3 потоковых мультипроцессора объединяются в кластер обработки текстур TPC (Texture Processing Cluster), а 10 TPC объединяются в чип; AMD просто объединяет 10 ядер SIMD.
Число вычислительных блоков у RV770 с 10 ядрами SIMD в 2.5 раза больше, чем у RV670. И даже теоретическая вычислительная мощность RV770 выше, чем у NVIDIA GT200. Рассмотрим, например, число одновременно выполняемых инструкций - 800 у RV770 и 240 (+ 60 SFU) у GT200 - разница значительная.
Уже сейчас мы можем сделать вывод, что архитектуры графических процессоров AMD и NVIDIA рассчитаны на разные типы нагрузки. Графический процессор NVIDIA лучше справляется со множеством простых потоков (по 1 потоку на потоковый процессор), процессор AMD - с насыщенными инструкциями потоками (т.к. может одновременно обрабатывать по 5 инструкций из потока).
Если отбросить перечисленные выше различия, архитектура AMD в целом похожа на архитектуру NVIDIA; они отличаются лишь несколькими опциями в дизайне. NVIDIA развила архитектуру G80/G92; AMD сделала то же самое для RV770 - взяла RV670 и увеличила его вычислительные ресурсы более чем в 2 раза. Образно говоря, шаг AMD от RV670 к RV770 больше, чем у NVIDIA от G80/G92 к GT200, но AMD из соображений конкуренции необходимо было сделать этот шаг. [N4-Соотношение Вычисления : Обработка текстур]В графическом процессоре GT200 NVIDIA увеличила вычислительную мощность примерно на 90%, а скорость обработки текстур - лишь на 25%, подчеркивая тенденцию увеличения вычислительной мощности графических процессоров. Каждый из 10 TPC имеет 8 адресов и 8 фильтров. Теперь посмотрим на RV770: 4 адреса и 4 фильтра; отношение кол-ва адресов к кол-ву фильтров то же, что и у NVIDIA - 1:1; отношение Вычисления : Обработка текстур у RV770 существенно выше.
Из таблицы видно, что NVIDIA при переходе от G92 к GT200 увеличила отношение Вычисления : Обработка текстур от 2:1 до 3:1. AMD переплюнула NVIDIA уже в RV670 с соотношением 4 : 1, и у нее не было необходимости улучшать результат. Это означает, что для игр с бОльшим количеством текстур лучше походит NVIDIA, а для игр, требующих большой вычислительной мощности графического процессора - RV770. AMD также внесла некоторые усовершенствования в модули обработки текстур. Способом, который AMD не разглашает, производительность на квадратный миллиметр была увеличена на 70%. Пропускная способность кэша текстур также была удвоена и составляет 480 Гб/сек, в то время как пропускная способность шины между каждым блоком кэша L1 и памятью L2 составляет 384 Гб/сек. [N12-Конфигурация тестовых стендов]
Crysis - игра, которая может оказаться "не по зубам" любой видеокарте. При настройках "high", а для шейдеров - "very high" даже для разрешения 1680x1050 всего 8 карт смогли обеспечить 30fps. В частности, с Crysis при указанных настройках не могут справиться карты серии HD3000, и только HD3870 X2 показала приемлемые результаты без обращения к Crossfire. Результаты 4870 выглядят обнадеживающе. Эта карта на 7% обскакала на $100 более дорогую GTX 260 и обеспечивает приемлемую скорость смены кадров. Прирост в цене в 50% по сравнению с 4850 дал прирост в производительности всего в 20%. Конечно, такой результат не стал неожиданностью, он вполне согласуется с данными о производительности обработки шейдеров этими двумя картами, а тест является шейдеро-зависимым; но удивительно то, что изменение пропускной способности видеопамяти не привело к существенной разнице результатов даже при самом "неиграбельном" разрешении 1900x1200. При разрешениях выше 1680x1050 HD4000 не может достичь 30fps; в этом случае придется либо понизить настройки, либо раскошелиться на одну из более дорогих видеокарт NVIDIA или решение Crossfire/SLI. В любом случае, с появлением серии HD4000 выбор видеокарты для Crysis теперь уже не ограничен только решениями от NVIDIA. [N14-Call of Duty 4]В Call of Duty 4 Radeon HD 4870 обгоняет на $100 более дорогую Geforce GTX 260. Интересно, что хотя в разрешении 1920 x 1200 Radeon HD 4870 почти на 11% быстрее GTX 260, обе карты показывают одинаковый результат в 2560 x 1600. И дело не в полосе пропускания памяти - у 4870 она достаточна; вероятно, причина в каком-то ограничении вычислительной мощности. 4870 наступает на пятки GeForce GTX 280, но до производительности GeForce 8800 GT в режиме SLI ему далеко из-за прекрасного масштабирования SLI в этой игре. Radeon HD 4850 превосходит не только GeForce 9800 GTX, но и 55-нанометровый GeForce 9800 GTX+. Quake Wars снова показывает превосходство 4870 над GTX 260; более того, 4870 в данном тесте приближается к GTX 280 при цене, составляющей половину от стоимости GTX 280. Radeon HD 4850 также существенно обгоняет линейку 9800. Скорость смены кадров у Assassin's Creed ограничена чуть выше отметки 60 fps, поэтому большинство карт в тесте приближаются к этой отметке, но не превосходят её существенно. Производительность Radeon HD 4870 достаточна, но из-за указанного ограничения мы не можем проверить, может ли и насколько GTX 280 обогнать 4870. При использующемся сейчас геймплее 4870 и GTX 280 выглядят равносильными. В завершение заметим, что 4870 и 3870 X2 показывают одинаковые результаты до разрешения 2560x1600, при котором 3870 X2 вырывается вперед. Результат неожиданный. Кажется, карты серии HD4000 обладают худшим масштабированием, чем платы NVIDIA или серия HD3000. Результаты графического процессора AMD RV770 в Bioshock превосходны; Radeon HD 4850 практически догоняет GTX 280, а 4870 приближается к GeForce 9800 GX2. 4870 догоняет GeForce GTX 260, HD 4850 выступает на уровне GeForce 9800 GTX. Неплохо, но совсем не похоже на результаты в Bioshock, что еще раз подтверждает, что производительность в играх существенно зависит от типа приложения. Производительность собственных решений NVIDIA multi-GPU превосходила производительность GeForce GTX 280 на момент ее выпуска, поэтому неудивительно, что НИКС - Компьютерный Супермаркет |