Каталог
ZV
ездный б-р, 19
+7 (495) 974-3333 +7 (495) 974-3333 Выбрать город: Москва
Подождите...
Получить токен
Соединиться
X
Сюда
Туда
x
Не выбрано товаров для сравнения
x
Корзина пуста
Итого: 
Оформить заказ
Сохранить заказ
Открыть корзину
Калькуляция
Очистить корзину
x
Главная
Магазины
Каталог
Мои заказы
Корзина
Магазины Доставка по РФ
Город
Область
Ваш город - ?
От выбранного города зависят цены, наличие товара и
способы доставки

Среда, 2 июля 2008 00:00

Radeon HD 4850 и 4870: AMD выигрывает в двух ценовых категориях.

короткая ссылка на новость:

Стратегия AMD создания "маленьких" видеопроцессоров



Новой стратегией AMD является создание ориентированных на массового потребителя GPU и применение CrossFire (нескольких GPU) для энтузиастов. NVIDIA, с другой стороны, как и 10 лет назад, продолжает выпускать большие по площади GPU и масштабировать их в сторону уменьшения для соответствующих приложений. Оба подхода необходимы и находят понимание, просто они нацелены на разные рынки. Подход AMD радикально не отличается от подхода NVIDIA, просто при проектировании AMD ориентируется на 1 ценовой сегмент ниже, чем NVIDIA.

В случае с GT200 NVIDIA создала чрезвычайно большой параллельный микропроцессор. Судите сами: 1,4 млрд. транзисторов и размер пластины 576 мм2.

Из таблицы на предыдущей странице видно, что AMD RV770, хотя и предназначен для массового применения, также очень велик. RV770 имеет 956 млн. транзисторов, что на 44% больше, чем у RV670 и составляет 68% от числа транзисторов у NVIDIA GT200.

Сравнительные размеры GTX 280, HD4870 и Зткнт
Даже графический процессор AMD, хотя он и проектировался для массового рынка, получился большим, особенно для производства на фабриках TSMC. Чемпионом по размерам производимых на TSMC чипов по-прежнему остается NVIDIA, но AMD показывает, что рассчитанный на массового потребителя подход также требует огромного числа транзисторов.

2 GPU RV770, несмотря на то, что они изготовляются с использованием 55-нм техпроцесса, потребляют больше энергии, чем один GT200. Стоимость двух RV770 существенно ниже, чем одного GT200, хотя, вероятно, разница в цене частично обусловлена использованием разных техпроцессов. Если бы NVIDIA не побоялась рискнуть производить GT200 по 55-нм технологии, разница в цене была бы не столь значительной или даже была бы в пользу NVIDIA, т.к. GT200 использует один чип.

Хотя чип AMD существенно меньше, чем у NVIDIA, результаты RV770 во многих приложениях не хуже, чем у гиганта NVIDIA GT200.

[N3-Архитектура RV770]
Потоковый процессор (Stream Processing Unit)
Потоковый процессор AMD очень напоминает процессор NVIDIA G80/G92/GT200. Обратите внимание, что 3 представленных на рисунке ALU (арифметико-логических устройства) - это очень упрощенная схема (на самом деле это модули FP MUL + ADD). В потоковом процессоре AMD используется 4 таких потоковых процессорных блока, обозначаемых как x, y, z и w.

Существует еще и пятый процессорный блок, обозначаемый t (transcendental - обрабатывающий трансцендентные операции).

t-unit
Процессор t выполняет те же операции, что и процессоры x,y,z и w, и вдобавок трансцендентные операции, представленные на диаграмме блоком SFU (Special Function Unit - блоком обработки специальных функций). Каждый из блоков x,y,z,w и t рассматривается AMD как потоковый процессорный блок; RV770 имеет 800 таких блоков (у RV670 их 320).

AMD группирует 4 потоковых процессорных блока (x,y,z и w) с t-блоком и получается потоковый процессор (Streaming Processor - SP):

Streaming Processor

Потоковым процессором является закрашенная красным область. В отличие от потокового процессора NVIDIA, процессор AMD может обрабатывать до 5 инструкций одновременно.

Затем AMD группирует 16 таких потоковых процессоров в ядро SIMD.

Ядро AMD SIMD Потоковый мультипроцессор (Streaming Multiprocessor - SM) NVIDIA
Ядро AMD SIMD Streaming Multiprocessor NVIDIA

Ядро SIMD очень похоже на потоковый мультипроцессор NVIDIA со следующими исключениями.

  1. В ядре AMD SIMD больше потоковых процессоров (16 против 8).
  2. Максимальное число обрабатываемых потоковым процессором AMD инструкций в 5 раз выше, чем у потокового процессора NVIDIA.
  3. Кэши инструкций и данных не включены в ядро SIMD.
  4. AMD располагает текстурные блоки и кэш текстур вместе с потоковыми процессорами в ядре SIMD.
  5. Видите 2 SFU (Special Function Unit - блоки обработки специальных функций) в потоковом процессоре NVIDIA? NVIDIA разместила 2 очень быстрых SFU в потоковом мультипроцессоре, AMD встраивает в каждый потоковый процессорный блок свой собственный SFU. Пока непонятно, какой из подходов является оптимальным для скорости вычислений, т.к. мы не знаем задержек при обработке инструкций или пропускной способности SFU от AMD и NVIDIA.

Обратите внимание, что по рассмотренным до данного момента параметрам RV770 не отличается от RV670 (который используется в Radeon HD 3870). На следующем шаге AMD и NVIDIA расходятся: в NVIDIA GT200 по 3 потоковых мультипроцессора объединяются в кластер обработки текстур TPC (Texture Processing Cluster), а 10 TPC объединяются в чип; AMD просто объединяет 10 ядер SIMD.

AMD RV670
AMD's RV670
AMD RV770
10 ядер SIMD в AMD RV670
NVIDIA GT200 Streaming Processor Array (SPA)
Массив потоковых процессоров (Streaming Processor Array - SPA) NVIDIA GT200; вычислительных модулей меньше, но изощреннее "обвязка" вокруг них; большое внимание уделяется управлению потоками.

Число вычислительных блоков у RV770 с 10 ядрами SIMD в 2.5 раза больше, чем у RV670. И даже теоретическая вычислительная мощность RV770 выше, чем у NVIDIA GT200. Рассмотрим, например, число одновременно выполняемых инструкций - 800 у RV770 и 240 (+ 60 SFU) у GT200 - разница значительная.

NVIDIA GT200AMD RV770AMD RV670
Число одновременно обрабатываемых потоковым процессором инструкций155
Кол-во потоковых процессоров24016064
Кол-во одновременно обрабатываемых графическим процессором инструкций в самом неблагоприятном случае24016064
Максимальное кол-во обрабатываемых процессором скалярных инструкций480*800320
*60 SFU у NVIDIA иногда могут "помочь" в обработке скалярных инструкций.

Уже сейчас мы можем сделать вывод, что архитектуры графических процессоров AMD и NVIDIA рассчитаны на разные типы нагрузки. Графический процессор NVIDIA лучше справляется со множеством простых потоков (по 1 потоку на потоковый процессор), процессор AMD - с насыщенными инструкциями потоками (т.к. может одновременно обрабатывать по 5 инструкций из потока).

NVIDIA GeForce GTX 280
NVIDIA GeForce GTX 280


AMD Radeon HD 4870
AMD Radeon HD 4870
  1. Обратите внимание на кэши инструкций (Instruction Cache) и данных (Constant Cache). NVIDIA размещает их в потоковых мультипроцессорах, а AMD - вне кластеров ядер SIMD.
  2. RV770 имеет только 4 64-битных контроллера памяти, в отличие от 8 у GT200.
  3. Программируемый тесселятор (занимающийся разделением полигонов на правильные (выпуклые) полигоны или на треугольники) унаследован от графического процессора Xbox 360 (и R600/RV670); к сожалению, большинство разработчиков его не использует, т.к. он до сих пор не имеет поддержки DirectX.
  4. AMD имеет отдельные аппаратные интерполяторы; у NVIDIA интерполяторы являются разделяемыми с SFU (блоками обработки специальных функций).

Если отбросить перечисленные выше различия, архитектура AMD в целом похожа на архитектуру NVIDIA; они отличаются лишь несколькими опциями в дизайне. NVIDIA развила архитектуру G80/G92; AMD сделала то же самое для RV770 - взяла RV670 и увеличила его вычислительные ресурсы более чем в 2 раза.

Образно говоря, шаг AMD от RV670 к RV770 больше, чем у NVIDIA от G80/G92 к GT200, но AMD из соображений конкуренции необходимо было сделать этот шаг.

[N4-Соотношение Вычисления : Обработка текстур]

В графическом процессоре GT200 NVIDIA увеличила вычислительную мощность примерно на 90%, а скорость обработки текстур - лишь на 25%, подчеркивая тенденцию увеличения вычислительной мощности графических процессоров.

Textures G200

Каждый из 10 TPC имеет 8 адресов и 8 фильтров. Теперь посмотрим на RV770:

Textures RV770

4 адреса и 4 фильтра; отношение кол-ва адресов к кол-ву фильтров то же, что и у NVIDIA - 1:1; отношение Вычисления : Обработка текстур у RV770 существенно выше.

AMD RV770AMD RV670NVIDIA GT200NVIDIA G92
Кол-во потоковых процессоров16064240128
Кол-во блоков обработки адресов текстур/Фильтров40 / 4016 / 1680 / 8064 / 64
Отношение Вычисления : Обработка текстур4:14:13:12:1

Из таблицы видно, что NVIDIA при переходе от G92 к GT200 увеличила отношение Вычисления : Обработка текстур от 2:1 до 3:1. AMD переплюнула NVIDIA уже в RV670 с соотношением 4 : 1, и у нее не было необходимости улучшать результат. Это означает, что для игр с бОльшим количеством текстур лучше походит NVIDIA, а для игр, требующих большой вычислительной мощности графического процессора - RV770.

AMD также внесла некоторые усовершенствования в модули обработки текстур. Способом, который AMD не разглашает, производительность на квадратный миллиметр была увеличена на 70%. Пропускная способность кэша текстур также была удвоена и составляет 480 Гб/сек, в то время как пропускная способность шины между каждым блоком кэша L1 и памятью L2 составляет 384 Гб/сек.

[N12-Конфигурация тестовых стендов]
Test Setup
ПроцессорIntel Core 2 Extreme QX9770 @ 3.20 ГГц
Мат. платаEVGA nForce 790i SLI
Intel DX48BT2
ВидеокартыATI Radeon HD 4870
ATI Radeon HD 4850
ATI Radeon HD 3870X2
ATI Radeon HD 3870
EVGA GeForce 9800 GTX KO
NVIDIA GeForce 9800 GTX+
NVIDIA GeForce 9800 GTX
NVIDIA GeForce 9800 GX2
NVIDIA GeForce 8800 GTX
NVIDIA GeForce 8800 GT
NVIDIA GeForce GTX 280
NVIDIA GeForce GTX 260
ВидеодрайверыCatalyst Press Driver (8.7 beta)
Catalyst 8.5
ForceWare 177.34 (для GT200)
ForceWare 177.39 (для 9800 GTX/9800 GTX+)
ForceWare 175.16 (все остальное)
Жесткий дискSeagate 7200.9 120GB 8MB 7200RPM
Оперативная память4 x 1GB Corsair DDR3-1333 7-7-7-20

Источник: НИКС - Компьютерный Супермаркет

подписаться   |   обсудить в ВК   |