Стратегия AMD создания "маленьких" видеопроцессоровНовой стратегией AMD является создание ориентированных на массового потребителя GPU и применение CrossFire (нескольких GPU) для энтузиастов. NVIDIA, с другой стороны, как и 10 лет назад, продолжает выпускать большие по площади GPU и масштабировать их в сторону уменьшения для соответствующих приложений. Оба подхода необходимы и находят понимание, просто они нацелены на разные рынки. Подход AMD радикально не отличается от подхода NVIDIA, просто при проектировании AMD ориентируется на 1 ценовой сегмент ниже, чем NVIDIA. В случае с GT200 NVIDIA создала чрезвычайно большой параллельный микропроцессор. Судите сами: 1,4 млрд. транзисторов и размер пластины 576 мм2. Из таблицы на предыдущей странице видно, что AMD RV770, хотя и предназначен для массового применения, также очень велик. RV770 имеет 956 млн. транзисторов, что на 44% больше, чем у RV670 и составляет 68% от числа транзисторов у NVIDIA GT200. 2 GPU RV770, несмотря на то, что они изготовляются с использованием 55-нм техпроцесса, потребляют больше энергии, чем один GT200. Стоимость двух RV770 существенно ниже, чем одного GT200, хотя, вероятно, разница в цене частично обусловлена использованием разных техпроцессов. Если бы NVIDIA не побоялась рискнуть производить GT200 по 55-нм технологии, разница в цене была бы не столь значительной или даже была бы в пользу NVIDIA, т.к. GT200 использует один чип. Хотя чип AMD существенно меньше, чем у NVIDIA, результаты RV770 во многих приложениях не хуже, чем у гиганта NVIDIA GT200. [N3-Архитектура RV770]Существует еще и пятый процессорный блок, обозначаемый t (transcendental - обрабатывающий трансцендентные операции). AMD группирует 4 потоковых процессорных блока (x,y,z и w) с t-блоком и получается потоковый процессор (Streaming Processor - SP): Потоковым процессором является закрашенная красным область. В отличие от потокового процессора NVIDIA, процессор AMD может обрабатывать до 5 инструкций одновременно. Затем AMD группирует 16 таких потоковых процессоров в ядро SIMD.
Ядро SIMD очень похоже на потоковый мультипроцессор NVIDIA со следующими исключениями.
Обратите внимание, что по рассмотренным до данного момента параметрам RV770 не отличается от RV670 (который используется в Radeon HD 3870). На следующем шаге AMD и NVIDIA расходятся: в NVIDIA GT200 по 3 потоковых мультипроцессора объединяются в кластер обработки текстур TPC (Texture Processing Cluster), а 10 TPC объединяются в чип; AMD просто объединяет 10 ядер SIMD.
Число вычислительных блоков у RV770 с 10 ядрами SIMD в 2.5 раза больше, чем у RV670. И даже теоретическая вычислительная мощность RV770 выше, чем у NVIDIA GT200. Рассмотрим, например, число одновременно выполняемых инструкций - 800 у RV770 и 240 (+ 60 SFU) у GT200 - разница значительная.
Уже сейчас мы можем сделать вывод, что архитектуры графических процессоров AMD и NVIDIA рассчитаны на разные типы нагрузки. Графический процессор NVIDIA лучше справляется со множеством простых потоков (по 1 потоку на потоковый процессор), процессор AMD - с насыщенными инструкциями потоками (т.к. может одновременно обрабатывать по 5 инструкций из потока).
Если отбросить перечисленные выше различия, архитектура AMD в целом похожа на архитектуру NVIDIA; они отличаются лишь несколькими опциями в дизайне. NVIDIA развила архитектуру G80/G92; AMD сделала то же самое для RV770 - взяла RV670 и увеличила его вычислительные ресурсы более чем в 2 раза. Образно говоря, шаг AMD от RV670 к RV770 больше, чем у NVIDIA от G80/G92 к GT200, но AMD из соображений конкуренции необходимо было сделать этот шаг. [N4-Соотношение Вычисления : Обработка текстур]В графическом процессоре GT200 NVIDIA увеличила вычислительную мощность примерно на 90%, а скорость обработки текстур - лишь на 25%, подчеркивая тенденцию увеличения вычислительной мощности графических процессоров. Каждый из 10 TPC имеет 8 адресов и 8 фильтров. Теперь посмотрим на RV770: 4 адреса и 4 фильтра; отношение кол-ва адресов к кол-ву фильтров то же, что и у NVIDIA - 1:1; отношение Вычисления : Обработка текстур у RV770 существенно выше.
Из таблицы видно, что NVIDIA при переходе от G92 к GT200 увеличила отношение Вычисления : Обработка текстур от 2:1 до 3:1. AMD переплюнула NVIDIA уже в RV670 с соотношением 4 : 1, и у нее не было необходимости улучшать результат. Это означает, что для игр с бОльшим количеством текстур лучше походит NVIDIA, а для игр, требующих большой вычислительной мощности графического процессора - RV770. AMD также внесла некоторые усовершенствования в модули обработки текстур. Способом, который AMD не разглашает, производительность на квадратный миллиметр была увеличена на 70%. Пропускная способность кэша текстур также была удвоена и составляет 480 Гб/сек, в то время как пропускная способность шины между каждым блоком кэша L1 и памятью L2 составляет 384 Гб/сек. [N12-Конфигурация тестовых стендов]
Источник: НИКС - Компьютерный Супермаркет |