Каталог
Методика тестированияДля обеспечения чистоты эксперимента и получения объективных данных были приняты все необходимые меры. Проход каждого теста осуществлялся как минимум три раза с последующим усреднением полученных данных. Конфигурация тестовых стендов:
Общие элементы всех тестовых стендов:
Мы выражаем благодарность компаниям Asus, Corsair, Gigabyte, OCZ и Western Digital за помощь в комплектации тестовых стендов. Также благодарим компании Intel и AMD за предоставленные образцы процессоров. Параметры рабочего стола Windows: разрешение 1600 x 1200, глубина цвета 32 бита, частота обновления экрана 85 Гц, вертикальная синхронизация отключена. Тестовое ПО:
Для оценки мощности, потребляемой системой на протяжении определённого промежутка времени, использовался анализатор Extech 380803. Замеры производились в точке подключения системы к питающей сети. Таким образом, полученные результаты отражают данные по энергопотреблению системы в целом, в том числе процессора, материнской платы, подсистемы памяти, графической подсистемы, жёстких дисков (питание монитора осуществлялось по отдельной линии). Замеры производились на предмет определения потребляемой мощности в течение установленного промежутка времени, когда выполнялся тест по многопоточному рендерингу 3D-сцены из тестового пакета Cinebench. Для большей наглядности результаты представлены на трёх графиках с разбивкой на группы в зависимости от типа сокета. Материнская плата ASUS на чипсете H57 имеет энергопотребление несколько выше того уровня, который мы бы хотели видеть, поэтому тестирование процессоров Intel Core i5-530 и Intel Core i5-661 было решено проводить с использованием системной платы на базе чипсета P55. Как видно из графика, Pentium 4 670 не сумел полностью завершить рендеринг тестовой сцены за отведённое время, в связи с чем продолжительность тестового периода для него пришлось увеличить почти в два раза. Далее мы приводим данные, характеризующие различные аспекты энергопотребления. Первыми представлены результаты тестирования системы в состоянии покоя. Замеры производились в конце тестового периода, когда рендеринг сцены был уже завершён. Полученные данные говорят о том, что мощность, потребляемая системой в состоянии покоя, в значительной степени определяется способностью центрального процессора эффективно задействовать функции энергосбережения. Новейшие CPU от Intel (как Clarkdale, так и Lynnfield) продемонстрировали отличные результаты. Неплохо показали себя и представители поколения Socket LGA775. Сравнение с данными по более старым Intel Core 2 Quad Q6600 и Intel Pentium 4 670 даёт представление о значительном прогрессе, который был достигнут за несколько лет даже в рамках одного типа сокета. Интересно, что системные конфигурации на базе четырёхъядерников Phenom II демонстрируют показатели на уровне Intel Core 2 Quad Q6600. Отсюда можно заключить, что по уровню потребления энергии в состоянии покоя продукты AMD отстают от конкурирующих решений на два поколения. К счастью, с новыми представителями семейства Athlon II на ядре Propus и Regor ситуация несколько улучшилась: например, система на базе AMD Athlon II X2 255 расходует всего лишь на 7 Вт больше по сравнению с конфигурацией на основе Intel Pentium E6500. Следующая диаграмма содержит средневзвешенные результаты тестирования на пиковое потребление мощности, характеризующие работу системы при рендеринге 3D-сцены в течение 10 секунд в промежутке между 15-й и 25-й секундами. В этом тесте лидерство Intel проявляется в ещё большей степени. Сравнение данных по Intel Pentium E6500 и AMD Athlon II X2 255 показывает, что система на базе AMD Athlon II X2 255 потребляет на 28 Вт больше. Значения потребляемой мощности для конфигураций с CPU Intel Core i3-530 и AMD Athlon II X4 635 отличаются на 50 Вт в пользу решения от Intel. Аналогичное сравнение Intel Core i5-750 и AMD Phenom II X4 965 также выявляет преимущество первой с разницей в 40 Вт. Лишь интеловские «тяжеловесы» из семейства Core i7 с трёхканальным контроллером памяти отличились повышенными энергетическими аппетитами. На основании результатов для AMD Phenom II X4 910e можно сделать вывод о том, что у продуктов AMD имеется неплохой потенциал энергоэффективности. Более полное представление о характеристиках энергетической эффективности позволяет получить тест измерения суммарной энергии, потребляемой системой в течение установленного промежутка времени, который охватывает период непосредственного выполнения тестового рендеринга и период нахождения системы в покое. Единица измерения Ватт-секунда (Джоуль). Результаты для CPU Intel Pentium 4 670 отсутствуют в связи с тем, что ему не удалось завершить выполнение тестового задания за отведённое время. В приведённой ниже диаграмме представлены результаты оценки количества энергии, потребляемой системой непосредственно в режиме тестовой нагрузки. Для каждой конфигурации была принята своя продолжительность тестового периода, так как скорость выполнения задания различна для всех моделей CPU. Полученные данные характеризуют не только энергоэффективность процессоров, но и производительность: в общем случае, чем быстрее выполняется задание, тем меньше расходуется энергии. Сравнение полученных результатов говорит о большом прогрессе, достигнутом в области эффективного расходования электроэнергии. Так, система на базе самого раннего решения от Intel в составе нашего тестового набора потребляет в 7,5 раз больше энергии по сравнению с системой на основе самого передового в этом смысле CPU Intel Core i7-870. На одной и той же материнской плате для одного и того же типа сокета данные по процессорам Intel Pentium P4 670 и Intel Core 2 Quad Q9400 отличаются в 6,2 раза. Очевидно, что переход от одного вычислительного ядра к четырём сопровождался существенным повышением уровня энергетической эффективности, хотя стремительный прогресс в этой области обусловлен также и рядом других усовершенствований. Продукты Intel характеризуются высокой производительностью в сочетании с относительно низким энергопотреблением. Первые строчки в рейтинге заняли супермощные Intel Core i7-975 и Intel Core i7-920 на ядре Bloomfield, при этом сравнительно высокие значения пикового энергопотребления для них компенсируются высокой скоростью работы. То же относится и к процессорам AMD Phenom II в сравнении с CPU AMD Athlon II. [N8-Тестирование подсистемы памяти] Тестированию производительности процессоров предшествует тестирование подсистемы памяти. Поскольку данные тесты относятся к категории синтетических, они дают лишь приблизительное представление о работе памяти. Первый график получился «скученным», поэтому результаты были оформлены в виде представительной выборки в соответствии с разными типами архитектур. Тест оптимизирован под многопоточность, поэтому место CPU в турнирной таблице определяется главным образом количеством процессорных ядер (с соответствующим кэшем L1 и L2). Если проанализировать результаты по каждой кривой, можно выявить зависимость между максимальной скоростью передачи данных и размером кэш-памяти. В этом случае предпочтительнее было иметь подробные результаты, которые позволили бы точнее определить разброс в производительности процессоров с разным объёмом и типом кэша. Intel Pentium P4 670 предсказуемо оказался «в хвосте» из-за меньшей пропускной способности кэш-памяти и всего лишь одного вычислительного ядра. Обратите внимание, что в диапазоне размера блока от 128 КВ до 1 МБ результаты модели Intel с индексом E8600 в два раза выше показателей четвёртого Пентиума. В случае с крупными блоками различия между тестируемыми CPU становятся минимальными. На следующей диаграмме представлены результаты «потокового» теста памяти Stream Memory Bandwidth. В полученных результатах чётко прослеживается зависимость скорости работы подсистемы памяти от типа процессора. Как и следовало ожидать, быстрее всех оказались CPU Intel Core i7 на ядре Bloomfield со встроенным трёхканальным контроллером памяти. За ними идут представители Lynnfield и Clarkdale вместе с Socket AM3 процессорами. Замыкают список CPU для платформы Intel LGA775 c медленной шиной FSB (хотя даже в этом случае заметна градация в зависимости от частоты FSB). Очевидно, что перенос контроллера памяти с чипсета на процессор способствовал значительному повышению эффективности подсистемы памяти. Так, Intel Core i7-975 превосходит по этому показателю более ранние Intel Core 2 Quad Q6600 и Pentium 4 670 в четыре раза и пять раз соответственно. Применение интегрированного контроллера памяти способствовало значительному сокращению задержки доступа к памяти. Исключение составляют лишь CPU Clarkdale с контроллером памяти, располагающимся в корпусе процессора, но на отдельном чипе. Например, CPU Intel Core i7-870 с тем же типом процессорного разъёма, что и у Intel Core i3-530, но с другим дизайном ядра сработал в два раза быстрее. [N9-Тесты: игровые приложения] BorderlandsФантастический шутер от первого лица Borderlands с элементами ролевой игры, созданный на основе графического движка Unreal Engine от компании Epic Games, включает в себя тест производительности. Применялись настройки видео самого высокого качества с различными разрешениями экрана. Минимальные разрешения лучше всего демонстрируют различия в производительности процессоров, поэтому внимание следует обратить в первую очередь именно на эти результаты. В высоких разрешениях начинают сказываться ограничения графической подсистемы, представленной видеокартой GeForce GTX 260. Чем выше разрешение, тем большую роль начинает играть графическая подсистема, и тем сильнее нивелируются различия в производительности между тестируемыми CPU. Следовательно, данные, полученные в минимальном разрешении 1024х768, позволяют получить наиболее объективную картину. Значения FPS для позиций внизу списка меняются незначительно в зависимости от разрешения, а для верхних позиций FPS везде практически одинаков. Intel Core i3-530 несколько опережает своего основного конкурента AMD Athlon II X4 635, хотя средний FPS последнего, равный 52, позволяет обеспечить вполне достойный уровень играбельности. В данном случае не стоит придавать особого значения минимальному FPS: во-первых, для всех представленных моделей процессоров он находится в пределах одного диапазона; во-вторых, здесь скорость работы CPU, по-видимому, не оказывает решающего влияния на значение минимального FPS. Существует мнение, согласно которому практически любой относительно современный десктопный CPU сможет обеспечить приемлемый уровень игрового процесса для большинства современных игр. Это точка зрения имеет право на существование по той причине, что многие игры разрабатываются также и для игровых консолей, которые оснащаются не самыми мощными процессорами. Среди всех образцов только Pentium 4 670 не смог «потянуть» современную игру. Вместе с тем относительно старый Intel Core 2 Quad Q6600 испытание игровым бенчмарком прошёл успешно. Ещё несколько слов о тесте. Во-первых, наличие более двух вычислительных ядер, по-видимому, никак не влияет на производительность в Borderlands: двухъядерник Intel Core 2 Duo E8600 обошёл четырёхъядерный CPU Intel Core 2 Quad Q9400, а все представители Athlon II показали приблизительно одинаковые FPS. Во-вторых, процессоры Phenom II, в отличие от своих собратьев из семейства Athlon II, продемонстрировали более высокие результаты благодаря кэшу L3. Colin McRae: DiRT 2Colin McRae: DIRT 2 – популярная гоночная игра с захватывающим динамичным сюжетом – имеет собственный тест производительности. В ходе тестирования использовались высокие настройки качества и сглаживание с мультисэмплингом 4X. Вновь наблюдается ситуация, когда графическая подсистема ограничивает возможности CPU. DIRT 2 оптимизирован для работы как минимум с четырьмя ядрами (потоками), поэтому все двухъядерники Intel, за исключением CPU Clarkdale, оказались в нижней части турнирной таблицы. CPU Intel Core i3 и AMD Athlon II X4 идут «ноздря в ноздрю», хотя у последних имеется некоторое преимущество. Call of Duty: Modern Warfare 2Подсчёт FPS в бенчмарке Call of Duty: Modern Warfare 2 производился с помощью утилиты FRAPS. Замеры проводились в условиях пятикратного повтора игровой сессии продолжительностью одна минута для каждого из тестируемых CPU с последующим усреднением результатов. Также приводятся результаты измерения FPS, полученные в ходе одиночной репрезентативной игровой сессии и сгруппированные в соответствии с типом процессорного разъёма. Использовались следующие настройки: разрешение 1024x768, антиалиасинг (сглаживание) отключён, качество видео высокое. С этим тестовым заданием справились все, за исключением Intel Pentium 4 670. Дистанция между Intel Core i3 и AMD Athlon II X4 вновь минимальная. FPS на уровне 50 означает высокую скорость игры. Четвёртому Пентиуму до этого уровня очень далеко. Left 4 Dead 2Тестирование в Left 4 Dead 2 представляет собой воспроизведение пользовательской демо-записи с параметром timedemo, с максимальными настройками видео, анизотропной фильтрацией 16X, антиалиасингом 4X и включённой функцией поддержки многопоточного режима. Этот тест наглядно демонстрирует роль «узкого места» - графической подсистемы в высоких разрешениях. Её влияние проявляется в том, что в максимальном режиме FPS не поднимается выше 90-100. Основные конкуренты - Intel Core i3-530 и AMD Athlon II X4 635 – идут на равных; оба CPU расположились в центре турнирной таблицы, хотя попали они сюда разными путями. Судя по всему, наибольшее влияние на производительность в Left 4 Dead 2 оказывают размер кэш-памяти и частота процессора. Верхние строчки оккупировали исключительно «тяжеловесы» - четырёхъядерники с большим объёмом кэша. Тест Source Engine Particle SimulationВ ходе недавнего визита в один из офисов компании Valve Software – разработчика всемирно известной серии игр Half-Life – мы узнали, что компания ведёт активную работу по оптимизации своего графического движка Source для обеспечения поддержки многопоточных вычислений. Специалисты Valve Software любезно согласились передать нашей тестовой лаборатории набор бенчмарков, демонстрирующих преимущества многопоточной обработки данных. В настоящее время в компьютерной графике для представления трёхмерных объектов, не имеющих чётких пространственных границ, широко применяется так называемая система частиц, симулирующая дым, пар, огонь и другие эффекты, при этом реализм и степень полноты отображения объектов определяются вычислительными возможностями системы. В тесте используются механизмы системы частиц игрового движка Source, позволяющего распределять обработку данных между несколькими ядрами. Здесь новые CPU Intel с поддержкой Hyper-Threading продемонстрировали небольшое преимущество реальных ядер перед виртуальными: так, Intel Core i5-661 с четырьмя виртуальными ядрами отстаёт от своего собрата Intel Core i5-750 с четырьмя физическими. Сравнение самого мощного CPU Intel Core i7-975 Extreme c «дедушкой» Pentium 4 670 даёт поразительные результаты: «экстремальное» решение оказалось быстрее в 9 раз! [N10-Тесты: общая производительность системы] С недавнего времени в состав тестового программного обеспечения мы стали включать пакет PC WorldBench. При работе с PC WorldBench возникали ситуации, когда мы не могли получить повторяющихся устойчивых результатов. Мы обнаружили, что WorldBench проявляет крутой нрав и периодически отказывается корректно работать. Также было замечено, что в одних и тех же тестах могут получаться разные результаты, и далеко не всегда это обусловлено различием в уровне производительности процессоров. Некоторые бенчмарки в составе PC WorldBench 6, такие как Windows Media Encoder 9, не оптимизированы под многопоточность, хотя современные версии подобного рода приложений в большинстве своём умеют использовать все преимущества многоядерности/многопоточности. По этой причине мы решили воспользоваться только некоторыми тестами в составе PC WorldBench. Тест производительности MS OfficeТестовый модуль MS Office Productivity помогает получить представление о реальной производительности системы при работе с приложениями офисного пакета Microsoft Office 2003 SP-1. В ходе тестирования осуществлялось симулирование работы в многозадачной среде посредством переключения между несколькими офисными приложениями. В данном случае польза от дополнительных вычислительных ядер минимальна, поэтому результаты для различных моделей CPU разнятся не более чем на 20%. С офисными задачами справился даже Pentium 4.Интернет-браузер FirefoxВ тесте Firefox семейство AMD Athlon II отстаёт от конкурирующих CPU Intel Core i3, что, вероятно, обусловлено меньшим объёмом кэш-памяти. Вместе с тем представители Phenom II с 6 МБ кэшем третьего уровня вышли вперёд, и даже двухъядерник AMD Athlon II X2 255 с бо́льшим размером кэша L2 сумел опередить трех- и четырёхъядерники серии Athlon II X3 и Athlon II X4. При этом среди самих CPU Athlon II прослеживается чёткий порядок следования в зависимости от тактовой частоты. Ситуация неоднозначная.Одновременная работа с Firefox и Windows Media EncoderВ очередном тесте выполняется кодирование видео в фоновом режиме с активным интернет-браузером Firefox. Как видно, работа ещё одного приложения в фоновом режиме незначительно отразилась на результатах предыдущего теста, а порядок следования процессоров AMD в нижней части диаграммы остался неизменным. [N11-Тесты: архивирование и кодирование]7-Zip: операции архивирования (compression) и разархивирования (decompression)Здесь наблюдается прямая зависимость между количеством вычислительных ядер (потоков) и скоростью работы процессоров. CPU серии Athlon II X4 одерживают победу над модельным рядом Intel Core i3, хотя и с минимальным преимуществом.WinZip: операции архивированияWinZip 10 использует не более одного ядра, что и определило результаты тестирования.TrueCryptПо просьбам наших читателей в состав тестового пакета была включёна программа TrueCrypt для создания виртуальных зашифрованных дисков. Использовалась специальная тестовая утилита в составе TrueCrypt с настройками размера буфера 50 МБ. Поскольку тестирование в TrueCrypt связано с получением большого объёма разнообразных данных, результаты были усреднены, просуммированы и представлены в виде двух диаграмм. На первой диаграмме приводятся средневзвешенные данные по общей производительности в тесте TrueCrypt. Вторая диаграмма отражает результаты производительности при работе с определёнными алгоритмами шифрования и их комбинациями. К сожалению, используемая версия TrueCrypt не поддерживает набор новых инструкций, ускоряющих работу с криптографическим алгоритмом AES (такую функциональность предоставляет семейство продуктов Westmere). В следующий раз для демонстрации новых возможностей мы обязательно включим в состав тестового ПО обновлённую версию шифровальщика TrueCrypt. Ниже представлены подробные результаты тестирования в TrueCrypt по каждому процессору в зависимости от типов алгоритмов шифрования и их комбинаций. Обратите внимание на явное преимущество AMD Athlon II X4 635 перед Intel Core i3-530 и восьмикратное превосходство самого быстрого CPU из линейки Core i7 над самым медленным Pentium 4 670. [N12-Тесты: обработка изображений] Panorama FactoryPanorama Factory позволяет создавать одно большое панорамное фотополотно посредством бесшовного склеивания серии цифровых фотографий, снятых из одной точки. Бенчмарк интенсивно использует ресурсы оперативной памяти и требует значительной вычислительной мощности, поэтому он выходит в 64-битной версии и оптимизирован для работы в многопоточном режиме. В ходе тестирования выполнялась задача по «сшиванию» четырёх 8 Мпикс. фотографий для создания панорамы с изображением офисного интерьера. В прошлый раз аналогичное задание мы выполняли в режиме мастера, указывая вручную множество исходных параметров (что отнимало много времени и сил), и публиковали подробные результаты по каждой отдельной операции, хотя наибольший интерес здесь представляет именно процесс склеивания фотоснимков. В этот раз было решено ограничиться только самыми необходимыми данными, что позволило сэкономить время и сосредоточиться на самом главном. И здесь четыре физических ядра AMD Athlon II X4 635 помогли ему одержать победу над Intel Core i3-530 c внушительным отрывом в 6 секунд. Интеловский E6500 оставил позади AMD Athlon II X2 255. PicCOLORСпециализированное ПО picCOLOR предназначено для решения различных прикладных задач научно-технического характера и не является аналогом Adobe Photoshop. Его автор – доктор Райнхарт Мюллер из института FIBUS – периодически обновляет свою разработку по мере усовершенствования IT-технологий, в частности, для обеспечения поддержки новых версий набора инструкций SSE и технологии Hyper-Threading. По нашей просьбе доктор Мюллер любезно согласился доработать picCOLOR, предусмотрев возможность реализации серии сценариев, в основе которых лежат практические задачи научной и инженерной направленности нескольких различных типов. Результаты приводятся по четырём тестам со всеми необходимыми пояснениями и комментариями. Метод PIV (Particle Image Velocimetry – цифровая трассерная визуализация) широко применяется для получения данных о величине и направлении полей скорости при исследовании различных процессов в жидкостных и газообразных средах. Метод PIV состоит в равномерном распределении мельчайших частиц диаметром от 1 до 5 мкм по всему объёму исследуемого газа или жидкости. Движение распределённых таким образом частиц повторяет движение потока вещества при условии отсутствия возмущений в виде сильных звуковых волн или мощных вихревых явлений. Поток частиц подсвечивается короткими лазерными импульсами с регулируемым временными интервалами и снимается на скоростную камеру, синхронизированную с лазерной установкой. В дальнейшем полученные фотографии разрешением 1280x1024 пикселей подлежат обработке с помощью кросскорреляционного механизма, который определяет нахождение конкретной частицы в двух последовательных кадрах и рассчитывает пройденное ей расстояние. Тест заточен под многопоточность. Полученные результаты представлены в виде обобщённого индекса, где за единицу принят уровень производительности процессора Pentium III с частотой 1 ГГц. Так, Intel Core i7-975 Extreme оказался быстрее его в 36,2 раза, а Intel Pentium 4 670 – в 4,7 раза. Метод Real Time 3D Object Tracking (отслеживание поведения трёхмерных объектов в режиме реального времени) используется для исследования явлений деформации при аэродинамическом испытании таких конструкционных элементов, как крыло самолёта и вертолётная лопасть. Весь процесс снимается на стереокамеру, после чего происходит анализ полученных данных посредством сопоставления двух последовательных снимков, на которых запечатлены специальные маркеры, предварительно размещённые в определённой области крыла. Заключительный этап включает в себя обработку полученных результатов с помощью метода матричных преобразований. Поскольку речь идёт, в том числе, и о таком опасном явлении, как возникновение вибраций в крыле самолёта, для получения максимально подробных данных в полном объёме частота съёмки должна составлять не менее 1000 кадров в секунду. Результаты, полученные в ходе данного испытания, подлежат дальнейшему сопоставлению с теоретическими расчётами. В настоящий момент тест поддерживает однопоточный режим, но в будущем планируется предусмотреть возможность распараллеливания процесса на 3 потока. Идентификация штрих-кодов (Multi Barcodes) В тесте происходит анализ изображения размером 3200x4400 пикселей на предмет идентификации штриховых кодов в кодировке EAN13. Штрих-коды размещены в произвольном порядке, имеют различный угол наклона к горизонтальной плоскости и характеризуются разной плотностью записи (минимальная толщина линий составляет 1,5 пикселей). Процедура поиска включает в себя применение различных фильтров (некоторые из них оптимизированы под многопоточность). Процедура определения границ отдельных штрих-кодов реализуется в однопоточном режиме. Распознавание и коррекция угла наклона меток (Label Recognition/Rotation) представляет собой важный этап предварительной обработки изображений в системах оптического распознавания символов (OCR – Optical Character Recognition). В ходе тестирования происходит определение графических меток с последующей коррекцией угла их наклона к горизонтальной плоскости до значения 0º в связи с тем, что OCR-системы не способны напрямую распознавать символы, размещённые под углом к горизонтальной плоскости. В процессе выявления меток и определения угла наклона для их дальнейшего выравнивания и идентификации на предмет соответствия тому или иному символу используются специальные фильтры. Вычисления в процедуре коррекции угла наклона могут распределяться максимум по 8 потокам. При работе с реальными приложениями в трёх тестах из четырёх сравнение результатов для пары «Intel Core i3-530 – AMD Athlon II X4 635» выявляет преимущество решения от Intel: очевидно, что с подобного рода задачами обработки изображений 530-я модель справляется несколько лучше. AMD Athlon II X2 255 обошёл Intel Pentium E6500 в трёх тестах из четырёх. Пакет синтетических тестов в составе picCOLOR позволяет оценить производительность системы при выполнении определённых задач с последующим усреднёнием результатов (за единицу взята производительность Intel Pentium III 1 ГГц). В серии синтетических тестов AMD Athlon II X4 635 с небольшим отрывом опережает основного конкурента. В тестах по обработке изображений, как и при тестировании в 3D-играх, конкурирующие решения от Intel и AMD демонстрируют практически одинаковую производительность. С учётом того, что программы для работы с изображениями широко используют многопоточность, результаты двухъядерника Intel Core i3-530 приятно удивляют. Впрочем, от новейшей архитектуры Intel этого и следовало ожидать. [N13-Тесты: кодирование и обработка аудиовидеоданных] Кодирование видео кодеком x264В тесте измеряется скорость перекодирования видеоролика в один из наиболее популярных форматов H.264 с использованием профиля кодирования в два прохода. Следуя общепринятой практике, результаты тестирования представлены отдельно по каждому проходу. Кодирование видео традиционно считают «коньком» быстрых многоядерных процессоров. Так, во втором проходе 635-й четырёхъядерник сработал почти в два раза быстрее двухъядерного Intel Pentium E6500. На современном этапе развития процессорных технологий прослеживается тенденция к повышению производительности новых моделей при выполнении задач по кодированию видео: сравнительный анализ современных CPU и Pentium 4 наглядно иллюстрирует значительный прогресс, достигнутый в этой области. Кодирование видео с помощью Windows Live Movie Maker 14В данном тесте применяется достаточно простая методика: с помощью Windows Live Movie Maker 14 осуществляется перекодирование видеоролика с записью телепередачи продолжительностью 30 минут в формате WTV с оригинальным разрешением 720p (1280х720) в файл формата WMV разрешением 320x240 для его дальнейшего воспроизведения на мобильных устройствах. Использование единиц измерения времени для оценки результатов позволяет получить более наглядное представление о работе процессоров. Например, если отдать предпочтение не двухъядернику Intel Core i3-530, а четырёхъядерному AMD Athlon II X4 635, то время, сэкономленное при выполнении аналогичного задания, составит целых 30 секунд. Регулярное выполнение задач по перекодированию большого объёма видео, подобных описанной выше, однозначно диктует необходимость приобретения мощных современных моделей CPU. Сравнение результатов по Intel Core i7-960 и Intel Pentium E6500 (первый справился с заданием на четыре с половиной минуты быстрее второго) позволяет сделать следующий вывод: если время – деньги, то хороший дорогой процессор, в конечном счёте, быстро окупит себя. Кодирование аудио в LAME MTПрограмма LAME MT является многопоточной версией кодировщика LAME MP3, созданной для демонстрации возможностей многопоточных вычислений и оптимизированной под Hyper-Threading. Соответственно чем больше физических ядер, тем больше виртуальных. Вместо использования нескольких параллельных потоков, в LAME MT запускается психоакустический анализ аудиоданных в формате MP3, который выполняется в отдельном потоке, тогда как остальной кодировщик использует простую линейную конвейеризацию. Таким образом, психоакустический анализ выполняется с некоторым опережением относительно других вычислений с последующим помещением результатов в буферную память для их дальнейшего использования вторым потоком. Таким образом, нагрузка может распределяться максимум по двум ядрам. Результаты представлены по двум разным 64-битным версиям, скомпилированным Intel и Microsoft; соответственно используются два типа кодирования – с постоянным и переменным битрейтом. В ходе тестирования осуществляется обработка аудиофайла в формате WAV размером 101 МБ продолжительностью 10 минут 6 секунд. Кодирование аудиоданных относится к категории задач, для которых характерна ограниченная эффективность режима многопоточных вычислений. Таким образом, типичный сценарий работы с аудиоданными не предполагает сколько-нибудь существенного прироста скорости обработки аудиоданных при наличии более двух процессорных ядер. Исключение могут составлять случаи пакетной обработки данных в многозадачной среде. [N14-Тесты: 3D-моделирование и 3D-рендеринг] Рендеринг в CinebenchТестовый пакет Cinebench основан на популярном программном обеспечении для создания 3D-контента Cinema 4D от компании Maxon. Cinebench предусматривает поддержку многопоточного режима и возможность работы в 64-битной среде. Тест инициирует как однопоточную, так и многопоточную нагрузку. Очередная победа четырёхъядерника AMD Athlon II X4 635 над 530-й моделью. Рендеринг в POV-RayПрограмма POV-Ray представляет собой инструмент для создания 3D-изображений методом трассировки лучей (ray tracing). Использовалась последняя бета-версия программы POV-Ray 3.7, оптимизированная под многопоточность и 64-битные вычисления. Данный тест наглядно демонстрирует прогресс, достигнутый в области рендеринга с момента появления Pentium 4. Благодаря тому, что отрисовка сцены chess2.pov сопровождается полным распараллеливанием, многоядерные процессоры оказались на высоте со средним результатом, превосходящим результат четвёртого Пентиума в 10 раз. Несмотря на то, что со временем появляются всё более производительные комплектующие, программное обеспечение зачастую становится медленнее. В одном из прошлых обзоров на отрисовку той же сцены в однопоточном режиме Pentium 4 670 понадобилось 309 секунд. Сейчас при работе в POV-Ray 3.7 это время составило 601 секунду. Чтобы удостовериться в правильности сделанного вывода, мы воспользовались старой 64-битной версией программы POV-Ray 3.6.1 (март 2005 г.) и тестовой платформой LGA775. Как ни странно, но и в этот раз подтвердился результат в 309 секунд. Очевидно, что со временем программа совершенствовалась, тем не менее, в более ранних версиях Pentium 4 670 демонстрирует более высокую скорость работы. Autodesk 3ds max: моделирование и рендерингВ первом тесте 3ds max измеряется скорость 3D-моделирования – процесса, отличного от рендеринга. Результаты P4 670 выглядят неплохо на фоне других CPU, что объясняется влиянием графической подсистемы, ограничивающей возможности центрального процессора.Valve VRADВ данном тесте происходит компиляция карты для игры Half-Life 2 с помощью внутреннего инструмента Valve VRAD для создания освещения и световых решений посредством соответствующих расчётов. Практически вне зависимости от того, о каком рендеринговом ПО идёт речь, четыре физических ядра AMD Athlon II X4 635 в сочетании с широкими вычислительными возможностями для выполнения операций с плавающей запятой позволяют ему одержать победу над Core i3-530. Folding@Home: научные и инженерные расчётыВ данном тесте используется бенчмарк Folding@Home benchmark CD. Его автор – один из членов нашей команды, принимающей активное участие в проекте Folding@Home. Проект распределительных вычислений Folding@Home, запущенный учёными из Стэнфордского университета, ставит перед собой цель исследовать фолдинг белков в организме человека (сворачивание белков в определённую пространственную структуру) для борьбы с такими заболеваниями, как болезнь Паркинсона, болезнь Альцгеймера, муковисцидоз и некоторыми другими заболеваниями, вызванными нарушениями в процессе формирования белков. Клиентское программное обеспечение Folding@Home работает в фоновом режиме и выполняет расчёты по моделированию фолдинга белков только при наличии свободных ресурсов CPU. Мы призываем вас стать участником проекта и внести свой вклад в развитие медицинской науки. Более подробную информацию о проекте можно получить по адресу в Интернете http://folding.stanford.edu/. Задания в рамках проекта Folding@Home раздаются с учётом особенностей аппаратной конфигурации компьютерной системы. Например, счётный модуль Gromacs поддерживает дополнительный набор инструкций SSE для CPU Intel, набор команд 3DNow! в процессорах AMD и технологию Altivec на микропроцессорах PowerPC. Folding@Home является ярким примером научных и инженерных расчётов. Бенчмарк Folding Benchmark CD, представляющий собой загрузочный CD-диск на основе Linux, использует наиболее распространённые типы заданий (WU) и осуществляет подсчёт очков, начисленных в течение дня команде, использующей систему на базе той или иной модели CPU. После загрузки с загрузочного диска определяется конфигурация системы (модель CPU и сетевой карты) и IP-адрес для выхода в Интернет и скачивания с одного из многочисленных серверов Folding@Home последних версий счётных модулей (исследовательских ядер). В дальнейшем происходит обработка полученных данных в соответствии с сэмпловыми заданиями каждого из четырёх типов. Так, при наличии двух процессорных ядер нагрузка распределяется следующим образом: первое ядро используется для вычислений в рамках рабочего пакета Tinker WU, а на втором выполняются расчёты по юниту Amber WU. После завершения задания происходит инициализация следующего рабочего пакета – таким образом, процессорные ядра никогда не простаивают. После окончания тестовых расчётов по всем четырём типам заданий осуществляется подсчёт всех начисленных очков и их усреднение. Полученное средневзвешенное значение начисленных в течение дня очков умножается на число ядер, и таким образом определяется общее количество заработанных в течение дня очков, которое характеризует производительность системной конфигурации на базе конкретной модели CPU. Такой способ оценки общей производительности может показаться несколько необычным, но, на наш взгляд, он довольно эффективен. Полученные результаты представлены в соответствии с каждым из четырёх типов заданий, что позволяет оценить уровень производительности каждого CPU при выполнении расчётов по разным типам заданий. Однако результаты для разных CPU по одному и тому же WU в какой-то степени можно считать ненадёжными, поскольку в CPU с поддержкой Hyper-Threading вычисления происходят по нескольким потокам. Чтобы получить наиболее полное и объективное представление о производительности каждого из процессоров в этом бенчмарке, был произведён подсчёт общего количества очков, полученных в течение дня. Эти данные содержатся в последней диаграмме. В нашем последнем бенчмарке четыре ядра AMD Athlon II X4 635 вновь помогли ему опередить своего основного конкурента. Между тем, современный двухъядерник Intel Core i3-530 в течение дня сумел набрать больше очков, чем четырёхъядерный CPU прошлого поколения Core 2 Quad Q6600. Таким образом, в некоторых типах задач два современных вычислительных ядра проявляют себя лучше, чем четыре ядра архитектуры прошлого поколения. [N15-Разгон] Описание процедуры разгона мы начинаем с модели Intel Core i5-661, поскольку в самом первом обзоре, посвящённом этому CPU, процесс разгона подробно не рассматривался. В этом разделе мы также попытаемся оценить потенциал разгона процессоров Intel Core i3-530 и AMD Athlon II X4 635. Как обычно, был проведён комплекс мер по определению максимально возможного значения тактовой частоты процессора, при котором будет возможна стабильная работа системы. Процедура разгона включала в себя изменение базовой частоты (BCLK), повышение напряжения питания процессора и уменьшение множителя частоты памяти с соответствующим температурным мониторингом. При каждом новом повышении тактовой частоты запускался тест стабильности Prime95. Следуя стандартной процедуре, частоту Intel Core i5-661 удалось поднять до невероятных 4,5 ГГц при 1,4 В, что означает 50% повышение по сравнению со штатным значением 3,3 ГГц (напомним, что этот CPU также может автоматически повышать свою частоту до 3,6 ГГц благодаря технологии Turbo Boost). Материнская плата Asus P7H57D-V EVO способствовала максимально комфортному овеклокингу. В ходе манипуляций с базовой частотой (133 МГц) и множителем памяти было подобрано максимальное значение тактовой частоты процессора, при котором система функционировала стабильно. При достижении уровня 4,15 ГГц стало заметно, что CPU сильно греется, а стандартный кулер от Intel не успевает отводить тепло. В тесте на предельную нагрузку 661-я модель работала без сбоев, но нагревалась до 74° C. По этой причине было решено использовать более мощный кулер, с помощью которого процессор удалось охладить приблизительно до 50° C. Перегрев разгоняемого CPU был вызван тем, что в BIOS Setup материнской платы ASUS значение напряжения питания процессора было установлено в положении AUTO. Таким образом, к тому моменту, когда частота CPU достигла максимального уровня 4,5 ГГц, напряжение питания ядра автоматически поднялось до 1,4 В против штатных 1,16 В (отдадим должное интеллектуальным способностям утилиты). Что касается штатного кулера Intel, то подобного рода разгон предполагает обязательное применение более производительной модели. Воодушевляющие результаты для Cor |
Источник: TechReport