Каталог
Тестирование подсистемы памятиТестированию производительности процессоров предшествует тестирование подсистемы памяти. Поскольку данные тесты относятся к категории синтетических, они дают лишь приблизительное представление о работе памяти. Первый график получился «скученным», поэтому результаты были оформлены в виде представительной выборки в соответствии с разными типами архитектур. Тест оптимизирован под многопоточность, поэтому место CPU в турнирной таблице определяется главным образом количеством процессорных ядер (с соответствующим кэшем L1 и L2). Если проанализировать результаты по каждой кривой, можно выявить зависимость между максимальной скоростью передачи данных и размером кэш-памяти. В этом случае предпочтительнее было иметь подробные результаты, которые позволили бы точнее определить разброс в производительности процессоров с разным объёмом и типом кэша. Intel Pentium P4 670 предсказуемо оказался «в хвосте» из-за меньшей пропускной способности кэш-памяти и всего лишь одного вычислительного ядра. Обратите внимание, что в диапазоне размера блока от 128 КВ до 1 МБ результаты модели Intel с индексом E8600 в два раза выше показателей четвёртого Пентиума. В случае с крупными блоками различия между тестируемыми CPU становятся минимальными. На следующей диаграмме представлены результаты «потокового» теста памяти Stream Memory Bandwidth. В полученных результатах чётко прослеживается зависимость скорости работы подсистемы памяти от типа процессора. Как и следовало ожидать, быстрее всех оказались CPU Intel Core i7 на ядре Bloomfield со встроенным трёхканальным контроллером памяти. За ними идут представители Lynnfield и Clarkdale вместе с Socket AM3 процессорами. Замыкают список CPU для платформы Intel LGA775 c медленной шиной FSB (хотя даже в этом случае заметна градация в зависимости от частоты FSB). Очевидно, что перенос контроллера памяти с чипсета на процессор способствовал значительному повышению эффективности подсистемы памяти. Так, Intel Core i7-975 превосходит по этому показателю более ранние Intel Core 2 Quad Q6600 и Pentium 4 670 в четыре раза и пять раз соответственно. Применение интегрированного контроллера памяти способствовало значительному сокращению задержки доступа к памяти. Исключение составляют лишь CPU Clarkdale с контроллером памяти, располагающимся в корпусе процессора, но на отдельном чипе. Например, CPU Intel Core i7-870 с тем же типом процессорного разъёма, что и у Intel Core i3-530, но с другим дизайном ядра сработал в два раза быстрее. [N9-Тесты: игровые приложения] BorderlandsФантастический шутер от первого лица Borderlands с элементами ролевой игры, созданный на основе графического движка Unreal Engine от компании Epic Games, включает в себя тест производительности. Применялись настройки видео самого высокого качества с различными разрешениями экрана. Минимальные разрешения лучше всего демонстрируют различия в производительности процессоров, поэтому внимание следует обратить в первую очередь именно на эти результаты. В высоких разрешениях начинают сказываться ограничения графической подсистемы, представленной видеокартой GeForce GTX 260. Чем выше разрешение, тем большую роль начинает играть графическая подсистема, и тем сильнее нивелируются различия в производительности между тестируемыми CPU. Следовательно, данные, полученные в минимальном разрешении 1024х768, позволяют получить наиболее объективную картину. Значения FPS для позиций внизу списка меняются незначительно в зависимости от разрешения, а для верхних позиций FPS везде практически одинаков. Intel Core i3-530 несколько опережает своего основного конкурента AMD Athlon II X4 635, хотя средний FPS последнего, равный 52, позволяет обеспечить вполне достойный уровень играбельности. В данном случае не стоит придавать особого значения минимальному FPS: во-первых, для всех представленных моделей процессоров он находится в пределах одного диапазона; во-вторых, здесь скорость работы CPU, по-видимому, не оказывает решающего влияния на значение минимального FPS. Существует мнение, согласно которому практически любой относительно современный десктопный CPU сможет обеспечить приемлемый уровень игрового процесса для большинства современных игр. Это точка зрения имеет право на существование по той причине, что многие игры разрабатываются также и для игровых консолей, которые оснащаются не самыми мощными процессорами. Среди всех образцов только Pentium 4 670 не смог «потянуть» современную игру. Вместе с тем относительно старый Intel Core 2 Quad Q6600 испытание игровым бенчмарком прошёл успешно. Ещё несколько слов о тесте. Во-первых, наличие более двух вычислительных ядер, по-видимому, никак не влияет на производительность в Borderlands: двухъядерник Intel Core 2 Duo E8600 обошёл четырёхъядерный CPU Intel Core 2 Quad Q9400, а все представители Athlon II показали приблизительно одинаковые FPS. Во-вторых, процессоры Phenom II, в отличие от своих собратьев из семейства Athlon II, продемонстрировали более высокие результаты благодаря кэшу L3. Colin McRae: DiRT 2Colin McRae: DIRT 2 – популярная гоночная игра с захватывающим динамичным сюжетом – имеет собственный тест производительности. В ходе тестирования использовались высокие настройки качества и сглаживание с мультисэмплингом 4X. Вновь наблюдается ситуация, когда графическая подсистема ограничивает возможности CPU. DIRT 2 оптимизирован для работы как минимум с четырьмя ядрами (потоками), поэтому все двухъядерники Intel, за исключением CPU Clarkdale, оказались в нижней части турнирной таблицы. CPU Intel Core i3 и AMD Athlon II X4 идут «ноздря в ноздрю», хотя у последних имеется некоторое преимущество. Call of Duty: Modern Warfare 2Подсчёт FPS в бенчмарке Call of Duty: Modern Warfare 2 производился с помощью утилиты FRAPS. Замеры проводились в условиях пятикратного повтора игровой сессии продолжительностью одна минута для каждого из тестируемых CPU с последующим усреднением результатов. Также приводятся результаты измерения FPS, полученные в ходе одиночной репрезентативной игровой сессии и сгруппированные в соответствии с типом процессорного разъёма. Использовались следующие настройки: разрешение 1024x768, антиалиасинг (сглаживание) отключён, качество видео высокое. С этим тестовым заданием справились все, за исключением Intel Pentium 4 670. Дистанция между Intel Core i3 и AMD Athlon II X4 вновь минимальная. FPS на уровне 50 означает высокую скорость игры. Четвёртому Пентиуму до этого уровня очень далеко. Left 4 Dead 2Тестирование в Left 4 Dead 2 представляет собой воспроизведение пользовательской демо-записи с параметром timedemo, с максимальными настройками видео, анизотропной фильтрацией 16X, антиалиасингом 4X и включённой функцией поддержки многопоточного режима. Этот тест наглядно демонстрирует роль «узкого места» - графической подсистемы в высоких разрешениях. Её влияние проявляется в том, что в максимальном режиме FPS не поднимается выше 90-100. Основные конкуренты - Intel Core i3-530 и AMD Athlon II X4 635 – идут на равных; оба CPU расположились в центре турнирной таблицы, хотя попали они сюда разными путями. Судя по всему, наибольшее влияние на производительность в Left 4 Dead 2 оказывают размер кэш-памяти и частота процессора. Верхние строчки оккупировали исключительно «тяжеловесы» - четырёхъядерники с большим объёмом кэша. Тест Source Engine Particle SimulationВ ходе недавнего визита в один из офисов компании Valve Software – разработчика всемирно известной серии игр Half-Life – мы узнали, что компания ведёт активную работу по оптимизации своего графического движка Source для обеспечения поддержки многопоточных вычислений. Специалисты Valve Software любезно согласились передать нашей тестовой лаборатории набор бенчмарков, демонстрирующих преимущества многопоточной обработки данных. В настоящее время в компьютерной графике для представления трёхмерных объектов, не имеющих чётких пространственных границ, широко применяется так называемая система частиц, симулирующая дым, пар, огонь и другие эффекты, при этом реализм и степень полноты отображения объектов определяются вычислительными возможностями системы. В тесте используются механизмы системы частиц игрового движка Source, позволяющего распределять обработку данных между несколькими ядрами. Здесь новые CPU Intel с поддержкой Hyper-Threading продемонстрировали небольшое преимущество реальных ядер перед виртуальными: так, Intel Core i5-661 с четырьмя виртуальными ядрами отстаёт от своего собрата Intel Core i5-750 с четырьмя физическими. Сравнение самого мощного CPU Intel Core i7-975 Extreme c «дедушкой» Pentium 4 670 даёт поразительные результаты: «экстремальное» решение оказалось быстрее в 9 раз! [N10-Тесты: общая производительность системы] С недавнего времени в состав тестового программного обеспечения мы стали включать пакет PC WorldBench. При работе с PC WorldBench возникали ситуации, когда мы не могли получить повторяющихся устойчивых результатов. Мы обнаружили, что WorldBench проявляет крутой нрав и периодически отказывается корректно работать. Также было замечено, что в одних и тех же тестах могут получаться разные результаты, и далеко не всегда это обусловлено различием в уровне производительности процессоров. Некоторые бенчмарки в составе PC WorldBench 6, такие как Windows Media Encoder 9, не оптимизированы под многопоточность, хотя современные версии подобного рода приложений в большинстве своём умеют использовать все преимущества многоядерности/многопоточности. По этой причине мы решили воспользоваться только некоторыми тестами в составе PC WorldBench. Тест производительности MS OfficeТестовый модуль MS Office Productivity помогает получить представление о реальной производительности системы при работе с приложениями офисного пакета Microsoft Office 2003 SP-1. В ходе тестирования осуществлялось симулирование работы в многозадачной среде посредством переключения между несколькими офисными приложениями. В данном случае польза от дополнительных вычислительных ядер минимальна, поэтому результаты для различных моделей CPU разнятся не более чем на 20%. С офисными задачами справился даже Pentium 4.Интернет-браузер FirefoxВ тесте Firefox семейство AMD Athlon II отстаёт от конкурирующих CPU Intel Core i3, что, вероятно, обусловлено меньшим объёмом кэш-памяти. Вместе с тем представители Phenom II с 6 МБ кэшем третьего уровня вышли вперёд, и даже двухъядерник AMD Athlon II X2 255 с бо́льшим размером кэша L2 сумел опередить трех- и четырёхъядерники серии Athlon II X3 и Athlon II X4. При этом среди самих CPU Athlon II прослеживается чёткий порядок следования в зависимости от тактовой частоты. Ситуация неоднозначная.Одновременная работа с Firefox и Windows Media EncoderВ очередном тесте выполняется кодирование видео в фоновом режиме с активным интернет-браузером Firefox. Как видно, работа ещё одного приложения в фоновом режиме незначительно отразилась на результатах предыдущего теста, а порядок следования процессоров AMD в нижней части диаграммы остался неизменным. [N11-Тесты: архивирование и кодирование]7-Zip: операции архивирования (compression) и разархивирования (decompression)Здесь наблюдается прямая зависимость между количеством вычислительных ядер (потоков) и скоростью работы процессоров. CPU серии Athlon II X4 одерживают победу над модельным рядом Intel Core i3, хотя и с минимальным преимуществом.WinZip: операции архивированияWinZip 10 использует не более одного ядра, что и определило результаты тестирования.TrueCryptПо просьбам наших читателей в состав тестового пакета была включёна программа TrueCrypt для создания виртуальных зашифрованных дисков. Использовалась специальная тестовая утилита в составе TrueCrypt с настройками размера буфера 50 МБ. Поскольку тестирование в TrueCrypt связано с получением большого объёма разнообразных данных, результаты были усреднены, просуммированы и представлены в виде двух диаграмм. На первой диаграмме приводятся средневзвешенные данные по общей производительности в тесте TrueCrypt. Вторая диаграмма отражает результаты производительности при работе с определёнными алгоритмами шифрования и их комбинациями. К сожалению, используемая версия TrueCrypt не поддерживает набор новых инструкций, ускоряющих работу с криптографическим алгоритмом AES (такую функциональность предоставляет семейство продуктов Westmere). В следующий раз для демонстрации новых возможностей мы обязательно включим в состав тестового ПО обновлённую версию шифровальщика TrueCrypt. Ниже представлены подробные результаты тестирования в TrueCrypt по каждому процессору в зависимости от типов алгоритмов шифрования и их комбинаций. Обратите внимание на явное преимущество AMD Athlon II X4 635 перед Intel Core i3-530 и восьмикратное превосходство самого быстрого CPU из линейки Core i7 над самым медленным Pentium 4 670. [N12-Тесты: обработка изображений] Panorama FactoryPanorama Factory позволяет создавать одно большое панорамное фотополотно посредством бесшовного склеивания серии цифровых фотографий, снятых из одной точки. Бенчмарк интенсивно использует ресурсы оперативной памяти и требует значительной вычислительной мощности, поэтому он выходит в 64-битной версии и оптимизирован для работы в многопоточном режиме. В ходе тестирования выполнялась задача по «сшиванию» четырёх 8 Мпикс. фотографий для создания панорамы с изображением офисного интерьера. В прошлый раз аналогичное задание мы выполняли в режиме мастера, указывая вручную множество исходных параметров (что отнимало много времени и сил), и публиковали подробные результаты по каждой отдельной операции, хотя наибольший интерес здесь представляет именно процесс склеивания фотоснимков. В этот раз было решено ограничиться только самыми необходимыми данными, что позволило сэкономить время и сосредоточиться на самом главном. И здесь четыре физических ядра AMD Athlon II X4 635 помогли ему одержать победу над Intel Core i3-530 c внушительным отрывом в 6 секунд. Интеловский E6500 оставил позади AMD Athlon II X2 255. PicCOLORСпециализированное ПО picCOLOR предназначено для решения различных прикладных задач научно-технического характера и не является аналогом Adobe Photoshop. Его автор – доктор Райнхарт Мюллер из института FIBUS – периодически обновляет свою разработку по мере усовершенствования IT-технологий, в частности, для обеспечения поддержки новых версий набора инструкций SSE и технологии Hyper-Threading. По нашей просьбе доктор Мюллер любезно согласился доработать picCOLOR, предусмотрев возможность реализации серии сценариев, в основе которых лежат практические задачи научной и инженерной направленности нескольких различных типов. Результаты приводятся по четырём тестам со всеми необходимыми пояснениями и комментариями. Метод PIV (Particle Image Velocimetry – цифровая трассерная визуализация) широко применяется для получения данных о величине и направлении полей скорости при исследовании различных процессов в жидкостных и газообразных средах. Метод PIV состоит в равномерном распределении мельчайших частиц диаметром от 1 до 5 мкм по всему объёму исследуемого газа или жидкости. Движение распределённых таким образом частиц повторяет движение потока вещества при условии отсутствия возмущений в виде сильных звуковых волн или мощных вихревых явлений. Поток частиц подсвечивается короткими лазерными импульсами с регулируемым временными интервалами и снимается на скоростную камеру, синхронизированную с лазерной установкой. В дальнейшем полученные фотографии разрешением 1280x1024 пикселей подлежат обработке с помощью кросскорреляционного механизма, который определяет нахождение конкретной частицы в двух последовательных кадрах и рассчитывает пройденное ей расстояние. Тест заточен под многопоточность. Полученные результаты представлены в виде обобщённого индекса, где за единицу принят уровень производительности процессора Pentium III с частотой 1 ГГц. Так, Intel Core i7-975 Extreme оказался быстрее его в 36,2 раза, а Intel Pentium 4 670 – в 4,7 раза. Метод Real Time 3D Object Tracking (отслеживание поведения трёхмерных объектов в режиме реального времени) используется для исследования явлений деформации при аэродинамическом испытании таких конструкционных элементов, как крыло самолёта и вертолётная лопасть. Весь процесс снимается на стереокамеру, после чего происходит анализ полученных данных посредством сопоставления двух последовательных снимков, на которых запечатлены специальные маркеры, предварительно размещённые в определённой области крыла. Заключительный этап включает в себя обработку полученных результатов с помощью метода матричных преобразований. Поскольку речь идёт, в том числе, и о таком опасном явлении, как возникновение вибраций в крыле самолёта, для получения максимально подробных данных в полном объёме частота съёмки должна составлять не менее 1000 кадров в секунду. Результаты, полученные в ходе данного испытания, подлежат дальнейшему сопоставлению с теоретическими расчётами. В настоящий момент тест поддерживает однопоточный режим, но в будущем планируется предусмотреть возможность распараллеливания процесса на 3 потока. Идентификация штрих-кодов (Multi Barcodes) В тесте происходит анализ изображения размером 3200x4400 пикселей на предмет идентификации штриховых кодов в кодировке EAN13. Штрих-коды размещены в произвольном порядке, имеют различный угол наклона к горизонтальной плоскости и характеризуются разной плотностью записи (минимальная толщина линий составляет 1,5 пикселей). Процедура поиска включает в себя применение различных фильтров (некоторые из них оптимизированы под многопоточность). Процедура определения границ отдельных штрих-кодов реализуется в однопоточном режиме. Распознавание и коррекция угла наклона меток (Label Recognition/Rotation) представляет собой важный этап предварительной обработки изображений в системах оптического распознавания символов (OCR – Optical Character Recognition). В ходе тестирования происходит определение графических меток с последующей коррекцией угла их наклона к горизонтальной плоскости до значения 0º в связи с тем, что OCR-системы не способны напрямую распознавать символы, размещённые под углом к горизонтальной плоскости. В процессе выявления меток и определения угла наклона для их дальнейшего выравнивания и идентификации на предмет соответствия тому или иному символу используются специальные фильтры. Вычисления в процедуре коррекции угла наклона могут распределяться максимум по 8 потокам. При работе с реальными приложениями в трёх тестах из четырёх сравнение результатов для пары «Intel Core i3-530 – AMD Athlon II X4 635» выявляет преимущество решения от Intel: очевидно, что с подобного рода задачами обработки изображений 530-я модель справляется несколько лучше. AMD Athlon II X2 255 обошёл Intel Pentium E6500 в трёх тестах из четырёх. Пакет синтетических тестов в составе picCOLOR позволяет оценить производительность системы при выполнении определённых задач с последующим усреднёнием результатов (за единицу взята производительность Intel Pentium III 1 ГГц). В серии синтетических тестов AMD Athlon II X4 635 с небольшим отрывом опережает основного конкурента. В тестах по обработке изображений, как и при тестировании в 3D-играх, конкурирующие решения от Intel и AMD демонстрируют практически одинаковую производительность. С учётом того, что программы для работы с изображениями широко используют многопоточность, результаты двухъядерника Intel Core i3-530 приятно удивляют. Впрочем, от новейшей архитектуры Intel этого и следовало ожидать. [N13-Тесты: кодирование и обработка аудиовидеоданных] Кодирование видео кодеком x264В тесте измеряется скорость перекодирования видеоролика в один из наиболее популярных форматов H.264 с использованием профиля кодирования в два прохода. Следуя общепринятой практике, результаты тестирования представлены отдельно по каждому проходу. Кодирование видео традиционно считают «коньком» быстрых многоядерных процессоров. Так, во втором проходе 635-й четырёхъядерник сработал почти в два раза быстрее двухъядерного Intel Pentium E6500. На современном этапе развития процессорных технологий прослеживается тенденция к повышению производительности новых моделей при выполнении задач по кодированию видео: сравнительный анализ современных CPU и Pentium 4 наглядно иллюстрирует значительный прогресс, достигнутый в этой области. Кодирование видео с помощью Windows Live Movie Maker 14В данном тесте применяется достаточно простая методика: с помощью Windows Live Movie Maker 14 осуществляется перекодирование видеоролика с записью телепередачи продолжительностью 30 минут в формате WTV с оригинальным разрешением 720p (1280х720) в файл формата WMV разрешением 320x240 для его дальнейшего воспроизведения на мобильных устройствах. Использование единиц измерения времени для оценки результатов позволяет получить более наглядное представление о работе процессоров. Например, если отдать предпочтение не двухъядернику Intel Core i3-530, а четырёхъядерному AMD Athlon II X4 635, то время, сэкономленное при выполнении аналогичного задания, составит целых 30 секунд. Регулярное выполнение задач по перекодированию большого объёма видео, подобных описанной выше, однозначно диктует необходимость приобретения мощных современных моделей CPU. Сравнение результатов по Intel Core i7-960 и Intel Pentium E6500 (первый справился с заданием на четыре с половиной минуты быстрее второго) позволяет сделать следующий вывод: если время – деньги, то хороший дорогой процессор, в конечном счёте, быстро окупит себя. Кодирование аудио в LAME MTПрограмма LAME MT является многопоточной версией кодировщика LAME MP3, созданной для демонстрации возможностей многопоточных вычислений и оптимизированной под Hyper-Threading. Соответственно чем больше физических ядер, тем больше виртуальных. Вместо использования нескольких параллельных потоков, в LAME MT запускается психоакустический анализ аудиоданных в формате MP3, который выполняется в отдельном потоке, тогда как остальной кодировщик использует простую линейную конвейеризацию. Таким образом, психоакустический анализ выполняется с некоторым опережением относительно других вычислений с последующим помещением результатов в буферную память для их дальнейшего использования вторым потоком. Таким образом, нагрузка может распределяться максимум по двум ядрам. Результаты представлены по двум разным 64-битным версиям, скомпилированным Intel и Microsoft; соответственно используются два типа кодирования – с постоянным и переменным битрейтом. В ходе тестирования осуществляется обработка аудиофайла в формате WAV размером 101 МБ продолжительностью 10 минут 6 секунд. Кодирование аудиоданных относится к категории задач, для которых характерна ограниченная эффективность режима многопоточных вычислений. Таким образом, типичный сценарий работы с аудиоданными не предполагает сколько-нибудь существенного прироста скорости обработки аудиоданных при наличии более двух процессорных ядер. Исключение могут составлять случаи пакетной обработки данных в многозадачной среде. [N14-Тесты: 3D-моделирование и 3D-рендеринг] Рендеринг в CinebenchТестовый пакет Cinebench основан на популярном программном обеспечении для создания 3D-контента Cinema 4D от компании Maxon. Cinebench предусматривает поддержку многопоточного режима и возможность работы в 64-битной среде. Тест инициирует как однопоточную, так и многопоточную нагрузку. Очередная победа четырёхъядерника AMD Athlon II X4 635 над 530-й моделью. Рендеринг в POV-RayПрограмма POV-Ray представляет собой инструмент для создания 3D-изображений методом трассировки лучей (ray tracing). Использовалась последняя бета-версия программы POV-Ray 3.7, оптимизированная под многопоточность и 64-битные вычисления. Данный тест наглядно демонстрирует прогресс, достигнутый в области рендеринга с момента появления Pentium 4. Благодаря тому, что отрисовка сцены chess2.pov сопровождается полным распараллеливанием, многоядерные процессоры оказались на высоте со средним результатом, превосходящим результат четвёртого Пентиума в 10 раз. Несмотря на то, что со временем появляются всё более производительные комплектующие, программное обеспечение зачастую становится медленнее. В одном из прошлых обзоров на отрисовку той же сцены в однопоточном режиме Pentium 4 670 понадобилось 309 секунд. Сейчас при работе в POV-Ray 3.7 это время составило 601 секунду. Чтобы удостовериться в правильности сделанного вывода, мы воспользовались старой 64-битной версией программы POV-Ray 3.6.1 (март 2005 г.) и тестовой платформой LGA775. Как ни странно, но и в этот раз подтвердился результат в 309 секунд. Очевидно, что со временем программа совершенствовалась, тем не менее, в более ранних версиях Pentium 4 670 демонстрирует более высокую скорость работы. Autodesk 3ds max: моделирование и рендерингВ первом тесте 3ds max измеряется скорость 3D-моделирования – процесса, отличного от рендеринга. Результаты P4 670 выглядят неплохо на фоне других CPU, что объясняется влиянием графической подсистемы, ограничивающей возможности центрального процессора.Valve VRADВ данном тесте происходит компиляция карты для игры Half-Life 2 с помощью внутреннего инструмента Valve VRAD для создания освещения и световых решений посредством соответствующих расчётов. Практически вне зависимости от того, о каком рендеринговом ПО идёт речь, четыре физических ядра AMD Athlon II X4 635 в сочетании с широкими вычислительными возможностями для выполнения операций с плавающей запятой позволяют ему одержать победу над Core i3-530. Folding@Home: научные и инженерные расчётыВ данном тесте используется бенчмарк Folding@Home benchmark CD. Его автор – один из членов нашей команды, принимающей активное участие в проекте Folding@Home. Проект распределительных вычислений Folding@Home, запущенный учёными из Стэнфордского университета, ставит перед собой цель исследовать фолдинг белков в организме человека (сворачивание белков в определённую пространственную структуру) для борьбы с такими заболеваниями, как болезнь Паркинсона, болезнь Альцгеймера, муковисцидоз и некоторыми другими заболеваниями, вызванными нарушениями в процессе формирования белков. Клиентское программное обеспечение Folding@Home работает в фоновом режиме и выполняет расчёты по моделированию фолдинга белков только при наличии свободных ресурсов CPU. Мы призываем вас стать участником проекта и внести свой вклад в развитие медицинской науки. Более подробную информацию о проекте можно получить по адресу в Интернете http://folding.stanford.edu/. Задания в рамках проекта Folding@Home раздаются с учётом особенностей аппаратной конфигурации компьютерной системы. Например, счётный модуль Gromacs поддерживает дополнительный набор инструкций SSE для CPU Intel, набор команд 3DNow! в процессорах AMD и технологию Altivec на микропроцессорах PowerPC. Folding@Home является ярким примером научных и инженерных расчётов. Бенчмарк Folding Benchmark CD, представляющий собой загрузочный CD-диск на основе Linux, использует наиболее распространённые типы заданий (WU) и осуществляет подсчёт очков, начисленных в течение дня команде, использующей систему на базе той или иной модели CPU. После загрузки с загрузочного диска определяется конфигурация системы (модель CPU и сетевой карты) и IP-адрес для выхода в Интернет и скачивания с одного из многочисленных серверов Folding@Home последних версий счётных модулей (исследовательских ядер). В дальнейшем происходит обработка полученных данных в соответствии с сэмпловыми заданиями каждого из четырёх типов. Так, при наличии двух процессорных ядер нагрузка распределяется следующим образом: первое ядро используется для вычислений в рамках рабочего пакета Tinker WU, а на втором выполняются расчёты по юниту Amber WU. После завершения задания происходит инициализация следующего рабочего пакета – таким образом, процессорные ядра никогда не простаивают. После окончания тестовых расчётов по всем четырём типам заданий осуществляется подсчёт всех начисленных очков и их усреднение. Полученное средневзвешенное значение начисленных в течение дня очков умножается на число ядер, и таким образом определяется общее количество заработанных в течение дня очков, которое характеризует производительность системной конфигурации на базе конкретной модели CPU. Такой способ оценки общей производительности может показаться несколько необычным, но, на наш взгляд, он довольно эффективен. Полученные результаты представлены в соответствии с каждым из четырёх типов заданий, что позволяет оценить уровень производительности каждого CPU при выполнении расчётов по разным типам заданий. Однако результаты для разных CPU по одному и тому же WU в какой-то степени можно считать ненадёжными, поскольку в CPU с поддержкой Hyper-Threading вычисления происходят по нескольким потокам. Чтобы получить наиболее полное и объективное представление о производительности каждого из процессоров в этом бенчмарке, был произведён подсчёт общего количества очков, полученных в течение дня. Эти данные содержатся в последней диаграмме. В нашем последнем бенчмарке четыре ядра AMD Athlon II X4 635 вновь помогли ему опередить своего основного конкурента. Между тем, современный двухъядерник Intel Core i3-530 в течение дня сумел набрать больше очков, чем четырёхъядерный CPU прошлого поколения Core 2 Quad Q6600. Таким образом, в некоторых типах задач два современных вычислительных ядра проявляют себя лучше, чем четыре ядра архитектуры прошлого поколения. [N15-Разгон] Описание процедуры разгона мы начинаем с модели Intel Core i5-661, поскольку в самом первом обзоре, посвящённом этому CPU, процесс разгона подробно не рассматривался. В этом разделе мы также попытаемся оценить потенциал разгона процессоров Intel Core i3-530 и AMD Athlon II X4 635. Как обычно, был проведён комплекс мер по определению максимально возможного значения тактовой частоты процессора, при котором будет возможна стабильная работа системы. Процедура разгона включала в себя изменение базовой частоты (BCLK), повышение напряжения питания процессора и уменьшение множителя частоты памяти с соответствующим температурным мониторингом. При каждом новом повышении тактовой частоты запускался тест стабильности Prime95. Следуя стандартной процедуре, частоту Intel Core i5-661 удалось поднять до невероятных 4,5 ГГц при 1,4 В, что означает 50% повышение по сравнению со штатным значением 3,3 ГГц (напомним, что этот CPU также может автоматически повышать свою частоту до 3,6 ГГц благодаря технологии Turbo Boost). Материнская плата Asus P7H57D-V EVO способствовала максимально комфортному овеклокингу. В ходе манипуляций с базовой частотой (133 МГц) и множителем памяти было подобрано максимальное значение тактовой частоты процессора, при котором система функционировала стабильно. При достижении уровня 4,15 ГГц стало заметно, что CPU сильно греется, а стандартный кулер от Intel не успевает отводить тепло. В тесте на предельную нагрузку 661-я модель работала без сбоев, но нагревалась до 74° C. По этой причине было решено использовать более мощный кулер, с помощью которого процессор удалось охладить приблизительно до 50° C. Перегрев разгоняемого CPU был вызван тем, что в BIOS Setup материнской платы ASUS значение напряжения питания процессора было установлено в положении AUTO. Таким образом, к тому моменту, когда частота CPU достигла максимального уровня 4,5 ГГц, напряжение питания ядра автоматически поднялось до 1,4 В против штатных 1,16 В (отдадим должное интеллектуальным способностям утилиты). Что касается штатного кулера Intel, то подобного рода разгон предполагает обязательное применение более производительной модели. Воодушевляющие результаты для Core i5-661 позволили предположить, что в случае с Core i3-530 удастся достичь того же уровня. Наши ожидания оправдались. Разгон Intel Core i3-530 позволил добиться его стабильной работы при значении базовой частоты 200 МГц и соответствующей тактовой частоте процессора 4,4 ГГц. Таким образом, и в этом случае удалось достичь почти 50% прироста производительности. Каждый раз, когда посредством магического ритуала разгона бесплатно получаешь увеличение скорости наполовину, возникает ощущение радости и душевного комфорта. А вы помните то незабываемое чувство глубокого удовлетворения, когда лет десять тому назад вдруг удавалось разогнать свой Celeron 300A до невероятных 450 МГц? С повышением тактовой частоты до 4,4 ГГц BIOS материнской платы ASUS автоматически поднял напряжение питания до 1,4 В. Для того, чтобы оценить, насколько точно и корректно утилита способна регулировать напряжение питания CPU при оверклокинге, был проведён эксперимент по определению минимального значения напряжения питания CPU, при котором система сможет функционировать стабильно. Вручную выставив значение 1,2375 В (для 4,4 ГГц), мы произвели перезагрузку системы, но её работа оказалась нестабильной. Методом проб и ошибок было найдено искомое значение – 1,3875 В. Полученный результат говорит о том, что при работе с процессорами Clarkdale утилита BIOS прекрасно справилась со своими обязанностями, продемонстрировав способности грамотно управлять напряжением питания процессора. AMD Athlon II X4 635 разгонялся менее охотно. Тем не менее, его частоту удалось поднять со стандартных 2,9 ГГц (1,4 В) до 3,48 ГГц (1,45 В). При этом использовался мощный кулер – такой, какой требуется для 955-го Фенома. Вот как повели себя разогнанные CPU в тестах DIRT 2 и CINEBENCH. Как видно, в разогнанном состоянии процессоры Clarkdale просто «летают», демонстрируя производительность на уровне самых быстрых CPU. Например, в многопоточном тесте Cinebench 661-й двухъядерник от Intel идёт на почти равных с четырёхъядерными Intel Core i5-750 и AMD Phenom II X4 965. Говоря о разгоне, мы не могли обойти вниманием такой немаловажный момент, как сопутствующее ему повышенное энергопотребление. Полученные результаты говорят о том, что современные CPU обладают высоким потенциалом для разгона (хотя при этом он ограничивается максимальным уровнем напряжения и тепловыделения, т.е. процессор может в буквальном смысле сгореть). В такой ситуации может возникнуть вопрос: имеет ли реальный смысл разгонять CPU до таких невероятных высот? Или в итоге получится нечто вроде комнатного нагревателя в виде чипа? Чтобы ответить на этот вопрос, с помощью анализатора Extech 380803 и пакета Cinebench мы провели серию тестов на определение пиковой мощности (Peak power consumption) и мощности, потребляемой системой в состоянии покоя (Idle power consumption). Тестирование проходило с использованием материнской платы Asus на чипсете H57, которая потребляет чуть больше энергии, чем плата Gigabyte на базе системной логики P55 (входила в состав тестового стенда при проведении основной серии тестов на энергопотребление и энергоэффективность). В тесте Idle Power Consumption комбинация «разогнанный AMD Athlon II X4 635 + системная плата Gigabyte MA785G-UD2H» проявила себя как более экономичный вариант по сравнению с конфигурацией «разогнанный Intel Core i3-530 + материнская плата Asus P7H57D-V EVO». Во втором случае зафиксированное в BIOS Setup значение напряжения питания CPU поддерживалось на постоянном уровне 1,3875 В, чем и объясняется высокий показатель мощности, потребляемой системой в состоянии покоя. Как бы то ни было, оверклокинг можно считать вполне оправданным, даже несмотря на неизбежное повышение расхода электроэнергии. Если посмотреть на результаты теста пиковой мощности, можно заметить, что система на базе разогнанного Intel Core i3-530 потребляет энергии меньше, чем тестовая конфигурация с неразогнанным Intel Core i7-870, а AMD Athlon II X4 635 в состоянии оверклокинга требует меньше энергии, чем 965-й Феном. Таким образом, энергопотребление дорогих высокопроизводительных процессоров Intel или AMD и их более доступных собратьев в состоянии разгона находится в пределах одного диапазона. В самой процедуре разгона нет ничего сложного, разве что кулер нужно будет заменить на более мощный. [N16-Оптимальный вариант] Теперь, когда в нашем распоряжении имеется большой объём различных данных, можно дать оценку каждой из тестируемых моделей процессоров с точки зрения комплексного анализа её потребительских свойств. К этой чрезвычайно важной задаче следует отнестись со всей ответственностью, поскольку существует опасность допустить ошибку при расчётах, некорректно сформулировать мысль или исказить эмоциональную составляющую оценки. По этой причине в написании итогового раздела принимала участие команда экспертов. Предлагаем вашему вниманию подробный итоговый анализ производительности по каждому из протестированных процессоров с точки зрения оценки потребительских качеств. Прежде всего, данные для каждого CPU по каждому бенчмарку были собраны воедино и переведены в процентную систему счисления, где в качестве базового уровня (baseline) выступает Intel Pentium 4 670. При подсчёте учитывались результаты практически всех тестов, за исключением чисто синтетических (например, «потоковый» тест памяти Stream). В ситуациях, когда один тест включает в себя несколько модулей/сценариев, рассчитывалось средневзвешенное значение с учётом результатов по каждому из них. Таким образом, при составлении итогового рейтинга соблюдался принцип равенства всех бенчмарков и результатов, полученных в каждом из них. Единственным случаем, когда усреднение данных не производилось, является два теста 3ds max по 3D-моделированию и 3D-рендерингу, поскольку речь идёт о выполнении различных задач. Индекс общей производительности получен методом простого учёта всех данных по всем тестам и не предполагает подробного анализа в аспекте приоритетности или других подобных «изысков». Вместе с тем наш тестовый пакет формировался с прицелом на максимально полный охват процессорного ряда десктопного сегмента, поэтому итоговый рейтинг производительности позволяет получить достаточно полное представление о тестируемых CPU. Следующий этап анализа включает в себя сбор данных о стоимости CPU, содержащихся в официальных прайс-листах Intel и AMD (цена Phenom II X2 550 определялась по данным сайта www.Newegg.com). Стоимость Intel Core 2 Quad Q6600 и Intel Pentium 4 670 указана на момент их появления в розничной продаже. Если взять общую производительность по каждому CPU и поделить на цену, то полученные результаты будут выглядеть так: Эти результаты позволяют получить достаточно полное представление об оценке каждого из процессоров с точки зрения производительности на доллар цены – и здесь CPU из семейства Athlon II выглядят лучше всех. Поскольку в этом случае большую роль играет цена, может возникнуть возражение такого плана: время – деньги, поэтому более дорогие, но быстрые комплектующие на самом деле стоят не так дорого. В этих условиях особую актуальность приобретает проблема оптимального соотношения цены и качества, поэтому мы подготовили график, отражающий именно этот аспект: Чем быстрее CPU, тем выше он расположен на графике; чем дешевле, тем ближе к левому краю; чем лучше соотношение «цена/производительность», тем ближе к левому верхнему углу. Это график удобен тем, что позволяет найти наиболее производительное решение в определённом ценовом диапазоне. Из графика видно, что к процессорам AMD Athlon II X3 и AMD Athlon II X4 примыкают другие более мощные решения с неплохим соотношением цены и производительности, в том числе Intel Core i5-750, AMD Phenom II X4 965, Intel Core i7-920 и даже Intel Core i7-960. На графике отмечены также Intel Core 2 Quad Q6600 и Intel Pentium 4 670. Постепенно мы приближаемся к сути дела. В действительности цена процессора – это лишь составная часть в структуре стоимости компьютерной системы, и конфигурации на базе разных платформ могут сильно отличаться по цене. В ходе активных продолжительных дебатов по вопросу о том, как должна выглядеть типичная конфигурация для каждой платформы, было найдено компромиссное решение. Определяя состав конфигурации для каждого типа платформы, мы преследовали цель минимизировать различия между ними, выбрав в качестве эталонных материнские платы форм-фактора ATX с аналогичной функциональностью уровня компьютерных энтузиастов. Вот что получилось в итоге:
Если принять во внимание фактор цены, результаты будут выглядеть следующим образом: В лидеры неожиданно вырывается Intel Core i5-750. Не забудьте распечатать эту диаграмму и показать её друзьям, родственникам, знакомым! В контексте использованных нами мощных системных конфигураций покупка недорогих CPU, таких как AMD Athlon II X2 255 или Pentium E6500, теряет всякий смысл - лучше доплатить и приобрести гораздо более производительную модель. AMD Athlon II X4 635 чуть опережает своего основного конкурента от Intel. Ниже полученные результаты представлены в виде графика: С включением фактора стоимости расстановка сил изменилась главным образом за счёт того, что LGA775 и LGA1366 процессоры ухудшили свои позиции. Точно так же потеряли привлекательность и недорогие CPU. Неплохо позиционируются Intel Core i5-750 и Intel Core i7-870, в то время как Intel Core 2 Duo E8600, Intel Core 2 Quad Q9400 и Intel Core i5-661 представлены в менее выгодном свете. Но даже производительность на доллар не даёт полного представления о том, что в действительности представляет собой тот или иной CPU. Сегодня не менее важной характеристикой является энергетическая эффективность, которая позволяет с высокой достоверностью судить о месте той или иной модели в общей структуре рынка CPU по нескольким факторам: от стоимости системы в сборе до уровня шума и размера счетов за электричество. Ранее в обзоре уже рассматривались вопросы энергетической эффективности; сейчас мы предлагаем вашему вниманию результаты расчётов энергоэффективности на доллар цены. Intel Core i3-530 расположился в одной из верхних строчек, а 635-й Атлон занял промежуточное положение в центре диаграммы. Тем не менее, предпочтение здесь следует отдать CPU Intel Core i5-750, занявшему первую строчку рейтинга (экономный, но более дорогой). Приведённый ниже график позволяет по-новому взглянуть на полученные результаты. Здесь становится очевидным преимущество новых CPU от Intel. На отметке $700 Intel Core i3-530 демонстрирует значительное превосходство над AMD Athlon II X4 635, а в диапазоне $800 Intel предлагает уже три решения, которые превосходят по этому показателю CPU от AMD. Двухъядерники и трёхъядерники от AMD сгруппировались внизу: дешёвые, но энергетически малоэффективные. [N17-Заключение] В предыдущих разделах приводилось описание подробного анализа репрезентативного тестового пакета CPU. Теперь настало время подвести итоги и сфокусироваться на основных моментах. Для определения лидера в паре «Intel Core i3-530 – AMD Athlon II X4 635» мы руководствовались следующими соображениями. При аналогичной стоимости AMD Athlon II X4 635 предлагает четыре вычислительных ядра, позволяющих получить более высокую производительность при работе с приложениями, оптимизированными под многопоточность. К числу подобного рода задач относятся кодирование видео, 3D-рендеринг и научно-инженерные расчёты (Folding@Home). В остальных сценариях (видеоигры, работа с изображениями) эти CPU идут практически на равных. По уровню общей производительности на доллар цены и производительности с учётом других ориентированных на потребителя качеств с небольшим отрывом лидирует AMD Athlon II X4 635. Если для вас важны именно эти моменты, тогда выбор очевиден. Вместе с тем конфигурация на базе AMD Athlon II X4 635 под нагрузкой потребляет на 50 Вт больше по сравнению с системой на основе Intel Core i3-530. Это обусловлено тем, что один и тот уровень производительности обеспечивается в первом случае четырьмя 45-нм ядрами, а во втором – только двумя вычислительными ядрами, созданными по нормам более «тонкого» 32 нм техпроцесса. Уровень потребляемой 635-й моделью мощности не является аномально высоким для десктопного сегмента, но 530-я модель из семейства Intel Core i3 является в этом смысле образцом для подражания. Только одно это обстоятельство уже способно убедить многих отдать предпочтение CPU от Intel. Добавьте к этому впечатляющий потенциал разгона процессоров на ядре Clarkdale, позволяющий получить 50% повышение рабочей частоты, и чаша весов может раз и навсегда склониться в сторону Intel Core i3-530. Выбор любой из конкурирующих моделей не будет ошибкой, но наша рекомендация – это решение от Intel (в комплекте с мощным кулером). А теперь несколько слов о недорогих моделях. Процессоры AMD Athlon II X2 255 и Intel Pentium E6500 занимают близкие позиции в рейтинге общей производительности на доллар цены и показывают схожие результаты в отдельных тестах. Оба CPU справились с игровыми бенчмарками, сумев обеспечить приемлемый FPS. Их можно рекомендовать для повседневных задач, не требующих большой вычислительной мощности (например, в качестве более производительной альтернативы для двухъядерников Intel Atom). Эти процессоры аналогичны, за исключением того, что решение от AMD в режиме пиковой нагрузки потребляет на 28 Вт больше, хотя Pentium E6500 создан по более старой технологии Intel. Заметим, что в итоговом зачёте по энергоэффективности на доллар цены системы и производительности на доллар цены системы первое место заняла 750-я модель из семейства Core i5. Если вы в полной мере осознаёте важность этих моментов, а в наличии имеется сумма порядка $200 – тогда оптимальным вариантом будет Intel Core i5-750. К сожалению, в число тестируемых процессоров не вошла модель Intel Core i7-860. При стоимости $284 этот CPU имеет преимущество перед Intel Core i5-750 в виде более высокой тактовой частоты и поддержки технологии виртуализации ядер Hyper-Threading при том же TDP 95 Вт. Есть основания считать, что 860-я модель – это самый оптимальный вариант десктопного CPU из всех представленных на сегодняшний день. Надеемся, что в ближайшее время мы сможем провести его комплексное тестирование, а пока, исходя из имеющейся информации, Intel Core i7-860 также можно рассматривать как удачное приобретение. |
Источник: TechReport