Опубликовано 16 июля 2004, 00:33

Gigabyte Radeon X800Pro – начало новой эры ускорения трёхмерной графики

Эта статья посвящена новым продуктам от компании ATI, которые пришли на замену предшествующей 9800 серии...

Еще с очень давних времен, одновременно со многими тестами для определения реальной производительности центрального процессора, мы используем один очень интересный метод. Мы запускаем модифицированный под OpenGL ускорение Quake1 с подложенной в его директорию OpenGL-библиотекой. Этим мы заставляем заработать Quake в режиме трехмерного ускорения без использования видеоускорителя, то есть используя возможности только центрального процессора. Удивительный факт, но год от года скорость в нем растет не так уж сильно, и даже на процессорах в 3 ГГц еле дотягивает до 5 кадров в секунду. При этом даже на  слабых ускорителях трехмерной графики скорость зашкаливает за 100 кадров при аналогичных параметрах. Подобная разница в скорости получается за счет очень многих аспектов, но нам бы хотелось заострить внимание только на некоторых из них.

Как вы понимаете, центральный процессор вынужден обрабатывать задачи, которые вряд ли можно считать однообразными, поэтому его скоростные характеристики должны быть универсальны для всех типов задач – как вычислительных, так и логических. Что же касается графических процессоров, то здесь все более стандартизировано. Обработке графическим процессором подлежат практически однородные массивы данных; более того, многие данные могут обрабатываться одновременно, так как идут в нескольких абсолютно идентичных по структуре потоках, которые не зависят друг от друга. Именно этот факт позволил увеличивать мощности графических процессоров не за счет увеличения тактовых частот, а за счет расширения количества конвейеров. Этот шаг вполне естественен, так как на каждом этапе обработки акселератором трехмерного изображения графический процессор делает примерно идентичные действия, которые несложно предсказать. К примеру, для обработки вершин треугольников требуется три независимых конвейера. Так как вершины рассчитываются независимо, то они могут рассчитываться параллельно, а модуль контроля над конвейерами может правильно распределять задачи между ними в зависимости от исполняемой программы вершинного шейдера. То же самое происходит и с пиксельными операциями, только, в отличие от вершинных конвейеров, на пиксельную часть процесса подготовки изображения приходится гораздо большая нагрузка, чем на вершинный модуль, поэтому количество пиксельных конвейеров обычно заметно больше. Мы не будем вдаваться во внутреннюю логику всех конвейеров, реализованных в нынешних поколениях графических процессоров, а лишь отметим, что с усложнением ускорителей эта логика становится все более сложной и нетривиальной.

Именно в свете всего вышеизложенного можно понять, почему возросла производительность последнего поколения карт ATI и NVIDIA. Основным поводом для увеличения производительности послужила возможность двукратного наращивания количества конвейеров – как вертексных, так и пиксельных. Это повлекло практически двукратный прирост производительности во всех современных приложениях, использующих трехмерное ускорение и не зависящих от производительности центрального процессора. Но за все приходится платить, поэтому вместе с производительностью выросло и количество транзисторов внутри графического ядра.

Эта статья посвящена новым продуктам от компании ATI, которые пришли на замену предшествующей 9800-й серии. Новые акселераторы серии X800 на базе графических процессоров R420 и R423 являются в настоящий момент топовыми ускорителями от ATI и поставляются в двух версиях – для шины PCI-Express и для шины AGP8x. Последняя на сегодняшний день имеет наибольшее распространение, и, тем не менее, по мнению многих аналитиков, через некоторое время это соотношение будет сдвигаться в сторону шины PCI-Express. Переходя к рассмотрению этих карт, хотелось бы немного окунуться в историю компании ATI.

После выпуска ATI 9700Prо на базе графического ядра R300 компании ATI завладела весьма твердыми позициями на рынке ускорителей трехмерной графики. Ядро R300 получилось удачным в плане производительности,  хотя и имело некоторые минусы, которые, кстати, были устранены в следующей ревизии R350 и картах на его базе ATI R9800. Новый графический процессор R420 или R423 для PCI-Express версии, установленный в картах ATI X800, имеет очень много общего с R300, но, тем не менее, это абсолютно новое графическое решение – как с точки зрения функциональности, так и с точки зрения производительности. Новая серия акселераторов X800, по мнению ATI, будет лидером в течении полугода. Серия X800 состоит из двух продуктов – X800 Pro и X800 XT, – которые различаются как частотой, так и количеством пиксельных конвейеров.

R420 отличается от своего предшественника R360 наличием 16 пиксельных конвейеров и 6 вертексных конвейеров, то есть у R420 на 8 пиксельных и 3 вертексных конвейера больше, чем у R9800XT. Посмотрите на таблицу с техническими характеристиками, которую мы приводим ниже.

R9800XTNV GeForceFX 5950UltraX800 ProGeForce 6 6800X800 XTGeForce 6 6800Ultra
Кодовое имя ядраR360NV38R420NV40R420NV40
Техпроцесс0,150,130,130,130,130,13
Количество транзисторов, миллионов115135160220160220
Количество вертексных конвейеров4Адаптивно6666
Количество пиксельных конвейеров8812121616
Версия DirecrX9.0b9.0b9.0b9.0c9.0b9.0c
Тип и количество памятиGDDR2, 256МбайтGDDR2, 256МбайтGDDR3, 256МбайтGDDR3, 256МбайтGDDR3, 256МбайтGDDR3, 256Мбайт
Частота графического процессора, МГц412475475350520400
Частота памяти, МГц, DDR730950900100011201100

Как можно заметить, у новых карт ATI X800 многие параметры похожи на конкурентные продукты от NVIDIA, принадлежащие к серии GeForce 6. У NVIDIA анонсировано два продукта, и, так же как и у ATI, различия между этими продуктами есть и в частоте, и в количестве используемых пиксельных конвейеров. Сильно бросающаяся в глаза разница между NVIDIA GeForce 6 и ATI X800 заметна в моменте энергопотребления, который у X800 серии заметно ниже серии GeForce 6 у NVIDIA. Действительно, карты на базе R420 занимают всего один слот вместе с системой охлаждения и не очень длинные – соответственно, легко убираются в небольшие корпуса. Они не требуют сверхмощного блока питания, который требуется при использовании продуктов NVIDIA и, соответственно, выделяют меньше тепла. Это связано с количеством транзисторов, используемых внутри R420, и спецификой техпроцесса. При количестве в 160 миллионов транзисторов и технологическом процессе в 0,13 микрон тепловыделение действительно находится в пределах разумного. Если же еще учесть, что многие модули еще первого R300 доводились инженерами ATI очень тщательно, а 0,13-микронный техпроцесс был обкатан на RV350 – удешевленной версии полноценного R350, – становится понятно, что R420 и должен был таким получиться. NVIDIA же совершила ошибку еще при создании NV30, переведя производство на 0,13-микронный техпроцесс одной из первых и взяв на себя расходы по обкатке всей технологии техпроцесса на заводах-изготовителях микропроцессоров. С другой стороны, у них не было выбора, так как чип NV30 вмещал в себя уже больше 125 миллионов транзисторов и никак не влезал в предыдущий 0,15-микронный техпроцесс. Он был бы слишком большим. Теперь, при создании GPU NV40, который все так же имеет в корнях предыдущий, не очень оптимизированный чип NV30, и двукратном расширении всех конвейеров, NVIDIA получила 220 миллионов транзисторов. А это даже для 0,13-микронного техпроцесса немало. Отсюда жуткое энергопотребление, тепловыделение и все прелести, с этим связанные – например, требование 480 Вт в блоке питания и необходимость подключать два разъема питания к карте, находящихся на независимых линиях. Также стоит отметить, что при таком количестве транзисторов количество полностью работоспособных процессоров будет далеко не стопроцентным – существует вероятность создания дефицита GPU NV40 на рынке. В случае с R420 все проще, так как 160 миллионов при 0,13-микронном техпроцессе – это задача средней тяжести, соответственно, процент полноценно рабочих чипов будет заметно выше. А отсутствие столь жестких требований по питанию у карт X800 делают их интересными для применения в компактных системах – например, в barebone.

Но на этом разница между NVIDIA GeForce 6 и ATI X800 не заканчивается, и, хотя эта статья посвящена продуктам ATI, этот момент мы не можем оставить неосвещенным. Версия поддерживаемых шейдеров у плат X800-й серии представляет собой слегка дополненную, но вторую версию – соответственно, поддерживается DirectX9.0b. Что же касается продуктов NVIDIA, то здесь все более интересно, так как NVIDIA GeForce 6 поддерживает третью версию пиксельных и вертексных шейедров и DirectX 9.0c. Таким образом, продукт NVIDIA является продуктом следующего поколения по сравнению с ATI X800, и, с точки зрения технологического прогресса, технологии, реализованные в NVIDIA GeForce 6 – это нечто новое на рынке, причем не имеющее аналогов среди ускорителей для рядового пользователя. Но есть один осложняющий ситуацию момент, который вносит путаницу в этот вопрос. Большая часть производителей игр, даже имея в руках инструментарий для написания шейдеров третьей версии, вряд ли бросится переписывать свои шедевры под DirectX9.0с, так как еще не все пользователи имеют поддержку второй версии шейдеров у себя дома, не говоря уже о третьей. Также с выходом операционной системы Microsoft Windows Longhorn, который не за горами, появится четвертая версия шейдеров и DirectX NEXT, которые продиктуют новые требования к аппаратному обеспечению и вообще изменят много стабильных на настоящий момент понятий. Таким образом, третья версия шейдеров может оказаться в середине и не получить широкого распространения в ближайшее время, так как производители игр предпочтут выпускать свои следующие творения после второй версии шейдеров сразу же на четвертой. Единственное, что можно сказать однозначно – в  настоящий момент толку от третьей версии шейдеров нет практически никакого. Эта ситуация может измениться к концу года, но вряд ли кардинально.

Переходя к рассмотрению внутренних особенностей R420, хотелось бы начать с его структуры и основных отличий этого чипа от предыдущего – R360. Но перед этим хотелось бы отметить, что мы не будем вдаваться в этой статье в глубинные вопросы технологий и разбирать каждый пункт улучшения по атомам, а просто кратко по ним пробежимся. Структура R420 организованна таким образом, что все пиксельные конвейеры разбиты модулями по четыре.

pixel-architect.jpg

pixel-architect.jpg

Эта особенность предоставляет возможность модульного отключения конвейеров и  получения за счет этого удешевленных версий карт. Этот подход очень удобен производителям, так как в ход идут чипы, которые не прошли тестирование для полноценной работы. К примеру, у чипа не работает третий модуль из четырех пиксельных конвейеров ввиду погрешностей техпроцесса. Отключив этот модуль, компания получает полноценный чип, но с 12 конвейерами вместо 16, который можно устанавливать на карты X800 Pro. Также можно отключить еще один модуль, и тогда конвейеров останется 8, или оставить вообще один. Если вы помните, на платах 9500-й серии с полноценными чипами R300 была возможность логической разблокировки четырех заблокированных пиксельных конвейеров и модуля Hyper-Z. Когда это получалось, из карты стоимостью чуть больше 200 долларов удавалось выжать производительность на уровне полноценной 9700-й платы. Как вы понимаете, в случае с X800 логика очень похожая,  поэтому заблокированные модули иногда можно будет разблокировать. Это "иногда" будет выбираться самой ATI еще на заводе, и если модуль не заработал в принципе, то он будет заблокирован аппаратно. Если же модуль работает, но имеет отклонения от нормальной стабильности, то он будет заблокирован логически, и пользователь сможет его разблокировать на свой страх и риск. Значит, будем ждать патчей, которые будут превращать X800 Pro в X800 XT без помощи паяльника.

Отдельного упоминания заслуживает память стандарта GDDR3, устанавливаемая на x800-ю серию видеокарт. В прочем, память GDDR3 устанавливается и на карты серии GeForce 6, так как стандарт GDDR3 разработан Объединенным инженерным советом по электронным приборам (JEDEC), в состав которого входят ATI и NVIDIA. То есть данный стандарт памяти разрабатывался совместно многими компаниями.  Модули памяти GDDR3 производятся по 0,11-микронному техпроцессу, обладают пониженным энергопотреблением и улучшенной пропускной способностью по сравнению с GDDR 2.

memory-architect.jpg

memory-architect.jpg

В чипы R420 и R423 установлен четырехканальный контроллер памяти, имеющий  структуру, приведенную на рисунке выше. Как видно, очень немногое изменилось со времен R300.

Далее – в серии X800 появилась возможность написания более длинных шейдеров. Теперь можно использовать по 1536 инструкций вместо 160 в R360, по 512 инструкций на три разных типа – векторных, скалярных и текстурных. В настоящий момент количество используемых в шейдерах инструкций редко превышает 100, так что, с точки зрения ATI, данные параметры сделаны с запасом, однако стоит отметить, что у NVIDIA GeForce 6 данный вопрос решен с большим размахом. Также в R420 теперь имеется 32 временных регистра для написания шейдеров. А еще ATI реализовала новую технологию сжатия карт нормалей 3Dc, при помощи которой можно добиться значительно большей четкости изображения. Разницу в изображениях с использованием 3Dc и без нее можно увидеть на картинке, приведенной ниже.

normalmaps.jpg

normalmaps.jpg

Инженеры ATI утверждают, что внесение поддержки технологии 3Dc для очень многих производителей будет безболезненным и пройдет довольно легко. Также изменения коснулись системы создания антиалиасинга в изображении. Теперь маску, по которой сглаживается изображение, можно менять программно, и за счет этого появилась возможность реализации темпорального антиалиасинга. Технология темпорального антиалиасинга основана на быстрой смене четных и нечетных кадров с наложением разных масок антиалиасинга для каждого из них. Таким образом, сложив две разные маски двухсемплингового антиалиасинга для четных и нечетных кадров, можно получить четырехсемплинговый антиалиасинг без потерь в производительности.

temporal.jpg

temporal.jpg

То есть система темпорального антиалиасинга может по праву считаться бесплатным удвоением качества антиалиасинга без потерь в производительности, но, как известно, за все приходится платить. Темпоральный антиалиасинг работает только при включенной вертикальной синхронизации (V-Sync) и количестве генерируемых в игре кадров больше 30 FPS. C нашей же точки зрения, минимальная производительность акселератора в игре при использовании этой технологии должна быть не меньше 60 FPS, в противном случае будет видно мерцание изображения.

Что же касается PCI-Express версий карт, то на них будет устанавливаться специально модифицированный чип R423 с нативной поддержкой шины PCI-Express. Это очень большой плюс,  так как отсутствие мостов, служащих переходниками между AGP-шиной и PCI-Express на карте существенно снижает общий уровень энергопотребления. Также X800-я серия на базе PCI-Express будет избавлена от дополнительного разъема питания, так как энергопотребление видеосистемы не превышает 75 Вт, а это означает, что по спецификациям PCI-Express плата может работать через систему питания материнской платы. Различий в частотах и прочих технических характеристиках у AGP и PCI-Express карт не будет – соответственно, вся разница в производительности между ними будет только за счет использования шины PCI-Express.

Конкретика и практика

perspective.jpg

perspective.jpg

Но теория останется теорией, если ей не найдется практического применения. Поэтому в сегодняшнем обзоре мы бы хотели рассмотреть карту X800Pro от компании Gigabyte и сравнить ее как с конкурентами, так и со старшей моделью – X800XT.

Технические характеристики карты Gigabyte Radeon X800 Pro
Производитель картыGigabyte
Графический процессорR420
Частота чипа, МГц475
ПамятьGDDR3, 256 Мбайт
Частота памяти, МГц450 (900)
Ширина шины памяти, бит256
ИнтерфейсAGP 8x
RAMDAC2x400 МГц
Количество вертексных конвейеров6
Количество пиксельных конвейеров12
APIDirectX 9.0b, OpenGL 1.5
Контроль системы охлажденияприсутствует
Дополнительное питаниеТребуется
Разъемы подключения мониторовD-Sub и DVI
Наличие TV-OutДа
Наличие TV-INНет
Цена, $500-600

Позиционирование карты производителем

С недавнего времени, карты ATI X800pro уже продаются в Москве по цене 500-600 долларов. Подобная стоимость однозначно ставит X800Pro в разряд ускорителей класса Hi-End, однако здесь есть несколько нюансов. Предыдущий топовый продукт ATI –  9800XT – до недавнего момента обладал схожей стоимостью с нынешней ценой X800Pro, притом,  что производительность ATI X800 по заявленным характеристикам превышает 9800XT в полтора или даже два раза. Таким образом, актуальность 9800XT при цене в районе 400 долларов находится под большим вопросом. Также существует вероятность, что цена на X800Pro будет снижена после поступления на прилавки карт на базе X800XT. Но к настоящему моменту X800Pro можно считать самым быстрым ускорителем из всех продающихся на прилавках видеокарт, так как продукты конкурентов в розничную сеть еще толком не поступили. Стоит отметить, что на конечную стоимость любого продукта накладывает свой отпечаток производитель, так как именно он формирует комплектацию карты и всех сопутствующих ей элементов – таких, как система охлаждения и прочее.

Упаковка  

box.jpg

box.jpg

Похоже, что, начиная с этого продукта, компания Gigabyte решила присоединиться к славному сообществу производителей видеокарт, выпускающих свою продукцию в огромных упаковках. Коробка для X800 Pro выглядит очень впечатляюще и даже обладает ручкой для переноски на большие расстояния. Внешняя оболочка выполнена из тонкого глянцевого картона с красивым рисунком. Внутри нее находится более плотная коробка из белого картона, в которой находится комплект поставки.

Комплект поставки

Комплект поставки от Gigabyte нельзя назвать слишком большим или слишком маленьким – он разумный. В этот пакет входят те продукты, которые могут потребоваться пользователю в первое время – здесь есть две игры, Power DVD,  диск с драйверами, а также диск 3D-Album, позволяющий просматривать картинки в трехмерном изображении или создавать из них трехмерные эффекты. Кроме того, в комплекте поставки присутствует документация на английском и китайском языке. Русского языка, как всегда, не наблюдается. Информативность документации стоит под вопросом, тем не менее основные моменты из нее почерпнуть можно.  

complect.jpg

complect.jpg

Также в комплекте поставки имеются кабели для подключения телевизора – один S-Video, один Composite, а также провод для подключения телевизора через интерфейс HDTV и переходник с композитного выхода на S-Video. Приятно, что в комплекте имеется стандартный разветвитель питания, без которого подключить карту на некоторых компьютерах бывает весьма непросто.

Карта

front.jpg

front.jpg

Переходя к описанию самой карты,  хотелось бы сказать несколько слов обо всех дизайнах PCB, которые были у ATI до этого. Компания начала формировать дизайн печатной платы подобного вида еще для карт на базе R300 (R9500-R9700Pro). Все последующие ускорители, которые были на рынке хоть какое-то время топовыми продуктами, слегка похожи внешне друг на друга. Это красный текстолит, на котором чип находится чуть выше AGP-разъема, с модулями памяти, расположенными по бокам от него. Карта на базе X800 Pro выглядит весьма похоже на предыдущую модель 9800XT. 

wo_rad.jpg

wo_rad.jpg

Создается впечатление, что многие элементы сохранили свое местоположение, хотя это совсем не так. Модули памяти GDDR3 требуют меньшей обводки для стабильной работы, поэтому стало меньше конденсаторов на плате и прочей мелочевки.

gpu_mem.jpg

gpu_mem.jpg

На карте установлен графический процессор R420, произведенный на 16 неделе 2004   года, что соответствует примерно концу апреля. Графический процессор работает на частоте 475 МГц. Эта частота заметно выше частоты для 9800XT, а это означает, что даже по частотным характеристикам скорость должна быть выше без учета расширения количества конвейеров, которых стало на 4 больше.

Модули памяти в форм-факторе BGA от компании Samsung расположены с двух сторон платы – по четыре на каждой – и имеют маркировку K4J55323QF-GC20. В соответствии с этой маркировкой, память имеет время выборки 2 нсек и способна работать на частоте в 500 МГц (1000 МГц DDR); тем не менее память по умолчанию работает на частоте 450 МГц  (900 МГц DDR), создавая некоторый запас по прочности. Эти модули памяти являются младшими моделями в линейке GDDR3 от компании Samsung. Старшая модель способна работать на частотах до 700 МГц (1400 МГц DDR), так что стоит ожидать карт с более быстрой памятью от других производителей. Впрочем, мы отвлеклись. Возвращаясь к карте от Gigabyte, хотелось бы сказать, что плата точно повторяет оригинальный дизайн от ATI без дополнений, чего нельзя сказать о системе охлаждения карты.

Система охлаждения

radi_back.jpg

radi_back.jpg

Внешне система охлаждения карты выглядит очень похоже на классическую систему охлаждения от ATI. Тем не менее основной рисунок, установленный сверху, отличается от оригинального дизайна ATI. Но на этом разница не заканчивается, так как компания Gigabyte переработала конфигурацию радиатора и сделала так, чтобы система охлаждения соприкасалась одновременно с графическим процессором и модулями памяти, расположенными на верхней части видеокарты. Все бы ничего, однако, с нашей точки зрения, организация системы охлаждения через подобные прослойки дает скорее обратный эффект, нежели реально охлаждает память.

memory_rad.jpg

memory_rad.jpg

Два или три миллиметра "теплопроводящей" прослойки отводит тепло от четырех модулей памяти на медный радиатор. С обратной стороны видеокарты система охлаждения не установлена, что окончательно сводит к нулю эффективность охлаждения памяти. К охлаждению графического процессора у нас никаких претензий не возникло, так как прилегание радиатора обеспечивается жесткой скобой с обратной стороны платы, а между радиатором и ядром присутствует качественная термопаста. Заслуживает упоминания элегантная подсветка кулера синими светодиодами, которые у Gigabyte встречаются уже на очень многих продуктах. Вентилятор, установленный на систему охлаждения, контролируется с помощью отдельного провода и работает практически бесшумно. Вместе с системой охлаждения карта без проблем умещается в один слот компьютера, тем не менее мы не рекомендуем ставить другие платы прямо впритык к радиатору, так как это может существенно ухудшить охлаждение карты, что скажется на стабильности и потенциале для разгона.

Драйвера

Хотелось бы еще раз упомянуть, что в последнее время ATI начала вести политику по ежемесячному обновлению драйверов. Это плохо и хорошо одновременно. С одной стороны, ATI в каждой версии устраняет какие-то серьезные ошибки, с другой – размер драйвера в 27 Мбайт может позволить себе скачать не каждый человек. В особенности, это касается тех, кто сидит на dialup-соединении, и жестко лимитированных по трафику пользователей. Также это существенно осложняет работу по переделке сторонних драйверов. Поэтому использование драйверов от вендоров видеокарт понемногу становится на грань смысла. Куда удобнее скачать драйвера с сайта ATI, чем ждать, пока их переделает компания-производитель карты. На настоящий момент существует версия драйвера ATI Catalyst 4.6, в которой первая цифра означает последнюю цифру года, а вторая цифра – месяц. По этой версии можно понять, что она выпущена в июне 2004 года. Именно на этой версии мы и проводили наше тестирование.

Разгон

Карта от Gigabyte показала весьма неплохую статистику для разгона, хотя могла бы быть и лучше. Модули памяти разогнались до частоты в 508 МГц, что означает 1016 эффективных. Что касается графического процессора, то он показал отличный потенциал для разгона и сумел обогнать по частоте даже старшую модель ATI X800XT, разогнавшись до частоты в 530 МГц. И хотя память удалось разогнать выше указанной производителем отметки в 1000 МГц, создалось ощущение, что если улучшить охлаждение памяти, то, возможно, удастся еще больше увеличить частоту.  С обратной стороны платы нет никаких препятствий для установки сторонних радиаторов для охлаждения модулей памяти, что же касается охлаждения памяти сверху видеокарты, то тут придется покопаться и приложить фантазию, так как заменить пропиленовые прокладки будет очень непросто. Так как потенциал разгона нам показался интересным, мы протестировали карту в разогнанном состоянии по полному тестовому циклу, поэтому результаты разгона будут участвовать во всех тестовых графиках, отображающих разницу производительности с другими картами.

2D, TV-in TV-Out и Выходы карты

На всех режимах карта показала отличное качество 2D-картинки. Никаких артефактов и проблем не было замечено ни на одном из выходов видеокарты. Однако стоит учитывать, что этот параметр очень сильно зависит от монитора, кабеля и качества всех соединений. Карта обладает двумя RAMDAC на 400 МГц и способна поддерживать разрешения до 2048x1536 пикселей. Как всегда, первый RAMDAC обслуживает монитор D-Sub, а DVI и TV-Out делят между собой второй RAMDAC. TV-Out на плате имеет разъем S-Video, при этом подключение к композитному входу телевизора осуществляется через переходник. Подобная система удобна, так как не требует никаких специфичных кабелей, и при наличии переходника можно подключить обыкновенный провод RCA или S-Video любой длины.

Тестирование

Всю методику нашего тестирования вы можете прочитать в нашей статье, посвященной  этому вопросу. Сразу же оговоримся, в этой части обзора мы очень часто будем ссылаться на статью по методике, так как описывать в каждом обзоре цели использования всех тестов, способы тестирования, а также узкие моменты, присущие тестированию всех современных графических ускорителей, вне зависимости от производителей и моделей, мы считаем нецелесообразным. Статья по методике постоянно дополняется. Тем не менее основные моменты мы хотели бы повторить:

Конфигурация нашего тестового стенда состоит из следующих компонентов:
• Процессор Intel Pentium 4 3.0 ГГц Northwood Hyper-Threading;
• Материнская плата ABIT AI7 865PE (512 Мбайт DDRRAM PC3200, AGP 8x);
• Звуковая карта Creative Sound Blaster Audigy;
• Жесткий диск Seagate Barracuda ATA IV 7200 rpm.

Наша тестовая лаборатория благодарит компании ABIT и PatriArch за предоставленное для тестовых стендов оборудование

Как видно, эта тестовая станция не является в настоящий момент представителем Hi-End-сектора рынка, однако она считается достаточно мощной для создания правильного баланса между современными графическими ускорителями и процессорной мощностью, а потому не будет являться узким местом в процессе тестирования. Также эта станция представляет собой наиболее распространенную среди продвинутых пользователей конфигурацию.

Мы провели тестирование в следующих программах.

  1. 3D Mark 2001 SE Ver330
  2. Quake3- Arena
  3. Codecreatures Benchmark Pro
  4. Unreal Tournament 2004
  5. Unreal 2
  6. Doom III Demo
  7. SeriousSam 2
  8. Tomb Raider 5
  9. HALO 
  10. Aquamark.
  11. FarCry

Во всех графиках тестируемая карта Gigabyte Radeon X800Pro выделена красным цветом. Зеленым выделены результаты разогнанной Gigabyte Radeon X800Pro до частот в 530 МГц для графического процессора и 1016 МГц – для модулей памяти.

Перед началом тестирования хотелось бы сказать о других участниках соревнования. В первую очередь, в тесте участвует оригинальная X800XT с 16 конвейерами – она выделена синим цветом. Далее, в тесте присутствует 9800XT для сравнения производительности с предыдущей топовой моделью ATI – она отмечена желтым цветом. Наконец, в тесте присутствует карта от конкурентов ATI – NVIDIA GeForce6 6800GT, –  которая обладает всеми 16 конвейерами, но, в отличие от топового продукта NVIDIA GeForce6 6800Ultra, работает на пониженных частотах. К более полному тестированию продуктов от NVIDIA мы вернемся позднее, а сейчас – "Let Mortal Combat begin".

Оценка прямой производительности, без использования AA и анизотропии

3D Mark 2001 SE Ver330

image019.gif

image019.gif

Этот тест показывает производительность в старых играх DirectX 7, коих значительно больше, чем современных. Как можно заметить, производительность слегка падает только у 9800XT – все остальные карты насмерть висят на процессоре. Проблему процессорозависимости мы обсудим чуть позднее, а сейчас посмотрим на следующий график.

image018.gif

image018.gif

Этот тест подделывали все кому не лень – именно этим он и интересен. Он показывает разницу в производительности карт на настоящий момент в приложениях DirextX 8.0 при использовании шейдеров первой версии. Как можно заметить, X800XT идет впереди на всех разрешениях, так как 16 конвейеров дают себя знать. Далее идет разогнанный Gigabyte Radeon X800Pro, а затем – неразогнанный. NVIDIA 6800GT показала результаты  ниже Gigabyte Radeon X800Pro на средних разрешениях и почти идентичные результаты на верхнем и нижнем разрешенияъ. 9800XT, конечно же, заметно отстала от конкурентов  примерно в полтора раза от Gigabyte Radeon X800Pro и в два – от X800XT. Странно писать так о 9800XT, когда совсем недавно ее лидерство было абсолютно неоспоримым. Прогресс, ничего не поделаешь.

Q3A

8

8

Этот тест демонстрирует нам, как правильно надо виснуть на процессоре. Кажется, что даже если включить абсолютно все настройки на максимум, производительность не упадет в принципе. Что забавно, до последнего времени этот тест почти на всех картах показывал линейное падение скорости. Теперь для увеличения количества кадров нужен более мощный процессор. Однако карта NVIDIA 6800GT показала чуть более высокие результаты почти на всех разрешениях. Только к верхнему разрешению картина приняла вид, напоминающий реальный расклад сил между продуктами от ATI и NVIDIA.

Codecreatures Benchmark Pro

16

16

Тест под DirectX8.0, напоминающий по своей сути 3Dmark 2001 SE – Nature. Хотите интересный факт? До определенной версии драйверов от NVIDIA в этом тесте ее продукты показывали отвратительные результаты, а в 3Dmark 2001 SE - Nature превосходные. Так вот, с версии 53.03 этот расклад изменился с точностью до наоборот. О чем это говорит, вам решать, но факт странный. В нижнем разрешении выиграла разогнанная версия Gigabyte Radeon X800Pro, после нее идет NVIDIA 6800GT, а затем – неразогнанная Gigabyte Radeon X800Pro. X800XT оказалась на нижнем месте. Иногда тактовая частота внутри чипа важнее количества пиксельных конвейеров. Но к верхним разрешениям картина приняла стандартный расклад.

Unreal Tournament 2004

11

11

В новой версии Unreal Tournament технические требования стали выше, но в целом суть не изменилась, так как основное требование к игре – это кадры в секунду. На нижних разрешениях все карты, кроме 9800XT, сдерживаются мощностью процессора. К верхним  в явные лидеры вырывается X800XT, заметно оставляя позади Gigabyte Radeon X800Pro. Примерно на тот же порядок от Gigabyte Radeon X800Pro отстает NVIDIA 6800GT. И с жутким проигрышем по производительности 9800XT находится позади всех.

10

10

Закрепим результаты более тяжелым в графическом плане уровнем из UT2004. Картина почти идентична предыдущему графику, за исключением меньшей процессорозависимости и большей потери производительности аутсайдером 9800XT.

Unreal 2

14

14

Похоже, что Unreal 2 тоже медленно и верно теряет позиции интересного тестового пакета. Как можно заметить, почти все карты показали жесткую зависимость от центрального процессора, и только к верхним разрешениям карта Gigabyte Radeon X800Pro отлипла от своих 100 FPS и начала работать на полную мощность. NVIDIA 6800GT снова продемонстрировала неплохое поведение в условиях нехватки процессорной мощности и выиграла целых 3 кадра у конкурентов почти на всех разрешениях, кроме верхнего. 9800XT начала терять производительность, начиная с разрешения 1280х1024 пикселя.

Doom III Demo

15

15

Наконец-то карты от NVIDIA стали запускаться в этом тесте без ухищрений. Приходит в голову мысль, что они до этого не запускались не просто так, так как результаты у NVIDIA 6800GT средненькие, особенно в нижних разрешениях. Gigabyte Radeon X800Pro показала стандартные результаты, и их вряд ли можно назвать плохими. С другой стороны, особо сильный прирост наблюдается только у ATI X800XT, а все остальные карты как-то группируются вместе. Хотя стандартное соотношение сил видно по всем графикам.

SeriousSam 2

13

13

Снова все карты повисли на процессоре, начав терять в скорости только к верхнему разрешению. Карта NVIDIA 6800GT снова показала себя как наименее процессорозависимая; с другой стороны, этот тест всегда любил карты NVIDIA.

Tomb Raider 5

12

12

А этот тест всегда не любил карты NVIDIA, но в этот раз решил исправиться, хотя и не до конца. X800XT снова обогнала всех, что было предсказуемо. В нижних разрешениях результаты ограничены центральным процессором, а в верхних – стандартный расклад сил. Gigabyte Radeon X800Pro работает на одном уровне производительности с NVIDIA 6800GT, а 9800XT заметно проигрывает.

HALO

9

9

Странная игра, которая любит притормозить в нижних разрешениях. Все карты, кроме 9800XT, висят на процессоре. NVIDIA 6800GT выиграла у всех за счет меньшей процессорозависимости.

Aquamark

7

7

Этот тест – очень тяжелый и совсем недавно считался чуть ли ни стресс-тестом для видеосистемы. А теперь он также повис на процессоре, как и многие другие. Gigabyte Radeon X800Pro выиграл по производительности у X800XT. При этом NVIDIA 6800GT выиграла у всех, что можно снова объяснить меньшей зависимостью от процессора.

FarCry

6

6

Но не всегда зависимость от процессора означает выигрыш NVIDIA. Странно, что даже игра FarCry с тяжелейшей графикой хочет многого не от графической карты, а от процессора. В этом тесте X800XT – снова лидер в верхнем разрешении. В неявных аутсайдерах – NVIDIA 6800GT, полностью повисшая на процессоре во всех разрешениях в районе 46 кадров в секунду. 9800XT потеряла производительность в верхних разрешениях.

Тестирование падения производительности от использования AA и Анизотропии

Для современных видеоускорителей использование анизотропии и антиалиасинга очень важно, так как во многом эти функции становятся бесплатными в большинстве не очень требовательных к ресурсам игр из-за недостатков мощности центрального процессора.

Tomb Raider 5

image002.gif

image002.gif

В нижних разрешениях потерь производительности от использования антиалиасинга не наблюдается, к верхним же потери становятся линейными, но не фатальными. Только в разрешении 1024x768 пикселей падение стало очень заметным.

Codecreatures

3

3

Абсолютная линейность падения производительности вследствие использования антиалиасинга в этом тесте обуславливается большим количеством полигонов и достаточно сильной загрузкой графического процессора. Обратите внимание на то, что есть некоторая лесенка зависимостей. Для примера – 4xAA соответствует 2хАА на следующем разрешении и так далее. В целом, потери от использования антиалиасинга составляют треть от всего количества кадров – между отключенным антиалиасингом и четырехсемплинговым антиалиасингом на любом разрешении.

Aquamark

image001.gif

image001.gif

Как вы, наверное, помните, этот тест в сравнениях производительности слегка повис на центральном процессоре. При этом к верхнему разрешению производительность начала падать и без использования антиалиасинга. Пользоваться вышеприведенным графиком следует так – чем темнее цвет, тем выше уровень анизотропии. Зеленым цветом отмечены результаты без использования антиалиасинга, желтым – двухсемплинговый антиалиасинг, синим – четырехсемплинговый, красным – шестисемплинговый. Как видно, в разрешении 640х480 пикселей падение производительности минимально и составляет всего лишь 3 кадра при среднем количестве в 58 FPS. В разрешении 800x600 пикселей среднее количество кадров упало до 56 FPS, а разница составила уже 5 кадров. К разрешению 1024х768 пикселей линия падения стала более пологой, и разница между отсутствием функций и полностью включенными функциями анизотропии и антиалиасинга составила уже 8 кадров, а средняя упала до 53 FPS. В максимальном разрешении разница была уже 13 FPS, а среднее количество кадров в секунду было в районе 39 FPS. От использования анизотропной фильтрации производительность падала, но при этом не имело значения качество анизотропной фильтрации.

Выводы

Как можно заметить, новые продукты от ATI имеют отличные скоростные характеристики, которые стали заметно выше предыдущей топовой карты - ATI 9800XT. В среднем производительность ATI X800Pro выше ATI 9800XT в полтора раза, а ATI X800XT выше ATI 9800XT – в два. GeForce6 6800GТ от компании NVIDIA тоже показал весьма неплохие результаты, особенно в вопросах, касающихся процессорозависимости, которая постепенно становится серьезной проблемой. Если обратить внимание на количество тестов, где производительность X800 серии сдерживалась центральным процессором, становится понятно, что именно он является во многом ограничивающим фактором, уравнивающим возможности 9800XT и всех его оппонентов. С другой стороны, CPU на нашей тестовой станции имеет частоту 3 ГГц, а это немало. Поэтому нужно понимать, что покупка современных ускорителей для компьютеров, где мощность процессора ниже 2,5 ГГц, абсолютно нецелесообразна, так как многие игры будут все равно от него зависеть, даже если включить максимальное разрешение и активировать антиалиасинг с анизотропией. Производительность Gigabyte Radeon X800Pro меньше старшей модели X800XT. Разгон Gigabyte Radeon X800Pro слегка сглаживает эту разницу, но все равно ее не убирает. В настоящий момент количество игр, требующих подобной мощности от графического акселератора, практически нет, но в ближайшее время они должны появиться. Поэтому, если у вас стоит 9800XT или даже 9700Pro, то апгрейд вряд ли целесообразен сейчас – лучше купить ускоритель, когда он реально потребуется. С другой стороны, если вы покупаете компьютер, то покупка карты ATI X800Pro имеет смысл в течение ближайшего полугода или года – только обязательно позаботьтесь о правильном балансе с процессором. О покупке и конкурентности ATI X800Pro с GeForce6 6800GТ мы будем говорить после того, как этот продукт появится в магазинах, получит достаточное распространение и понятную стоимость для конечного покупателя.

Переходя к выводам о Gigabyte Radeon X800Pro, хотелось бы сказать, что эта карта показала отличную стабильность и хороший запас по разгону. Не перегруженный комплект поставки и приятная организация TV-Out тоже порадовала. Однако система охлаждения памяти оставляет желать лучшего и нуждается в легкой модернизации для нормального  разгона карты. Но в целом от ускорителя осталось очень неплохое впечатление, и если вы выбираете себе видеокарту, то на Gigabyte Radeon X800Pro стоит обратить свое внимание.