Опубликовано 03 февраля 2003, 00:33

Nvidia GeForce FX — что это будет? Ждем, анализируем, комментируем

GeForce FX (он же NV30) — первое детище компании Nvidia, созданное по 0,13-микронному производственному процессу и способное работать на недостижимой ранее частоте 500 МГц! Сравним его с прямым конкурентом — ATI Radeon 9700 Pro.

Альфред Хичкок как-то сказал, что кино — это жизнь, из которой вырезано все скучное. Но и искусство «движущихся картинок» не лишено недостатков. Многие считают, что самым большим его минусом является неизменность произведений, отсутствие интерактивности. Неужели вам никогда не хотелось, чтобы в каком-то месте повествования все произошло совершенно не так?! Не хотелось пустить героя по более короткой или более интересной тропинке, кардинально изменить всю последующую цепочку событий?

С этой точки зрения наиболее удачным развитием кинематографа стали компьютерные игры. Правда, они пока далеки от совершенства. Некоторые пороки предшественника до сих пор не изжиты и портят общую радужную картину. К тому же появился еще один очень серьезный недочет — качество изображения.

Программисты жалуются на недостаточную производительность аппаратуры. А «железячники» кивают на недорабатывающих игростроителей — посмотрите на эти красоты в наших демо-роликах, ведь можно же!

Приход в компьютерные игры изображения, сравнимого по качеству с фильмом, нам обещают давно. Помнится, еще на презентации GeForce 3 представители компании Nvidia заявляли, что чип способен обрабатывать в реальном времени наделавший шуму «Final Fantasy». Но демки эти общедоступными так и не стали, что наводит на грустные мысли…

И вот эра кинематографической графики в компьютерных играх настала! В очередной раз. Теперь ее нам принесет GeForce FX (кодовое имя NV30) производства все той же Nvidia.
Начнем знакомство с нашим героем на языке скупых цифр и заодно сравним GeForce FX с прямым конкурентом — ATI Radeon 9700 Pro (перед прочтением этой статьи настоятельно рекомендуем ознакомиться с материалом о Radeon 9700 Pro в «КТ» #471 или по адресу www.ferra.ru/online/video/22257). Взгляните на таблицу ниже. Приходится признать, что нынешний лидер канадской компании меркнет на фоне таких характеристик — кроме большей пропускной способности памяти ему похвастаться нечем…

fx1.jpg

GeForce FX


Radeon 9700 Pro




Производственный процесс GPU, мкм


0,13


0,15




Количество транзисторов, млн


125


~110




Частота GPU, МГц


500


325




Эффективная частота памяти, МГц


1000


620




Разрядность памяти, бит


128


256




Тип памяти


DDR II


DDR




Пиковая пропускная способность памяти, Гбайт/с


16


19,8




Версия DirectX


9+


9




Версия вершинных шейдеров


2+


2




Количество вершинных шейдеров


3


4




Версия пиксельных шейдеров


2+


2




Количество пиксельных конвейеров 


8


8




Количество текстурных модулей на конвейер


1


1

fx1.jpg

GeForce FX

Radeon 9700 Pro

Производственный процесс GPU, мкм

0,13

0,15

Количество транзисторов, млн

125

~110

Частота GPU, МГц

500

325

Эффективная частота памяти, МГц

1000

620

Разрядность памяти, бит

128

256

Тип памяти

DDR II

DDR

Пиковая пропускная способность памяти, Гбайт/с

16

19,8

Версия DirectX

9+

9

Версия вершинных шейдеров

2+

2

Количество вершинных шейдеров

3

4

Версия пиксельных шейдеров

2+

2

Количество пиксельных конвейеров

8

8

Количество текстурных модулей на конвейер

1

1

Итак, Nvidia перешла на 0,13-микронный производственный процесс. Это, несомненно, дает NV30 технологическое преимущество над R300, который изготавливается по 0,15-мкм техпроцессу. Как видно из таблицы, GeForce FX работает на недостижимой ранее частоте 500 МГц!

Кстати, о названии. То, что его составной частью будет GeForce, практически никто не сомневался. Для большинства людей слова «видеокарта» и «GeForce» являются синонимами — слишком уж раскручен этот брэнд. А вот буквы «FX» вместо очередного порядкового номера стали неожиданностью. Как объясняет Nvidia, это дань огромному вкладу в создание чипа группы инженеров из поглощенной когда-то компании 3dfx, несколько лет назад бывшей бесспорным лидером на рынке графических ускорителей.

Но вернемся к «железу». Похоже, даже «утончение» GPU не спасает его на таких скоростях от высокой температуры. Представленные прессе образцы были снабжены не только внушительных размеров кулером, но и бловером! Судя по всему, чип будет очень горячим. Выдуваемый бловером воздух прохладным не назовешь. Ранее заявлялось, что такая система охлаждения будет опционной, но, кажется, теперь она стала стандартом.

B_GEFFX_3qtr.jpg

Карта на GeForce FX без бловера не предсавляет собой чего-то необычного...

B_GEFFX_3qtr.jpg

Карта на GeForce FX без бловера не предсавляет собой чего-то необычного...

Экстремальные условия эксплуатации наводят на мысль, что рабочая частота в 500 МГц — мера вынужденная. Вероятно, на более низких частотах за Radeon 9700 Pro не угнаться.

Кроме того, удивили высокие требования по энергопотреблению. Работать без подключения дополнительного питания через стандартный 12-вольтовый коннектор чип, конечно, согласится (в отличие от R300, который потребует подпитки). Но производительность при этом будет «офисной», то есть достаточной только для приложений, не предъявляющих высоких требований к видеоподсистеме. Ранее считалось, что дополнительное питание понадобится лишь для более стабильной работы GeForce FX при разгоне. Как выяснилось, оно обязательно и для полноценной работы даже в стандартном режиме.

Впрочем, продемонстрированные образцы были оснащены чипами первой ревизии. Какой будет вторая, похоже, не представляют даже в самой Nvidia. По крайней мере, во время московской презентации (подробнее о ней читайте по адресу www.ferra.ru/online/video/22027) на большую часть вопросов о конкретных технических характеристиках GPU представители компании отвечали уклончиво. Что ж, дождемся окончательного варианта чипа. При тестировании мы обязательно остановимся на этих моментах и подробно их рассмотрим.

DDR II против DDRх2

Важность пропускной способности памяти трудно переоценить. Для продуктов Nvidia она всегда критична. Не секрет, что разгон памяти на них дает в большинстве случаев лучший результат, чем при разгоне ядра. Поэтому к подсистеме памяти всегда тщательно приглядываются. Правда, на этот раз она сама способна привлечь внимание — GeForce FX стал первым чипом, работающим в упряжке с DDR II.

C_GEFFX_FB_3qtr.jpg

C_GEFFX_FB_3qtr.jpg

Новый тип памяти обладает многими преимуществами по сравнению с предшественником. Например, он более защищен от помех, его энергопотребление снижено, меньше латентность. Но DDR II на данный момент не производится в таких объемах, как DDR, ставшая стандартом не только для видеокарт, но и для системы в целом. А это обязательно отразится на общей стоимости карты — по разным оценкам, первые серийные образцы, ожидающиеся в марте, будут зашкаливать за 600 долларов.

Nvidia даже во времена запуска GeForce 4 Ti 4600 столкнулась с дефицитом высокоскоростной памяти. А что же будет теперь? Можно с большой долей уверенности предположить, что этот аспект серьезно притормозит массовый выпуск.

Еще одно малопонятное решение — это 128-разрядная шина. Напомню, что в Radeon 9700 применяется двухканальная архитектура памяти, что расширяет шину до 256 бит. За счет этого он и получает преимущество в пропускной способности, несмотря на использование обычной DDR и низких (по сравнению с GeForce FX) частот. Правда, есть здесь трудно прогнозируемый, но очень важный момент — технологии оптимизации использования памяти. Возможно, новые алгоритмы позволят NV30 не беспокоиться по поводу меньшей физической пропускной способности. О них мы поговорим ниже.

Интересно, что у обоих конкурентов осталась возможность для маневра. ATI может начать выпускать карты с прогрессивным типом памяти (Radeon 9700 уже поддерживает ее), а Nvidia — внедрить двухканальную архитектуру. Но надо признать, что тактика ATI в этом вопросе выглядит предпочтительнее. (К тому же у канадцев, как туз в рукаве, — еще и переход на более тонкий 0,13-мкм техпроцесс. На прошедшем 24 января в Москве форуме ATI представители компании этого не отрицали, и скорее всего мы увидим «обновленный» Radeon 9700 не позднее марта.) Все же ставка на DDR II в данный момент представляется рискованной.

DirectX 9+

Вы, наверное, уже обратили внимание, что в обозначении версии DirectX (а также вершинных и пиксельных шейдеров), поддерживаемой ускорителем GeForce FX, имеется «+». Таким образом Nvidia подчеркивает: способности чипа превышают характеристики соответствующих стандартов. В таблицах показаны различия по некоторым параметрам между спецификациями шейдеров 2 и 2+. Radeon 9700 в полной мере реализует DirectX 9, а GeForce 4 Ti — DX 8, а значит, можно сказать, что это также сравнение с конкурентом и предшественником.

Различия в спецификациях вершинных шейдеров
 DirectX 8DirectX 9GF FX
Версия шейдеров1.122+
Максимальное количество команд128102465536
Временных регистров121216
Возможность управления потоком команднетда, статическида, динамически
Максимальное количество циклов1664
Различия в спецификациях пиксельных шейдеров
 DirectX 8DirectX 9GF FX
Версия шейдеров1.122+
Максимальное количество командвыборки текстур4321024
Максимальное количество командобработки цвета8641024
Предикатов1264
Зависимых текстур (вложенных выборок)4неограничено

Как видите, Nvidia сделала подарок программистам, предложив еще больше свободы при работе с вершинными шейдерами. Здесь надо особо отметить динамическое управление циклами. Благодаря ему можно сказать, что блок обработки шейдеров в GeForce FX достоин называться процессором. Кстати, таких блоков в чипе три (у GeForce 4 Ti их два, у Radeon 9700 — четыре). Скорее всего, связано это со сложностью воплощения в «железе» динамических переходов в шейдере.

Dawn_01.jpg

Можно спорить о привлекательности этой феи, но нельзя не признать высокую реалистичность изображения. Эмоции, естественно, реализованы с использованием вершинных шейдеров. Стоит отметить, однако, что смена настроения передается недостаточно правдоподобно.

Dawn_01.jpg

Можно спорить о привлекательности этой феи, но нельзя не признать высокую реалистичность изображения. Эмоции, естественно, реализованы с использованием вершинных шейдеров. Стоит отметить, однако, что смена настроения передается недостаточно правдоподобно.

Чем динамический переход отличается от заранее прописанного статического? Тем, что переход можно осуществить, исходя из неких данных, полученных в этом же шейдере ранее. Для реализации тех же действий в R300 придется разбить один большой шейдер как минимум на два и передавать эти критические данные из первого во второй. Пусть это и не так трудно, но очень неудобно для разработчиков программных продуктов. Причем можно с легкостью представить себе ситуацию, когда сложность разбиения заставит отказаться от применения некоего эффекта. А это уже неприятно для нас, пользователей.

С вершинными шейдерами вроде бы разобрались. Перейдем к пиксельным. И здесь Nvidia шагнула за рамки спецификаций DirectX 9. Тем не менее, уровень программируемости пиксельных шейдеров все еще недостаточен. Основным минусом является отсутствие возможности управлять потоком команд.

Впрочем, заложенные в чип способности позволяют программистам создавать интересные эффекты уже сейчас. В демо-ролике Nvidia «Time Machine» с помощью пиксельных шейдеров имитируется процесс старения автомобиля (туда и обратно легким движением мыши в реальном масштабе времени). К каждому материалу «прикреплен» свой шейдер, который, меняя различные параметры, заставляет краску облупляться, стекло тускнеть и т. д. Пиксельные конвейеры в GeForce FX по количественным показателям идентичны конвейерам Radeon 9700 — та же формула 8х1. Так что в плане закраски ни один из чипов не получит преимущества за счет экстенсивности развития. Придется бороться частотами и оптимизационными алгоритмами.

TimeMach_01.jpg

В демо-ролике Nvidia «Time Machine» с помощью пиксельных шейдеров имитируется процесс старения автомобиля.

TimeMach_01.jpg

В демо-ролике Nvidia «Time Machine» с помощью пиксельных шейдеров имитируется процесс старения автомобиля.

Хотя возможности NV30, очевидно, превышают спецификации DirectX 9, не стоит забывать, что они также превышают и возможности R300. Не исключено, что это и погубит добрые начинания Nvidia.

Создавая софт, разработчики должны побеспокоиться о его совместимости с максимальным числом аппаратных средств, дабы охватить как можно больший круг пользователей. А поскольку код, использующий по максимуму способности GeForce FX, не будет работать на Radeon 9700, то и вероятность появления заметного количества серьезных программ, заточенных под DirectX 9+, невелика. К тому же обратная ситуация вполне допустима — код для чипа ATI будет корректно обработан и GPU Nvidia. Похоже, канадцы и здесь заняли более выгодную позицию.

Впрочем, программистам на OpenGL не привыкать к такой неразберихе. Им уже давно приходится писать два кардинально разных кода. Фирменные OpenGL-расширения канадцев и калифорнийцев знать друг о друге не знают (и, похоже, не желают).

Как бы то ни было, какую-либо реализацию DirectX 9 в играх нам придется ждать около года, а то и двух. Разве что конкуренты в скором времени заполонят рынок высокопроизводительными картами с поддержкой этого API. И при этом по цене до 150 долларов… Кто-нибудь верит в подобное? Я почему-то нет.

Intellisample

Мы уже говорили о важности пропускной способности памяти. Технологии, которые мы сейчас рассмотрим, позволяют ее увеличить. Точнее, физически увеличения не произойдет. Но различные оптимизирующие алгоритмы позволяют более рационально использовать пропускную способность памяти, увеличивая таким образом эффективную пропускную способность.

Самой интересной и, похоже, наиболее эффективной является возможность компрессии информации о цвете. Она занимает заметное пространство в локальной памяти видеокарты, особенно при использовании тройной буферизации. Nvidia заявляет, что использованные алгоритмы позволяют достигнуть сжатия без потерь с коэффициентом 4:1. Вряд ли такого достаточно высокого показателя удалось достигнуть при абсолютной сохранности информации. Скорее всего, происходит все же некая интерполяция. Но хочется верить, что делается это очень аккуратно. По крайней мере, производитель заявляет об отсутствии каких-либо артефактов. Но если реализация и в самом деле столь эффективна, то можно говорить о невиданной до сей поры дешевизне (в плане потерь производительности) применения антиалиасинга. Что ж, запишем себе еще один пункт для придирчивой проверки во время тестирования.

Кстати, об антиалиасинге. Теперь к доступным NV30 режимам сглаживания добавились 6х (только в DirectX-приложениях) и 8х. Несомненно, качество последнего будет очень высоким (хотя, скорее всего, визуально и не намного выше качества 4х). Но вот чего это будет стоить в плане производительности? Может быть, сжатие значений цвета позволит удерживать ее на достойном уровне?

Следующая технология — адаптивные алгоритмы фильтрации — также позволит уменьшить объем передаваемой информации и, несомненно, повлияет на качество изображения. В худшую сторону. Впрочем, Nvidia заявляет, что ухудшение будет незаметным. К тому же применение этой функции оставлено на усмотрение пользователя, так что недовольные качеством смогут вернуться к старым алгоритмам. Суть в том, что мы можем выбирать количество используемых образцов для фильтрации. Возможно, это поможет GeForce FX приблизиться к продуктам ATI, которые издавна славятся высокопроизводительной анизотропией.

Кино заканчивается, не начавшись

Наобещали нам много. Как это воплотится в реальных картах, можно только гадать. Продемонстрированные Nvidia образцы слишком сырые, чтобы судить о чем-либо. Сейчас на видеокартах даже устанавливается внешний чип для вывода на TV-Out — при том, что это встроенная в GeForce FX функция. Видимо, пока ее работа особого энтузиазма не вызывает.

Отгрузка чипов вендорам уже началась или начнется в ближайшее время. Так, например, ASUSTeK и Gainward не отрицают, что работают над сэмплами видеокарт, однако делиться подробностями (или самими сэмплами) упорно отказываются — ходят слухи, что все упирается даже не в редкостную DDR II, которую сейчас способна производить только Samsung Semiconductor, а в сырые драйверы… Продающийся же с сентября-октября Radeon 9700 Pro со всей своей семьей набирает обороты, оставаясь самым производительным среди доступных решений.

Конечно, ATI не собирается почивать на лаврах. Но даже если NV30 уступит (хотя в это мало кто верит) R300 в быстродействии, новый ускоритель от Nvidia наверняка будет продаваться как горячие пирожки. За него играет вся предыдущая история доминирования на рынке карт с именем GeForce. Да и поклонников у продукции Nvidia предостаточно. ATI здесь пока уступает. Но развитие событий с Radeon 9700/9500 показывает, что мириться с этим канадцы не намерены.

Очень удачный ход в плане будущего соперничества был сделан, когда ATI удалось переманить на свою сторону ведущего программиста id Software Джона Кармака — его будущий «Doom III» будет оптимизирован под Radeon 9700. А это дорогого стоит. Игра обещает задать новые стандарты в визуальном качестве изображения. То, что она войдет в обязательный набор для тестирования «железа», не вызывает сомнений.
Но! Глядя на скриншоты из этого будущего шедевра, с грустью понимаешь, что до фото- или кинореализма изображения еще очень далеко. Так что, господа, «кина не будет»! Фильмов не привезли. Пока.