GTX — больше не «ПЕЧ». Обзор видеокарт NVIDIA GeForce GTX 980 и GeForce GTX 970

Сергей Плотников, 

С момента анонса видеокарт NVIDIA, построенных на архитектуре Kepler, прошло уже почти 2,5 года. И только сейчас «зеленые» выкатывают топовые решения на основе Maxwell. Событие? Еще какое! Знакомимся с новинками GeForce GTX 980 и GeForce GTX 970, а также рассуждаем о перспективах девятой серии 3D-ускорителей от калифорнийской компании.

Оглавление

«Геймеры готовы к Maxwell» — именно с таким лозунгом начала свою презентацию NVIDIA. И неудивительно. Видеокарты на основе архитектуры Kepler просуществовали без малого 2,5 года. И просуществуют еще, ибо решения на основе графического чипа GK110 будут и дальше продаваться. В этом году так точно. Зимой этого года NVIDIA уже представила первые две разработки на основе чипов, построенных на новой Maxwell — видеокарты GeForce GTX 750 и GeForce GTX 750 Ti. Однако, как вы уже догадались, эти устройства относятся к семисотой линейке. Во-вторых, они являются яркими представителями сегмента Low-End. Человечество же ждало топа и дождалось: встречаем GeForce GTX 980 и GeForce GTX 970!

Геймеры готовы к Maxwell!
Геймеры готовы к Maxwell!

Признаюсь честно, я ждал появления флагманских видеокарт NVIDIA с большим нетерпением. Во-первых, потому что после выпуска сверхэффективной 60-ваттной GeForce GTX 750 Ti было очень интересно узнать, на что способен более крупный Maxwell. Во-вторых, было интересно посмотреть на стратегию NVIDIA: выкатит ли она сразу флагманскую модель или же поэкспериментирует с очередным решением попроще. Истина, как это часто бывает, оказалась где-то посередине.

Забавно, что NVIDIA оставила без внимания линейку GeForce GTX 800 и сразу же представила GeForce GTX 980
Забавно, что NVIDIA оставила без внимания линейку GeForce GTX 800 и сразу же представила GeForce GTX 980

Кстати, фотография выше — это отличные обои для рабочего стола.

Maxwell vs Kepler

Прошло больше двух лет, но GeForce GTX 680 до сих пор считается одной из самых популярных видеокарт. Если быть более точным, то популярной считается ее переименованная версия — GeForce GTX 770, но не суть. Так как очень схожую индексацию получили и чипы, и сами устройства (хотя маркетинговый «разрыв» сразу в целых три поколения выглядит очень вызывающе), то логично сравнить именно их. Ниже приведена эволюция модульной архитектуры во всей красе.

 

Maxwell (GeForce GTX 980)

Kepler (GeForce GTX 680)

Чип

GM204

GK104

Число транзисторов

5,2 млрд

3,5 млрд

Техпроцесс

28 нм

28 нм

Число потоковых мультипроцессором SM

16

8

CUDA-ядер

2048

1536

Частота GPU

1126/1216 МГц

1006/1058 МГц

Производительность

5 ТФЛОПС

3,3 ТФЛОПС

Эффективная частота памяти

7000 МГц

6000 МГц

Пропускная способность памяти

224 Гбайт/с

192 Гбайт/с

ROP

64

32

Максимальное энергопотребление

165 Вт

195 Вт

Занимательная картина: процессор GM204 состоит из 5,2 млрд транзисторов, что на 1,7 млрд больше, чем у GK107, работает на 120 МГц быстрее, но при этом GeForce GTX 980 потребляет на 30 Вт меньше энергии. Этому поспособствовала и сама интеграция архитектуры Maxwell, и отладка 28-нанометровых «рельс». Как видите, из этих технологических нормативов выжаты далеко не все соки. Порох в пороховницах имеется, причем не сырой.

Подробно описывать особенности архитектуры Maxwell я не буду. В свое время мы сделали это, анализируя видеокарту GeForce GTX 750 Ti: «Часть №1: первые решения на архитектуре Maxwell»; «Часть №2: новые подробности архитектуры Maxwell».  Не вижу смысла повторяться.

Сравнение NVIDIA GeForce GTX 680, NVIDIA GeForce GTX 780 и NVIDIA GeForce GTX 980 друг с другом
Сравнение NVIDIA GeForce GTX 680, NVIDIA GeForce GTX 780 и NVIDIA GeForce GTX 980 друг с другом

Итак, основой GeForce GTX 980 служит графический процессор GM204. Это более сложный чип, хотя бы потому, что он имеет большую полезную площадь и, как следствие, большее число транзисторов. Напомню, что GM107 состоит из 1,87 миллиарда кремниевых затворов. А здесь их уже 5,2 миллиарда, то есть в 2,8 раз больше.

NVIDIA GeForce GTX 980
NVIDIA GeForce GTX 980

К тому же сам «камень» был несколько видоизменен. Если в GM107 используется один кластер графики, содержащий пять потоковых мультипроцессоров SMM, то в GM204 задействовано восемь кластеров графики, в каждом из которых содержится по четыре SMM.

Графический процессор GM204 собственной персоной
Графический процессор GM204 собственной персоной

Итого получается, что GM204 имеет шестнадцать потоковых мультипроцессоров. В каждом SMM находится по 128 CUDA-ядер. Следовательно, общее количество вычислительных ALU равно 2048. Плюс к SMM привязаны текстурные блоки и ROP. Так, GM204 насчитывает 128 TMU и 64 ROP соответственно. Как всегда, графический процессор оснащен объемным кэшем второго уровня, равным 2 Мбайт. А четыре 64-битных встроенных контроллера памяти организуют 256-битную шину.

Кластер GPC состоит из шестнадцати SMM
Кластер GPC состоит из шестнадцати SMM

Если в Kepler каждый SM-блок считался самодостаточной единицей, то в Maxwell он дополнительно разделен на четыре части. Каждый модуль имеет 32 CUDA-ядра, блок обработки, буфер команд и планировщик. На две таких части приходится четыре текстурных блока, а также кэш первого уровня (что-то похожее мы могли наблюдать в G80). Подобное разделение упрощает логику процессора, экономит площадь кристалла и, конечно же, уменьшает потребляемую электроэнергию.

А это сам SMM
А это сам SMM

В итоге один SMM в сравнении с Kepler SM работает на 40% эффективнее, но при этом затрачивает меньше энергии.

Информация о GM204 Информация о GM204

Графический процессор GM204 имеет 64 ROP. Это вдвое больше, чем у GK104. Каждый блок ROP может обрабатывать один цвет. Для уменьшения требований к видеопамяти был задействован метод компрессии без потерь. Архитектура Maxwell поддерживает уже третье поколение дельта-сжатия (первое было реализовано в Fermi). Далеко не маленькую роль играет большой кэш GPU. В проведенных тестах GeForce GTX 980 использует приблизительно на 25% меньше байтов на кадр, чем GeForce GTX 680. В итоге пропускная способность на уровне 7 Гбит эквивалентна параметру 9,3 Гбит.

Компрессия памяти Компрессия памяти

Разница в производительности между GeForce GTX 980 и GeForce GTX 680 видна невооруженным взглядом. Быстродействие GM204 (особенно в сверхтяжелых режимах) может достигать двух-, а то и трехкратного превосходства.

Разница в производительности между NVIDIA GeForce GTX 680 и NVIDIA GeForce GTX 980 Разница в производительности между NVIDIA GeForce GTX 680 и NVIDIA GeForce GTX 980 Разница в производительности между NVIDIA GeForce GTX 680 и NVIDIA GeForce GTX 980 Разница в производительности между NVIDIA GeForce GTX 680 и NVIDIA GeForce GTX 980

Технические характеристики

В следующей табличке я разместил более современные видеокарты, а также основных конкурентов GeForce GTX 970 и GeForce GTX 980 — AMD Radeon R9 290 и AMD Radeon R9 290X.

 

NVIDIA GeForce GTX 970

NVIDIA GeForce GTX 980

NVIDIA GeForce GTX 750 Ti

NVIDIA GeForce GTX 770

NVIDIA GeForce GTX 780

NVIDIA GeForce GTX 780 Ti

AMD Radeon R9 290

AMD Radeon R9 290X

Название процессора

GM204

GM204

GM107

GK104

GK110

GK110

Hawaii

Hawaii

Техпроцесс

28 нм

28 нм

28 нм

28 нм

28 нм

28 нм

28 нм

28 нм

Архитектура

Maxwell

Maxwell

Maxwell

Kepler

Kepler

Kepler

GCN

GCN

Число потоковых процессоров

1664

2048

640

1536

2304

2880

2560

2816

Число текстурных блоков

104

128

40

128

192

240

160

176

Число блоков растеризации

64

64

16

32

48

48

64

64

Частота ядра

1050 (1178) МГц

1126 (1216) МГц

1020 (1085) МГц

1046 (1085) МГц

863 (900) МГц

875 (928) МГц

947 МГц

1000 МГц

Память

GDDR5, 4 Гбайт

GDDR5, 4 Гбайт

GDDR5, 2 Гбайт

GDDR5, 2 Гбайт

GDDR5, 3 Гбайт

GDDR5, 3 Гбайт

GDDR5, 4 Гбайт

GDDR5, 4 Гбайт

Шина

256 бит

256 бит

128 бит

256 бит

384 бит

384 бит

512 бит

512 бит

Частота памяти

1750 (7000) МГц

1750 (7000) МГц

1350 (5400) МГц

1753 (7012) МГц

1502 (6008) МГц

1750 (7000) МГц

1250 (5000) МГц

1250 (5000) МГц

Максимальное энергопотребление

145 Вт

165 Вт

60 Вт

230 Вт

250 Вт

250 Вт

290 Вт

290 Вт

Видеовыходы

1x DVI, 1x HDMI, 3x DisplayPort

1x DVI, 1x HDMI, 3x DisplayPort

2x DVI 1x mini-HDMI

2x DVI, 1x HDMI, 1x DisplayPort

2x DVI, 1x HDMI, 1x DisplayPort

2x DVI, 1x HDMI, 1x DisplayPort

2x DVI, 1x HDMI, 1x DisplayPort

2x DVI, 1x HDMI, 1x DisplayPort

Поддерживаемые API

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

DirectX 12 OpenGL 4.3

Цена

14 990 руб.

23 990 руб.

5500 руб.

12 000 руб.

18 000 руб.

25 000 руб.

16 000 руб.

21 000 руб.

Price.ru

Запрос цены:NVIDIA GeForce GTX 97059031

Запрос цены:NVIDIA GeForce GTX 98059031

Запрос цены:NVIDIA GeForce GTX 750 Ti59031

Запрос цены:NVIDIA GeForce GTX 77059031

Запрос цены:NVIDIA GeForce GTX 78059031

Запрос цены:NVIDIA GeForce GTX 780 Ti59031

Запрос цены:AMD Radeon R9 29059033

Запрос цены:AMD Radeon R9 290X59031

NVIDIA GeForce GTX 750 Ti приведена здесь исключительно для сравнения. Она создана на базе графического процессора GM107, который, как известно, имеет всего один кластер графики, но пять SMM.

Если сравнить GeForce GTX 980 с более производительными собратьями, а именно с GeForce GTX 780 и GeForce GTX 780 Ti, то на первый взгляд может показаться, что новинка на Maxwell-архитектуре будет медленнее Kepler. Однако это не совсем так. Познакомившись с GeForce GTX 750 Ti, мы узнали, что Maxwell обладает в 2,3 раза большей шейдерной производительностью. А еще GM204 работает на гораздо более высокой частоте (на 216 МГц быстрее). А еще ROP в два и полтора раза больше соответственно. А еще у видеокарты 4 Гбайт видеопамяти. Поэтому логично предположить, что GeForce GTX 980 должна быть существенно быстрее GeForce GTX 780 и очень близка по быстродействию к GeForce GTX 780 Ti.

Наконец, GM204 аппаратно поддерживает H.265 (HEVC), а это значит, что Maxwell-адаптеры будут отлично взаимодействовать с видеоконтентом 4К-разрешения. То есть на основе GeForce GTX 970/980 будет целесообразно приобрести, например, SteamMachine.

Сама NVIDIA называет графический процессор GM204 самым быстрым в мире. Впрочем, всё это мы обязательно проверим.

Скриншот GPU-Z видеокарты NVIDIA GeForce GTX 980
Скриншот GPU-Z видеокарты NVIDIA GeForce GTX 980

GeForce GTX 970

Вторая представленная видеокарта — это GeForce GTX 970. Она призвана конкурировать с Radeon R9 290. Урезанный GM-процессор (13 SMM) получил 1664 CUDA-ядра, 104 текстурных блока и 64 ROP. Так же, как и GeForce GTX 980, 3D-ускоритель обзавелся 4 Гбайт видеопамяти, функционирующей на эффективной частоте 7000 МГц. Логично, что потребляет GeForce GTX 970 несколько меньше — всего 145 Вт.

Сравнение NVIDIA GeForce GTX 970 с NVIDIA GeForce GTX 980
Сравнение NVIDIA GeForce GTX 970 с NVIDIA GeForce GTX 980

Внешне GeForce GTX 970 в референсном исполнении выглядит, как и остальные графические адаптеры NVIDIA.

И еще немного обоев для рабочего стола
И еще немного обоев для рабочего стола

NVIDIA GeForce GTX 970 (галерея) NVIDIA GeForce GTX 970 (галерея) NVIDIA GeForce GTX 970 (галерея)

Новые возможности Maxwell

Помимо представленных видеокарт, NVIDIA анонсировала ряд технологий и функций, направленных на улучшение графики, а также оптимизацию производительности.

Компьютерных игр масса. Какие-то обладают отличным качеством графики, но при этом являются достаточно ресурсоемкими. Какие-то, наоборот, весьма щадяще относятся к железу геймера. Однако и уровень графики у них ниже. В NVIDIA вознамерились решить эти две проблемы, выпустив сразу две технологии: Dynamic Super Resolution и режим сглаживания Multi-Frame sampled (MFAA).

Улучшаем качество, повышаем производительность вместе с NVIDIA Maxwell Улучшаем качество, повышаем производительность вместе с NVIDIA Maxwell

Мониторы и телевизоры, поддерживающие 4К-разрешение, — это очень модный тренд. Однако, во-первых, не всем нужно такое устройство. Во-вторых, не у всех есть возможность приобрести себе 4К-монитор. В-третьих, уровень производительности одночиповых видеокарт таков, что они не справляются с современными играми при максимальных настройках графики. Dynamic Super Resolution — это промежуточное решение, позволяющее улучшить качество картинки. Если говорить грубо, то DSR позволяет поместить 4К-изображение в Full HD. То есть технология чем-то похожа на даунсемплинг. Задействуется фильтр Гаусса с размером ядра фильтра 13. Берется геометрическая фигура, разбивается на пиксели, а затем закрашивается нужным образом. Только вот рендер происходит в 4К-разрешении, что значительно увеличивает четкость изображения. Для того чтобы картинка получилась не слишком резкой, используется фильтр Гаусса.

Принцип работы Dynamic Super Resolution
Принцип работы Dynamic Super Resolution

О качестве такого метода вы можете судить по скриншотам, расположенным ниже.

Принцип работы Dynamic Super Resolution Принцип работы Dynamic Super Resolution
Принцип работы Dynamic Super Resolution Принцип работы Dynamic Super Resolution

Функция будет автоматически доступна в утилите GeForce Experience. На мой взгляд, DSR будет полезна для относительно стареньких игр, которые будут запускаться при разрешении Full HD. А вот с новыми могут возникнуть проблемы из-за пост-обработки. В любом случае, если программа поддерживает DSR, то об этом сообщит GeForce Experience. К тому же технология может быть настроена в драйвере, начиная с версии 343.

Отмечу, что DSR поддерживается всеми современными видеокартами GeForce.

Автоматическая поддержка в GeForce Experience
Автоматическая поддержка в GeForce Experience

Концепт работы сглаживания MFAA прост: сопоставимое качество антиалиазинга с MSAA, но при этом более быстрая работа. Уже из названия понятно, что данный вид сглаживания — многократный. То есть видеокарта обрабатывает не 16 образцов в клетке 2х2 (четырехкратная выборка), а вдвое меньше, потому что остальная половина чередуется во времени и пространстве, сохраняясь в буфере.

Принцип работы режима сглаживания MFAA Принцип работы режима сглаживания MFAA Принцип работы режима сглаживания MFAA

Компанией заявлен 30-процентный рост быстродействия. Однако режим MFAA все еще находится в стадии разработки, и более подробная информация о нем, а также возможность самостоятельно протестировать новую технологию, появится позже. Пока же известно, что MFAA будут поддерживать только GPU семейства GM2xx.

MFAA на 30% быстрее MSAA
MFAA на 30% быстрее MSAA

Обработка света — одна из самых тяжелых задач для компьютерной графики. С выходом видеокарт GeForce GTX 980 и GeForce GTX 970 калифорнийская компания вводит технологию Voxel Global Illumination (VXGI), разработанную Кириллом Крассиным еще в 2011 году. Суть технологии заключается в использовании 3D-структуры вокселей для захвата помещения и освещения каждой точки сцены. Как известно, вокселы являются аналогами пикселов для трехмерного пространства. GPU рассчитывает количество прямого света, отражаемого вокселями. В режиме реального времени расчитывается информация об отраженном свете. Учитываются все аспекты геометрии (тип, отражаемость, цвет и так далее). Затем происходит заливка и вывод готового результата.

В принципе, технология могла быть полномасштабно реализована еще 2,5 года назад, одновременно с анонсом GeForce GTX 680. Однако все это время VXGI дорабатывалась. И уже сейчас NVIDIA обещает более высокую производительность. Причем на программном уровне будут поддерживаться все современные видеокарты NVIDIA. А в решениях Maxwell VXGI будет работать на аппаратном уровне.

Принцип работы VXGI Принцип работы VXGI

NVIDIA отмечает рост популярности технологий виртуальной реальности. Решения на основе Maxwell будут заметно быстрее работать с очками Oculus Rift. За счет применения перечисленных выше технологий будет гораздо ниже латентность.

Составляющие VR Direct
Составляющие VR Direct

Принцип работы VR Direct Принцип работы VR Direct Принцип работы VR Direct

А самое главное — это поддержка компьютерных игр. Вот так будет выглядеть EVE VALKYRIE.

EVE VALKYRIE поддерживает Oculus Rift
EVE VALKYRIE поддерживает Oculus Rift

Кстати, об играх. Как всегда, в кооперации с NVIDIA сотрудничают крупнейшие разработчики. Так, компания Ubisoft продемонстрировала технологичные скриншоты из Assassins Creed Unity и Far Cry 4. Задействованы такие функции, как HBAO+, TXAA, PCSS, тесселяция и другие. О качестве картинки можете судить по скриншотам ниже.

Применяемые графические эффекты в Assassins Creed Unity Применяемые графические эффекты в Assassins Creed Unity Применяемые графические эффекты в Assassins Creed Unity Применяемые графические эффекты в Assassins Creed Unity
Применяемые графические эффекты в Far Cry 4 Применяемые графические эффекты в Far Cry 4 Применяемые графические эффекты в Far Cry 4 Применяемые графические эффекты в Far Cry 4

Скоро поклонников PC-игр ждет много новинок. Одна технологичнее другой! Часть из них обязательно добавим в обновленную методику тестирования.

Ближайшие анонсы компьютерных игр, а также эффекты, которые будут поддерживаться
Ближайшие анонсы компьютерных игр, а также эффекты, которые будут поддерживаться

Референcный образец GeForce GTX 980

От теории переходим к практике. Конструктивные особенности референсной модели — самое скучное, на мой взгляд, что есть у GeForce GTX 980. Здесь применяется хорошо знакомый классический кулер турбинного типа. С другой стороны, данная система охлаждения ранее отлично зарекомендовала себя. Поэтому смысла придумывать «зеленым» велосипед нет. Предлагаю подивиться, какая получилась «красавица». По традиции в основе корпуса лежат такие материалы, как алюминий, магниевый сплав и органическое стекло.

NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 980
NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 980 NVIDIA GeForce GTX 980

Отличить референс GeForce GTX 980 от другой дефолтной модели NVIDIA позволит лишь надпись на кожухе. Карта по-прежнему занимает два слота. А на торце красуется LED-индикатор GEFORCE GTX, светящийся во время работы завораживающим едко-зеленым цветом.

Видеокарта подключается к блоку питания при помощи двух 6-пиновых разъемов.

NVIDIA GeForce GTX 980
NVIDIA GeForce GTX 980

Претерпела изменения оборотная сторона. Точнее, она обзавелась пластиковым бекплейтом. Далее я еще рассмотрю целесообразность его применения, однако я всегда приветствую использование таких пластин. Во-первых, они увеличивают жесткость конструкции. Во-вторых, предотвращают повреждение элементов видеокарты. Так, оборотная сторона GeForce GTX 980 имеет большое число конденсаторов.

Бекплейт оснащен съемной частью. Согласно задумке инженеров, ее необходимо демонтировать, когда в системе используется сразу несколько видеокарт. Плюс съемная часть открывает доступ к контактным площадкам.

Кстати, GeForce GTX 980 по-прежнему использует разъемы MIO для объединения в массивы SLI и 3-Way SLI.

NVIDIA GeForce GTX 980, оборотная сторона NVIDIA GeForce GTX 980, оборотная сторона

I/O-панель, на мой взгляд, располагает идеальным сочетанием портов, а также их количеством. Здесь есть один DVI, один HDMI и сразу три DisplayPort. В качестве воздуховода используется такая же решетка, как у GeForce GTX TITAN Z. Отмечу, что реализован HDMI именно версии 2.0. Следовательно, видеокарта отлично подружится с современными 4К-телевизорами.

NVIDIA GeForce GTX 980, I/O-панель
NVIDIA GeForce GTX 980, I/O-панель

В конструкции GeForce GTX 980 используется собственная печатная плата. То есть это не готовые PCB GeForce GTX 780 и GeForce GTX 780 Ti. Об этом можно судить хотя бы по расположению фаз питания и драйверов. Используется 5 фаз. Четыре предназначены для GPU, еще одна — для памяти. Видно, что на PCB оставлены две пустые колодки. Видимо, данная печатная плата будет использоваться в других Maxwell-видеокартах (GeForce GTX 980 Ti, GeForce GTX TITAN II? — прим. предвкушающего что-то новенькое автора). Для сравнения: GeForce GTX 780 Ti имеет 6+2=8 фаз.

Процессор семпл-образца получил рабочее название T6A996.0A0. 4 Гбайт памяти образуются за счет использования восьми микросхем GDDR5 от Samsung.

Печатная плата NVIDIA GeForce GTX 980 Печатная плата NVIDIA GeForce GTX 980

Все самое интересное — впереди, а точнее, на следующей странице обзора.

Страница №2: Тестирование, выводы


Автор
Сергей Плотников

Комментарии