Опубликовано 22 марта 2012, 17:01

NVIDIA GTX 680 – превосходство Kepler'а

До сегодняшнего дня видеокарта NVIDIA GTX 580 удерживала пальму первенства и оставалась самым мощным однопроцессорным видеоадаптером в стане NVIDIA. Однако сегодня, 22 марта 2012 года, компания NVIDIA представляет миру свое новое творение — видеокарту GTX 680. О ней мы с вами и поговорим.
NVIDIA GTX 680 – превосходство Kepler'а
NVIDIA GTX 680

NVIDIA GTX 680

Совсем недавно AMD выпустила на рынок семитысячную линейку видеоадаптеров, которая, разумеется, потеснила всех действующих лидеров и забрала первые позиции в рейтингах. С выходом новой серии видеокарт у продуктов NVIDIA появилась возможность побороться за звание самого быстрого однопроцессорного видеоадаптера в мире. Станет ли GTX 680 новым королем? Давайте выясним это.

Kepler

Два года назад, в апреле 2010, геймерам всего мира представили видеокарту GTX 480 на основе архитектуры Fermi, в дальнейшем получившей прозвище "ферма". Архитектура Fermi смогла предложить пользователям вычислительную мощность 512 CUDA-ядер. На тот момент это было серьезное увеличение мощности относительно предшественников.

Kepler — новая архитектура. На ее базе построен GPU NVIDIA GK104, который, в свою очередь, является сердцем видеокарты NVIDIA GTX 680.

NVIDIA GK104

NVIDIA GK104

Kepler

Kepler

При первом же взгляде на схематическое изображение Kepler мне вспомнился Fermi. Kepler является развитием архитектуры Fermi. Главное отличие заключается в уменьшенном c 40 до 28 нм техпроцессе.

Между ними действительно много общего. Мы видим четыре кластера обработки графики (Graphics Processing Clusters), в каждом из которых по два SMX (Next Generation Streaming Multiprocessors), они же потоковые процессоры. В общей сложности у нас получается восемь SMX. Давайте посмотрим на один из них поближе.

Next Generation Streaming Multiprocessors

Next Generation Streaming Multiprocessors

Каждый потоковый мультипроцессор несет в себе 192 CUDA-ядра. Напомним, что в поколении Fermi один мультитпроцессор вмещал в себя только 32 Cuda-ядра. Также, каждый SMX несет в себе текстурные блоки и движок PolyMorph (PolyMorph Engine) версии 2.0. Именно этот движок отвечает за тесселяцию.

На схеме видно, что интерфейс PCI-E «вырос» до версии 3.0. А это обозначает, что пропускная способность выросла до 8 GT/s (Гигатранзакций в секунду). Это приятная новость, поскольку все больше материнских плат начинают поддерживать данный стандарт. Не факт, что это как-то увеличит производительность для данного адаптера, но вероятность «затыков» сразу уменьшается.

Характеристики отображаемые программой GPU-Z

Характеристики отображаемые программой GPU-Z

Характеристики видеокарты, отображаемые программой GPU-Z

Итак, что же мы видим? Площадь кристалла относительно GTX 580 снизилась с 520 до 294 мм. Количество транзисторов выросло с 3000 до 3500 млн. Общее количество CUDA-ядер увеличилось до 1536 штук. Это огромный шаг вперед. Когда появилась NVIDIA GTX 480, она несла в себе лишь в два раза больше ядер, нежели GTX 285.

Видеокарта поддерживает DirectX версии 11.1, который появится с выходом Windows 8. Количество блоков растеризации (ROPs) уменьшилось с 48 до 32 относительно GTX 580. Общий объем видеопамяти составляет 2048 Мбайт. Стоковая версия GTX 580 несла только 1536 Мбайт, так что здесь очевиден плюс. Ширина шины памяти относительно GTX 580 снизилась с 384 бит до 256 бит. Если честно, то мы уже отвыкли от столь узких аппаратно на сегодняшний день интерфейсов памяти. Чтобы компенсировать это «бутылочное горлышко», пришлось увеличить тактовую частоту видеопамяти — теперь она функционирует на 6000 МГц.

GDDR 5 6000 МГц

GDDR 5 6000 МГц

На сегодняшний день NVIDIA GTX 680 — единственная видеокарта, память которой по дефолту работает на таких частотах. Частота видеопамяти вкупе с шиной памяти дают общую пропускную способность 192.3 Гб/с.

Тактовая частота самого GPU составляет 1006 МГц. И остановимся на этом подробнее. Дело в том, что частота видеопроцессора отныне не статична, а динамична. Что это значит и как оно происходит?

Все мы хорошо знаем, чем занимается технология Turbo Boost если говорить о процессорах. Данная технология позволяет увеличивать тактовую частоту работы ядер выше номинальной, если при этом не превышаются установленные нормы энергопотребления и TDP. Это очень удобно, так как процессор сам начинает работать на повышенных частотах без вмешательства пользователя. Компания NVIDIA, по всей видимости, решила перенять полезный опыт, оснастила новое поколение GPU технологией похожего действия и назвала её NVIDIA GPU Boost. Действия данной технологии действительно не сильно отличаются от «процессорного аналога».

NVIDIA GPU Boost

NVIDIA GPU Boost

Главный ориентир в работе этой технологии — это TDP. Если нагрузка на видеокарту не максимальная и есть запас прочности до пикового значения, то видеокарта сама автоматически повышает тактовую частоту с базовых (неснижаемых) 1006 МГц до 1058 и выше. Ссылаясь на опыт в работе с данной видеокартой, могу сказать, что автоматически карта не повышает тактовую частоту GPU выше 1112 МГц. Это составляет 10% прироста относительно "Base Clock".

Пример работы технологии NVIDIA GPU Boost

Пример работы технологии NVIDIA GPU Boost

Еще раз отмечу, что это номинальный режим работы без какого-либо вмешательства со стороны пользователя.

Частоты видеокарты GTX 680 в простое

Частоты видеокарты GTX 680 в простое

В простое карта сбрасывает частоты и напряжение до значений 324 МГц и 0.98V соответственно. Но это все номинальные режимы работы. А как же разгон? Он никуда не делся. Просто теперь придется играть по немного другим правилам. Вольтаж карта регулирует сама, основываясь на показаниях датчиков, разбросанных по всей карте и GPU. Мы можем воздействовать на значения нижнего порога тактовой частоты и TDP. Это значит, что зафиксировать максимальную тактовую частоту адаптера не получится, мы можем двигать только базовые значения.

Разгон видеокарты GTX 680 (простой)

Разгон видеокарты GTX 680 (простой)

Разгон видеокарты GTX 680 (нагрузка)

Разгон видеокарты GTX 680 (нагрузка)

Максимальная частота, на которой карта стабильно функционировала, составляет 1260 МГц по GPU и 6300 МГц по памяти. Для достижения отметки в 1260 МГц мне было необходимо увеличить базовую частоту на 150 МГц (до 1156 МГц), остальное карта сделала сама. Напряжение при этом подавалось равное 1.175 Вольт. На этом мы, скорее всего и уперлись в TDP, ибо тактовой частоты выше 1280 МГц за все тестирование зафиксировано не было.

Начинать махать кулаками рано. Теперь мы можем изменять максимальное значение TDP. Для этого в программе EVGA Precision вам нужно подвигать ползунок Power Target. Однако призываем вас быть осторожным, ибо это является выходом за установленные производителем рамки тепловыделения, и, вероятно, долго в таких режимах ваша новая видеокарта просто не проживет.

Kepler выполнен по 28 нм технологическому процессу, и мы еще мало что знаем о нем. Однако, не попробовать мы не смогли. Когда мы выдвинули ползунок на 130%, дабы точно упереться не в TDP, а в возможности самого GPU, видеокарта смогла стабильно функционировать на частоте 1310 МГц. Для этого обороты кулера были выкручены на максимум. Не сказать, что прирост порадовал, но стоит учесть, что это стоковое охлаждение и слишком свежая видеокарта, в ближайшем будущем все может измениться. Измениться, кстати, может как в хорошую, так и в плохую сторону.

Данная технология отчасти облегчает разгон видеоадаптера и видится успешной. Главное, чтобы этот электронный мозг со своими датчиками корректно определял стабильные частоты и не превышал их. Жаль, что нельзя просто отключить данную функцию, это многое бы облегчило. Представьте ситуацию: мы выставили базовую частоту на 1200 МГц, а максимально стабильная частота составляет 1280 МГц без увеличения TDP. Авторазгон может прибавить до 10%, а это куда больше 1280.

Важно, чтобы адаптер сам умел анализировать стабильность на более высоких частотах. Иначе это приведет не к тому, что карточка сама выставит максимально высокие частоты, а к тому, что нам придется выставлять базовую частоту на 10% ниже максимально стабильной, дабы электронный мозг не подвел нас и не разрешил бы частотам выйти за предел, после которого карточка зависает. После чего получится, что тактовую частоту на 10% ниже максимально стабильной мы выставили, а вот поднимет ли GPU Boost их обратно — уже вопрос. Дать ответ на это можно, только проведя обширные тестирования не в рамках одного материала, так как требуется продолжительный сбор статистики. Хочется верить в лучшее.

GPU Boost

GPU Boost

Так или иначе, NVIDIA заявляет стабильные 1200 МГц в разгоне, и, судя по полученным нами результатам, не прихвастывает.

Производительность на ватт относительно Radeon HD 7970

Производительность на ватт относительно Radeon HD 7970

Новый GTX 680 является самым энергоэффективным видеоадаптером в мире. Судя по приведенному выше слайду, превосходство над основным конкурентом в лице Radeon HD 7970 достигается во всех современных играх, и варьируется от х1.1 до х1.6.

Производительность на ватт относительно GTX 580

Производительность на ватт относительно GTX 580

Превосходство новой архитектуры

Превосходство новой архитектуры

Относительно предыдущего поколения скачок очень заметный. Но оно и не мудрено: поколение видеокарт архитектуры Fermi всегда славились любовью к электроэнергии. Данная новость особенно актуальна для тех, кто живет в Европе; там, как известно, тарифы на электроэнергию совсем другие. Да и у нас лишним не будет. Одновременно с уменьшением потребления энергии уменьшается и тепловыделение. Поэтому приготовьтесь покупать на следующую зиму обогреватели: видеокарточка больше не спасет.

Nvidia Surround

Nvidia Surround

Отныне мы можем объединить четыре монитора при помощи одной видеокарты. Ранее нам потребовалось бы объединять для этого несколько видеокарт. Это действительно важный дружеский шаг к пользователям. Не всем нужно три-четыре монитора, чтобы играть, но иногда необходимо просто иметь возможность вывести на экран кучу различной информации одновременно.

Производительность в тесселяции

Производительность в тесселяции

NVIDIA заявляет о четырехкратном превосходстве в тесселяции над видеокартой Radeon HD 7970. Необходимо понимать, что если в каком-нибудь тесте эта разница и будет получена, вовсе необязательно, что то же самое будет ждать вас в играх. Однако то, что NVIDIA постоянно работает над совершенствованием блока тесселяции, не может не радовать.

Следующее нововведение актуально для игроков. Оно касается всем известного Vertical Sync. Суть данной технологии заключается в том, что частота кадров привязывается к частоте вертикальной развертки монитора. На сегодняшний день эта цифра обычно равно 60 герцам, т.е. у вас будет 60 кадров в секунду, даже если система способна выдать 70, 80 и более. Для чего это нужно? Эта функция позволяет избежать так называемого разрыва кадров, когда один кадр накладывается на другой.

График работы Vertical Sync

График работы Vertical Sync

Но что происходит, если система не может выдать 60 кадров в момент эпической битвы на экране? Тогда частота кадров автоматически падает до следующего кратного значения. В итоге у нас видеоряд получается дерганным, так как частые переключения между режимами 60, 30 и 20 кадров в секунду не добавляют комфорта в игре.

Схема работы Adaptive VSync

Схема работы Adaptive VSync

Компания NVIDIA предлагает нам решить данную проблему с помощью новой технологии Adaptive VSync. В чем заключается её работа? Когда система выдает более шестидесяти кадров в секунду, VSync работает в стандартном режиме, но, как только система дает просадку ниже шестидесяти кадров, VSync автоматически отключается и нам показывается то количество кадров, которое выдает система в реальном времени. Как только просадка исчезает и количество кадров снова начинает превышать частоту вертикальной развертки монитора, VSync включается и продолжает работу в прежнем режиме. Таким образом не происходит частой смены режимов, что положительно влияет на восприятие видеоряда.

Драйверы NVIDIA

Драйверы NVIDIA

Данная функция активируется и дезактивируется напрямую в драйверах видеокарты. Там же можно выбрать и обычный режим, правда, теперь я не вижу в нем смысла.

На этом нововведения не заканчиваются. Компания NVIDIA предлагает нам новый метод сглаживания — TXAA. Фактически, это комбинация мультисемплинга и специального фильтра, который использует информацию о глубине и контрастности изображения.

Пример действия TXAA

Пример действия TXAA

В данном виде сглаживания задействован новый алгоритм — Temporal Aliasing. Этот алгоритм позволяет использовать информацию о предыдущих кадрах. Используя содержимое предыдущего кадра, мы можем улучшить качество следующего с меньшими затратами ресурсов.

Производительность TXAA

Производительность TXAA

Спецификации TXAA

Спецификации TXAA

По заявлением компании NVIDIA, второй уровень TXAA по качеству равен MSAA 8x, однако нагружает систему не сильнее, чем MSAA 4x. Это очень приятная новость. Хочется надеяться, что все обстоит именно так, без каких-либо «подводных камней».

Итак, мы получаем совершенно новый продукт с новыми технологиями и гораздо более высокой производительностью.

Производительность GTX 680 относительно Radeon HD 7970

Производительность GTX 680 относительно Radeon HD 7970

Судя по данному слайду, производительность GTX 680 почти во всех играх существенно выше, нежели чем у одночипового топа конкурентов — HD 7970.

Технические преимущества над предыдущей серией

Технические преимущества над предыдущей серией

Для воспроизведения демки Samaritan Tech Demo раньше требовались три видеокарты GTX 580. Сегодня же с этим справится одна GTX 680. Это влечет за собой гораздо меньшее энергопотребление, а также меньший уровень шума.

NVIDIA GTX 680

NVIDIA GTX 680

NVIDIA GTX 680

Настало время познакомиться с самой видеокартой GTX 680.

Лицевая сторона NVIDIA GTX 680

Лицевая сторона NVIDIA GTX 680

Сверху плата закрыта пластиковым кожухом, так что подробности устройства системы охлаждения можно узнать, только разобрав видеокарту. Габариты видеокарты составляют 255 х 98 х 37 мм. Предыдущий топ GTX 580 обладал следующими параметрами: 267 х 111 х 37. Габариты уменьшились, причем самое важное — то, что уменьшилась длина платы. Это часто становится преградой к установке в среднестатистический корпус.

Обратная сторона NVIDIA GTX 680

Обратная сторона NVIDIA GTX 680

На обратной стороне из примечательного — только контроллер питания GPU.

Контроллер питания

Контроллер питания

Контроллер питания

Контроллер произведен компанией Richtek, маркировка гласит: RT8802A GQV. С техническими спецификациями вы можете ознакомиться здесь.

Вид со стороны разъемов дополнительно питания

Вид со стороны разъемов дополнительно питания

Видеокарта оснащена двумя шестиконтатными разъемами дополнительного питания. Предыдущий флагман— GTX 580 — оснащался одним шестиконтактным и одним восьмиконтактным разъемами. Налицо снижение энергопотребления.

Видеовыходы GTX 680

Видеовыходы GTX 680

Видеокарта оснащена двумя разъемами DVI, одним HDMI и одним DP. Обращу ваше внимание на то, что разъемы не «мини», а полноценные.

Система охлаждения GTX 680 (вид сбоку)

Система охлаждения GTX 680 (вид сбоку)

Система охлаждения GTX 680 (вид сверху)

Система охлаждения GTX 680 (вид сверху)

Система охлаждения GTX 680 (вид снизу)

Система охлаждения GTX 680 (вид снизу)

Система охлаждения кажется куда менее затейливой, чем прежде, но это обманчивое впечатление. Теплотрубки расположены по всему основанию радиатора, что помогает эффективнее отводить и распределять тепло по ребрам. Всё охлаждение сводится к одному радиатору и турбине. Микросхемы памяти и силовые элементы, как и раньше, контактируют с радиатором через термолипучки.

Уменьшение техпроцесса обычно приводит к понижению тепловыделения, но здесь изменения существенны. Мы обязательно проверим, насколько хорошо система охлаждения справляется со своей задачей.

Печатная плата с демонтированным охлаждением

Печатная плата с демонтированным охлаждением

При первом взгляде на печатную плату она кажется пустоватой и простенькой. Дело в том, что мы привыкли к поедающим энергию монстрам с широкими шинами памяти. Здесь все скромнее. Шина памяти 256 бит упрощает и удешевляет производство печатных плат. В центре расположился сам GPU видеокарточки.

NVIDIA GPU GK104

NVIDIA GPU GK104

NVIDIA GPU GK104

Маркировка GK104-400-A2. Сам GPU сравнительно скромных размеров. Вокруг него находится защитная рамка, предохраняющая GPU от сколов во время монтажа системы охлаждения.

Микросхема видеопамяти

Микросхема видеопамяти

Микросхема видеопамяти

Вокруг GPU расположились восемь микросхем памяти производства Hynix. Емкость одной микросхемы 256 Мбайт. Маркировка H5GQ2H24MFR-ROC. Общий объем 2048 Мбайт. Это достаточный на сегодняшний день объем видеопамяти, который позволит избежать свопов даже в самых требовательных играх.

Подсистема питания GPU четырехфазная. Правда, на печатной плате есть посадочное место и под пятую фазу, но, видимо, компания NVIDIA решила, что четырех фаз будет достаточно для стабильной работы. Подсистема питания видеопамяти двухфазная.

Переходим к самому интересному — результатам тестирования.

Таблица технических характеристик

 NVIDIA GTX 680NVIDIA GTX 580AMD Radeon HD 7970
ЯдроGK104GF110Tahiti
Количество транзисторов, млрд. шт3.53.04.3
Техпроцесс, нм284028
Количество потоковых процессоров15365122048
Количество блоков (ROPs)324832
Частота ядра, МГц1006772925
Шина памяти, бит256384384
Тип памятиGDDR5GDDR5GDDR5
Объем памяти, Мбайт204815363072
Частота памяти, МГц600040085500
Поддерживаемая версия DirectX11.11111.1
Стоимость, руб18 00012 00017 000

 

Тестовый стенд

  • Процессор — Intel Core i7 3960X
  • Материнская плата — ASUS P9X79 Deluxe
  • Оперативная память — Corsair XMS3 1600 МГц 9C 4x4 Гбайт
  • Жесткий диск — Intel SSD 160 Гбайт
  • Блок питания — Corsair HX850W

Результаты тестирования

Все тестирования проводились в разрешениях 1920 х 1080 и 2560 х 1440. Настройки графики были максимальными. Полноэкранное сглаживание 4х, анизотропная фильтрация 16х.

Результаты тестирования в 3DMark 11

Результаты тестирования в 3DMark 11

Результаты тестирования в 3DMark 11

Отличный старт. Новинка выигрывает у HD 7970 почти 500 очков в популярном полусинтетическом бенчмарке. Относительно предыдущего поколения прирост производительности составляет 50%.

Результаты тестирования в Batman: Arkham City

Результаты тестирования в Batman: Arkham City

Результаты тестирования в Batman: Arkham City

В игре Batman: Arkham City видеокарта GTX 680 также опережает своего соперника. Разгон практически не прибавляет FPS, жаль.

Результаты тестирования в Battlefield 3

Результаты тестирования в Battlefield 3

Результаты тестирования в Battlefield 3

В данной игре разгон уже более заметен, но все равно от такой прибавки частоты по GPU хотелось бы получать больше. В разрешении 2560 видеокарта HD 7970 сокращает разрыв относительно разрешения 1920. Вероятно, начинает сказываться шина 384 бит.

Результаты тестирования в Aliens VS Predator

Результаты тестирования в Aliens VS Predator

Результаты тестирования в Aliens VS Predator

А вот и первая игра, в которой GTX 680 даже в разгоне не может догнать стоковую HD 7970.

Результаты тестирования в Dirt3

Результаты тестирования в Dirt3

Результаты тестирования в Dirt3

В игре Dirt3 новинка с существенным отрывом опережает HD 7970. Прирост относительно предыдущего поколения составляет около шестидесяти процентов.

Результаты тестирования в Crysis 2

Результаты тестирования в Crysis 2

Результаты тестирования в Crysis 2

Великий и ужасный Crysis 2. GTX 680 все так же опережает HD 7970. Приятно, что даже в разрешении 2560 показатели далеки от 30 кадров, ниже которых ощутимо снижается уровень комфортности. Разгон прибавляет новинке около 10% производительности.

Результаты тестирования в Lost Planet 2

Результаты тестирования в Lost Planet 2

Результаты тестирования в Lost Planet 2

GTX 680 намертво вцепилась в первое место и не хочет его уступать. Прирост относительно предыдущего поколения составляет около 40 процентов.

Результаты тестирования в H.A.W.X.2

Результаты тестирования в H.A.W.X.2

Результаты тестирования в H.A.W.X.2

Внезапно HD 7970 вырывается в лидеры и GTX 680 только в разгоне её догоняет.

Результаты тестирования в Metro 2033

Результаты тестирования в Metro 2033

Результаты тестирования в Metro 2033

В наитяжелейшей игрушке современности Metro 2033 лидерские позиции также удерживает HD 7970. Хотя, разница в один кадр на самом деле роли не играет.

Результаты тестирования в Resident Evil 5

Результаты тестирования в Resident Evil 5

Результаты тестирования в Resident Evil 5

В игре Resident Evil 5 новинка одерживает победу в разрешении 2560, но проигрывает в разрешении 1920.

Результаты тестирования в Mafia II

Результаты тестирования в Mafia II

Результаты тестирования в Mafia II

Во второй Мафии в разрешении 2560 соперники практически равны, новинка выигрывает всего два кадра.

Температура и энергопотребление

Мы уже давно привыкли что видеокарты серии GTX называют ПЕЧками, и не только потому , что эти три буквы печатаются, если вы забыли переключить раскладку.

Температура

Температура

Температура

Но только не в этот раз. NVIDIA GTX 680 оказывается даже на несколько градусов холоднее HD 7970, приятно. Это значит, что система охлаждения не будет завывать во время долгих баталий, а GTX 680 — все-таки игровая видеокарта. Хочется верить, что пользователи забудут, что такое «отвал GPU», навсегда.

Энергопотребление

Энергопотребление

Энергопотребление

Не менее важно и энергопотребление. Предыдущие карты не славились малыми аппетитами. Но и тут GTX 680 вырывается вперед. Замер потребления энергии проводился в самом тяжелом режиме игры Crysis 2. Было решено отказаться от FurMark, так как современные карты частенько обладают вшитой защитой от него и во время тестирования ведут себя странно и непредсказуемо. При бОльшей производительности в Crysis 2, новинка потребляет меньше энергии, чем Radeon HD 7970. Это действительно успех.

Заключение

NVIDIA GTX 680 — видеокарта, о которой до момента анонса ходило множество слухов — предстала перед нами во всей красе и приятно удивила. Компания NVIDIA при разработке архитектуры Kepler учла и исправила все недостатки предыдущих решений, и это прекрасно.

Производительность карты в большинстве игр выше, чем у Radeon HD 7970. В нашем тестировании присутствует лишь несколько игр, в которых победу одержали «красные».

Как мы выяснили, энергоэффективность видеокарты также превосходна. При более высокой производительности, она потребляет меньшее количество энергии, нежели Radeon HD 7970. Это очень важный момент, так как обозначает, что и тепловыделение также снизится. Последнее мы проверили, и предположения оправдались. А, это в свою очередь, делает видеокарту более тихой. Кстати, про тишину: NVIDIA и здесь обошла конкурентов, ибо карта получилась ощутимо тише Radeon HD 7970 в нагрузке.

Новая технология NVIDIA GPU Boost позволяет выжимать из карты еще большую производительность. Когда карта может увеличить тактовую частоту GPU, не перешагнув при этом лимит по TDP, она делает это сама, без какого-либо вмешательства пользователя. Если данная технология получит развитие, то она может стать очень успешной и востребованной.

Приятным бонусом идет возможность подключения четырех мониторов к одной видеокарте; раньше для этого пришлось бы собирать SLI-связку.

Менее ресурсозатратный, но не менее качественный режим сглаживания TXAA также будет полезен любому геймеру.

От работы с картой остается впечатление действительно нового продукта, а не очередного апгрейда. При рекомендованной цене в 18 000 рублей у GTX 680 есть отличные шансы стать удачной покупкой.