Компьютеры

Идеальный шторм. Обзор Palit GeForce GTX 750 Ti StormX Dual

Компания Palit Microsystems еще в начале 2014 года анонсировала новую серию дискретных видеокарт StormX. Создание нового имени связано, в первую очередь, с выпуском новейшего семейства графических чипов архитектуры Maxwell от NVIDIA. Второй причиной является внедрение усовершенствованных технологий, улучшающих качество, производительность и надежность видеокарт Palit.

Продукция гонконгской компании широко распространена в мире, и по некоторым оценкам доля Palit на рынке видеоадаптеров составляет порядка 20-25% от общего числа. Это вполне закономерно, учитывая лояльную ценовую политику производителя вкупе с продвинутыми технологиями своих решений. Китайская компания в очередной раз не изменила своим принципам и выпустила бюджетные модели GeForce GTX 750 Ti StormX Dual и StormX OC. Как заверяют в Palit, эта серия предлагает улучшенные оверклокерские возможности, при этом обладая рядом отличительных свойств, речь о которых пойдет далее.

Palit GeForce GTX 750 Ti StormX Dual

Новые подробности о Maxwell

А пока стоит еще раз напомнить, что героиня данного обзора основана на новейшей архитектуре Maxwell, в одной из статей мы уже говорили об основные особенности референсной GeForce GTX 750 Ti. Однако уже после выхода материала NVIDIA предоставила отчет, в котором появились дополнительные данные о свойствах архитектуры. В первую очередь она пригодится программистам, но, на наш взгляд, представленная ниже информация будет интересна и обычному пользователю.

Приоритетной областью применения архитектуры Maxwell являются устройства с ограниченным временем автономной эксплуатации (читай — ноутбуки) и мини-ПК. Также NVIDIA планирует в ближайшее будущее укрепить свои позиции на рынке серверных решений за счет улучшения потребительских характеристик линейки рабочих карт Tesla.

Сердце Maxwell: более эффективные мультипроцессоры

Потоковый процессор (SMM) в новейшей архитектуре фактически был создан с нуля и обладает лучшей энергоэффективностью по сравнению с предшественниками. Однако Kepler (SMX) был достаточно эффективен для своего времени. В результате его создания инженерам компании удалось увидеть новые горизонты расширения энергоэффективности GPU, которые впоследствии и были реализованы в SMM. Улучшения коснулись механизмов распределения управляющей логики и нагрузки, гранулярности алгоритмов энергосбережения, планирования инструкций и количества исполняемых инструкций за такт, а также многих других аспектов, позволивших SMM намного опередить SMX в эффективности. Новая архитектура позволила увеличить количество мультипроцессоров до пяти в GM107 при увеличении полезной площади кристалла всего на 25%.

Различия между Kepler и Maxwell

Улучшенное планирование инструкций

Так как прирост производительности в расчете на один мультипроцессор по сравнению с Kepler составил 10%, то было решено сократить количество ядер CUDA на каждый SMM. Однако число CUDA-ядер превышает показатели Fermi и Kepler. Также у SMM осталось то же самое количество планировщиков инструкций, но были уменьшены задержки на арифметических операциях по сравнению с Kepler.

Блок-схема процессора GM107

Как и в SMX, в каждом SMM есть четыре warp-планировщика. Однако в отличие от SMX все ключевые функциональные блоки SMM привязаны к определенному планировщику, а не делятся между ними. Количество ядер на один раздел возведено в квадрат, что упрощает планирование, так как каждый планировщик использует свой собственный набор ядер, равный размеру warp’а. Warp-планировщик, в свою очередь, за один такт может по-прежнему выполнять две инструкции (например, совершать математическую операцию на CUDA-ядрах одновременно с операцией обращения к памяти в блоке load/store), однако теперь можно полностью загрузить CUDA-ядра, даже если планировщик отправляет на выполнение по одной инструкции.

Блок-схема SMM

Уменьшены задержки при выполнении арифметических инструкций

Еще одним значительным преимуществом SMM является уменьшение задержек выполнения арифметических инструкций. Так как загрузка мультипроцессора, которая преобразуется в параллелизм на уровне warp’ов, у SMM такая же или лучше, чем у SMX, то сокращенные задержки улучшают использование CUDA-ядер и повышают скорость работы GPU.

Увеличенная загрузка потоковых процессоров

SMM по многим показателям похож на SMX архитектуры Kepler, при этом ключевые изменения нового типа процессоров направлены на повышение эффективности без необходимости значительного увеличения параллелизма. Размер регистрового файла (64K 32-битных регистров), максимальное количество warp’ов на SMM (64 warp’а) и максимальное количество регистров (255 регистров) остались прежними. Максимальное количество блоков на потоковый мультипроцессор SMM удвоилось до 32, что должно привести к автоматическому увеличению загрузки для ядер, которые используют малый размер блока — 64 или меньше, предполагая, что регистры и разделяемая память не ограничивают загрузку мультипроцессора.

В таблице ниже представлены ключевые характеристики GM107 в сравнении с GK107.

GPUGK107 (Kepler)GM107 (Maxwell)
Ядра CUDA384640
Базовая частота1058 МГц1020 МГц
Boost-частота GPUн/д1085 МГц
GFLOPs812.51305.6
Compute Capability3.05.0
Разделяемая память / SM16 КБ / 48 Кбайт64 Кбайт
Размер регистрового файла / SM256 Кбайт256 Кбайт
Максимальное кол-во блоков / SM1632
Частота памяти5000 МГц5400 МГц
Полоса пропускания памяти80 Гбайт/с86,4 Гбайт/с
Размер кэша L2256 Кбайт2048 Кбайт
TDP64 Вт60 Вт
Транзисторы1,3 млрд1,87 млрд
Площадь кристалла118 мм2148 мм2
Техпроцесс28 нм28 нм

Увеличенная выделенная общая память

В архитектуре Maxwell предусмотрено 64 Кбайт разделяемой памяти, в то время как в Fermi или Kepler эта память делится между L1-кэшом и разделяемой памятью. В Maxwell один блок по-прежнему может использовать до 48 Кбайт разделяемой памяти, причем увеличение общего объема может привести к увеличению загрузки мультипроцессора. Это стало возможным благодаря объединению функциональности L1-кэша и текстурного кэша в отдельном блоке.

Быстрые атомарные операции в разделяемой памяти

В архитектуре Maxwell появились встроенные атомарные операции над 32-битными целыми числами в разделяемой памяти, а также CAS-операции над 32-битными и 64-битными значениями в разделяемой памяти. С их помощью можно реализовать другие атомарные функции. В случае Kepler и Fermi приходилось использовать сложный принцип Lock/Update/Unlock, что приводило к дополнительным издержкам.

Динамический параллелизм

Динамический параллелизм, появившийся в Kepler GK110, позволяет GPU самому создавать задачи для себя. Поддержка этой функции была впервые добавлена в CUDA 5.0, позволяя нитям на GK110 запускать дополнительные ядра на том же GPU.

Теперь динамический параллелизм поддерживается во всей продуктовой линейке, включая даже такие экономичные чипы, как GM107. Разработчикам это на руку, так как теперь для приложений не требуется создавать специальные алгоритмы для High-end GPU, отличающиеся от тех, которые используются с графическими процессорами более низкого уровня.

Технические характеристики и особенности конструкции

Видеокарта, как вы уже успели догадаться, является нереференсным решением. Об этом говорят не только внешние отличия, но и показатели частот памяти и графического процессора. Чип разогнан на 182 МГц, а память — на 152 (608) МГц.

 Palit GeForce GTX 750Ti StormX DualNVIDIA GeForce GTX 760ASUS GTX750TI-OC-2GD5NVIDIA GeForce GTX 750 TiNVIDIA GeForce GTX 650 TiNVIDIA GeForce GT 640AMD Radeon R7 265  AMD Radeon R7 260X  
Название GPUGM107GK104GM107GM107GK106GK107CuracaoBonaire XTX
Техпроцесс28 нм28 нм28 нм28 нм28 нм28 нм28 нм28 нм
Частота GPU(Boost)1202 (1281)  МГц980 (1033) МГц1072 (1150) МГц1020 (1085) МГц928 МГц891 МГц900 (920) МГц1100 МГц
Количество потоковых процессоров64011526406407683841024896
Количество текстурных блоков4096404064326456
Количество блоков растеризации1632161616163216
Память2 Гбайт, GDDR52 Гбайт, GDDR52 Гбайт, GDDR52 Гбайт, GDDR51 Гбайт, GDDR51 Гбайт, GDDR52 Гбайт, GDDR52 Гбайт, GDDR5
Шина128 бит256 бит128 бит128 бит128 бит128 бит256 бит128 бит
Частота памяти6008 МГц6000 МГц5400 МГц5400 МГц6008 МГц-5600 МГц6500 МГц
TDP видеокарты60 Вт170 ВтN/A60 Вт110 Вт64 Вт150 Вт115 Вт
Видеовыходы1х mini-HDMI, 1х DVI-D, 1х D-Sub2x DVI, 1x HDMI, 1x DisplayPort2x DVI, 1x D-Sub, 1x HDMI2x DVI, 1x mini-HDMI2x DVI, 1x mini-HDMI1x DVI, 1x D-Sub, 1x HDMI1x DVI, 1x HDMI, 1x DisplayPort2x DVI, 1x HDMI, 1x DisplayPort
Ориентировочная цена, руб.5 9009 0007 0005 4905 0003 0005 5005 000

Устройство поставляется в картонной коробке небольшого размера. Внешний вид упаковки не слишком броский, однако оригинальный подход к оформлению заслуживает отдельного упоминания. Внутри находятся непосредственно видеокарта, инструкция и диск с драйверами и утилитами. В целом уровень комплектации соответствует устройству начального класса.

Упаковка Palit GeForce GTX 750 Ti StormX Dual

GeForce GTX 750 Ti позаимствовала некоторые внешние особенности видеокарт линейки JetStream. Прежде всего это заметно по характерной черно-кремовой окраске и Х-образному профилю посередине. Кожух выполнен без характерных выступов, поэтому видеокарта внешне получилась более «скромной», то есть без лишних наворотов. Однако мы не будем заострять на этом внимание. Это дело вкуса, а реальная оценка функциональности устройства впереди.

Palit GeForce GTX 750 Ti StormX Dual

Обратная сторона может похвастать разве что обилием стикеров, нежели интересной элементной базой.

Обратная сторона Palit GeForce GTX 750 Ti StormX Dual

Один из вентиляторов практически полностью выступает за поверхность платы, благодаря чему вторая половина радиатора лучше охлаждается насквозь проходящим через нее потоком воздуха.

Кожух Palit GeForce GTX 750 Ti StormX Dual

Панель видеовыходов имеет необходимый набор интерфейсов. Особенно нас порадовало наличие уже устаревшего, но все еще очень популярного разъема VGA. Все-таки перед нами карта начального класса, к которому может быть подключен старенький монитор, не поддерживающий Full HD.

Панель I/O Palit GeForce GTX 750Ti StormX Dual

Для отвода тепла используется цельный алюминиевый радиатор с увеличенной площадью рассеивания. Графический чип контактирует с подошвой через тонкий слой термоинтерфейса. Качество обработки основания находится на высоте. Для нагнетания воздуха применяются два 80-мм вентилятора TurboFan Blade, изготовленных по примеру самолетных движителей. При помощи новейшей конструкции StormX китайским инженерам удалось на 13% улучшить разгонный потенциал видеокарты.

Радиатор и вентиляторы Palit GeForce GTX 750 Ti StormX Dual

На печатной плате длиной 145 мм компоненты расположены весьма компактно, при этом имеется свободное пространство между самыми «горячими» элементами. Если провести сравнение с дизайном референсной модели, то чувствуется определенное сходство, хотя и не столь очевидное.

Печатная плата Palit GeForce GTX 750 Ti StormX Dual

Схема питания выполнена по схеме 2+1, где две фазы предназначены для питания GPU. Не будем многословны — элементная база очень качественная, поэтому в пределах существующего термопакета видеокарта будет вести себя стабильно и при разгоне. Напомним, что Palit GeForce GTX 750 Ti не имеет коннектора дополнительного питания, так как заявленные 60 Вт спокойно передаются разъемом PCI Express x16.

В качестве драйвера вентиляторов используется Nuvoton 3941S-A, специально предназначенный для точного регулирования оборотов кулеров.

Графический чип сдвинут вправо, слегка отдалившись от системы питания. По периметру GPU имеется рамка для защиты кристалла от скола.

Графический чип Palit GeForce GTX 750 Ti StormX Dual

Четыре микросхемы Samsung K4G41325FC-HC03 по 512 Мбайт каждая образуют массив памяти объемом 2 Гбайт. Каждый чип имеет ширину пропуска 32 бит. Следовательно, общая шина данных составляет 128 бит. Пропускная способность памяти увеличена до 96,1 Гбайт/с в связи с заводским оверклокингом памяти.

Память Palit GeForce GTX 750 Ti StormX Dual

Тестирование

Тестовый стенд

  • Процессор — Intel Core i5-4670K
  • Материнская плата — GIGABYTE G1.SNIPER 5
  • Оперативная память — AMD Memory DDR3-2133, 2x 8 Гбайт
  • Накопитель — OCZ Vertex 3, 360 Гбайт
  • Блок питания — LEPA G1600, 1600 Вт
  • Периферия: Dell U2711b, ROCCAT ARVO, ROCCAT SAVU
  • Операционная система — Windows 8.1 х64

Результаты тестирования

Результаты тестирования Palit GeForce GTX 750 Ti в 3DMark11

Результаты бенчмарка 3DMark 11 наглядно иллюстрируют превосходство решения от Palit над видеокартами с аналогичным GPU. Наибольший отрыв наблюдается от референсной модели. А вот до уровня GeForce GTX 760 ему достаточно далеко.

Результаты тестирования Palit GeForce GTX 750 Ti в 3DMark Fire Strike

В более ресурсоемком синтетическом тесте мы видим аналогичную картину. Здесь Palit GeForce GTX 750 Ti уступает лишь двум решениям: AMD Radeon R7 265 и NVIDIA GeForce GTX 760.

Результаты тестирования Palit GeForce GTX 750 Ti в играх при 1080p

Однако более объективное представление об уровне производительности могут дать только игры. Вот тут-то и вырисовывается основной конкурент Palit GeForce GTX 750Ti — AMD Radeon R7 265. На диаграмме видно небольшое преимущество решения от «красных», местами даже уходящее в приличный отрыв, но в целом этот разрыв не столь существенный.

Эффективность работы СО и разгон

Нереференсные модели от Palit отличаются дюжей «хладнокровностью», поэтому перед этим этапом тестирования у нас была уверенность, что и на этот раз очередной продукт компании оправдает наши ожидания.

Данные мониторинга MSI Afterburner

Максимальная температура остановилась на отметке 72 градуса Цельсия. Это очень хороший показатель, если учесть, что мы имеем дело с уже разогнанной видеокартой. Стоит учесть тот момент, что СО не использует ни испарительную камеру, ни радиатор с тепловыми трубками.

Температура и шум Palit GeForce GTX 750 Ti

Уровень шума также соответствует комфортным показателям и составляет 39,7 дБ.

Нам удалось еще немного разогнать Palit GeForce GTX 750 Ti: до 1310 МГц по чипу — это практически на 300 МГц больше референсного значения! Выходит, что несмотря на свою скромную СО и элементную базу, видеокарта китайского производителя отлично продемонстрировала свои оверклокерские амбиции.

При повторном тестировании, но после разгона Palit GeForce GTX 750 Ti StormX Dual лишь укрепила свои позиции перед ближайшим преследователем в лице ASUS GTX750TI-OC-2GD5.

Результаты тестирования в 3DMark Fire Strike при разгоне

Хоть Palit GeForce GTX 750 Ti и является разогнанной версией, но китайским инженерам удалось уложиться в номинальный термопакет 60 Вт. Связано это в первую очередь с применением энергосберегающей технологии Power Saving GTX, а также с использованием усовершенствованного ШИМ-контроллера вкупе с полевыми транзисторами цепи питания.

Конкуренты

Пожалуй, единственным конкурентом можно с уверенностью назвать видеокарту AMD Radeon R7 265. В плане производительности она, безусловно, лучше, однако нас смущает ее завышенное энергопотребление.

SAPPHIRE Dual-X R7 265

Выбор редакции

Хотелось бы отметить организованную работу инженеров Palit. Конечно, многие пользователи припомнят гонконгскому производителю неудачные модели видеокарт. Однако стоит спросить себя: а у кого не было падений? На наш взгляд, в Palit осознают потребность во внедрении новейших технологий, и компания всегда стремится идти в ногу со временем.

Превосходные показатели Palit GeForce GTX 750 Ti наглядно продемонстрировали эффективность архитектуры Maxwell. Если учесть, что StormX Dual отлично подходит для игр в высоком разрешении, при этом не требуя дополнительного питания, то данную видеокарту можно с уверенностью рекомендовать геймерам, любящим тишину, а также отдающим предпочтение экономичным, компактным решениям.

Наконец, на сегодняшний день модель Palit считается одной из самых быстрых GeForce GTX 750 Ti, доступных в свободной продаже в России. За совокупность достоинств мы вручаем устройству награду «Выбор редакции».