Предварительный обзор Sandy Bridge: очередной виток эволюции

Егор Емельянов, 

Sandy Bridge — название новой процессорной архитектуры Intel. Чипы, использующие эту архитектуру, придут на смену моделям Intel Core i7, i5 и i3. Анонс новых процессоров уже не за горами, поэтому мы решили поделиться известной информацией об особенностях готовящихся новинок.

Предшественники

Задолго до анонса Sandy Bridge мир взорвало появление крайне производительных и дорогих процессоров Nehalem, которые впервые для Intel обзавелись встроенным в процессор контроллером памяти, да еще с поддержкой трехканального доступа — это подняло производительность оперативной памяти на небывалую высоту.

Мощный и революционный Nehalem
Мощный и революционный Nehalem

Северный мост у процессоров Bloomfield, основанных на архитектуре Nehalem, всё еще продолжал существовать в виде отдельной микросхемы. Там разместился контроллер шины PCI Express 2.0. Мощный контроллер памяти, скоростная шина QPI привели к необходимости разработки нового процессорного разъема с большим количеством контактов, им стал LGA1366, который используется для процессоров Bloomfield и Gulftown — последние являются самыми мощными на сегодня десктопными шестиядерными процессорами. В их основе также лежат архитектурные особенности Nehalem. Кстати, именно в Nehalem была добавлена поддержка NVIDIA SLI на чипсете Intel — до этого NVIDIA не предоставляла лицензии SLI для драйверов Intel. Причем две видеокарты могли работать в режиме x16 + x16. Однако процессоры Bloomfield оказались очень дорогими, что сделало их уделом систем для состоятельных энтузиастов и богачей. Дороговизна чипов объяснялась сложным контроллером памяти и применением сверхбыстрой шины QPI, соединяющей процессор с северным мостом.

Появившиеся следом за Nehalem процессоры с кодовым именем Lynnfield имели четыре ядра и стали первыми кристаллами Intel, в которые был полностью интегрирован северный мост (включающий контроллер шины PCI Express и скоростную шину QPI для связи северного моста с процессорными ядрами), а не только контроллер оперативной памяти DDR3. Процессоры Lynnfield, благодаря наличию северного моста на борту, не требовали внешней скоростной и дорогостоящей шины QPI, да и контроллер памяти использовался двухканальный — это позволило упростить кристалл Nehalem и сделать процессор менее дорогим. Архитектурно же Lynnfield почти полностью повторяет Bloomfield. Вместе с анонсом новых процессоров были объявлены чипсеты Intel 55-ой серии и новый процессорный разъем LGA1156. Отличием Lynnfield от позже вышедших Clarkdale являлось отсутствие графического ядра на процессоре, четыре процессорных ядра и техпроцесс 45 нм. Процессоры получились очень удачными по соотношению «цена-производительность» и сейчас являются самыми желанными и покупаемыми процессорами для игровых компьютеров среднего класса.

Процессор Lynnfield рядом с единственным мостом чипсета — впервые для Intel
Процессор Lynnfield рядом с единственным мостом чипсета — впервые для Intel

Процессоры с кодовыми именами Clarkdale и Arrandale (основанные на архитектуре Westmere) показали отличную производительность и обрели немалую популярность у потребителей, во многом благодаря мобильному сегменту. Однако, как вы могли заметить, процессоры Clarkdale все же далеки от совершенства: они — первый опыт Intel по совмещению на одном корпусе двух процессорных ядер и графического процессора. Поскольку у компании возникли определенные сложности по интеграции видеоядра на один кристалл с процессорными ядрами, то на одном корпусе процессора были размещены два кристалла, выполненные по различным техпроцессам. Да и разработка совершенно нового комбинированного ядра в кратчайшие сроки не была экономически целесообразна (из-за возможных сложностей с новым тонким техпроцессом 32 нм, на который требовалось бы перевести и видеоядро). Процессорные ядра вместе кэш-памятью L3 были выполнены по новым перспективным нормам 32 нм, что позволило упаковать большое количество транзисторов на относительно маленьком кристалле. В то же время графическое ядро и остальная системная логика были выполнены по 45-нм техпроцессу, из-за чего процессор без теплораспределительной крышки выглядел как конструкция из двух микрочипов на одном корпусе-плате.

Процессор Westmere в сравнении с процессором Conroe (Core 2 Duo)
Процессор Westmere в сравнении с процессором Conroe (Core 2 Duo)

Графическое ядро представляло собой слегка модифицированное ядро, которое ранее встраивалось в чипсеты Intel G45 и называлось GMA4500; в процессорах Clarkdale оно стало называться Intel HD Graphics. Новое ядро получило возможность нормально декодировать HD-контент, однако по игровой и графической производительности ненамного ушло вперед по сравнению с предшественником. Известно, что ранее Intel собиралась выпустить процессоры Havendale, в которых планировалось объединить процессор, графическое ядро и системную логику на одном 45 нм кристалле. Однако что-то остановило компанию от этого анонса. Похоже, что в дальнейшем графическая часть и системная логика перекочевала из этого проекта в Clarkdale. В то же время, процессорные ядра успели перевести на 32 нм техпроцесс. Отсюда и два кристалла, ведь объединение на одном кристалле 32 нм и 45 нм ядер технически совершенно невозможно.

Sandy Bridge — это дальнейшее развитие микроархитектуры Nehalem/Westmere. Согласно интеловской стратегии «Тик-Так», именно чипы Sandy Bridge являются конечной архитектурой нового поколения: «Тик» — это переходные модели, «Так» — конечные. Часики тикают, прогресс движется вперед.

Sandy Bridge. Что нового?

Перейдя на новую ступень эволюции, Intel разрешила проблему нового техпроцесса 32 нм, который за время производства процессоров Clarkdale был достаточно отработан, чтобы выход годных кристаллов составлял большой процент. Развитие технологии производства 32-нм пластин позволило компании сосредоточиться и усовершенствовать процессор со встроенным графическим ядром, сделав его однокристальным. Также в Intel позаботились и о новых возможностях, которыми обладают процессорные ядра. Если провести анализ архитектуры Sandy Bridge в сравнении с предыдущими моделями, то наиболее уместно будет сравнить новинку с процессорами Clarkdale (потому что новинка оснащена встроенным видеоядром) и Lynnfield (поскольку Sandy Bridge наконец-то обзаведется четырьмя ядрами).

Эпитеты, которыми наградила Intel новые ЦП, звучат не иначе, как «энергоэффективные» и «экстремально производительные» — маркетинг не дремлет. Однако на практике даже после громких обещаний следует не столь большая реальная прибавка в производительности по сравнению с прошлым поколением.… Но в любом правиле есть исключения: подождем — увидим.

Чем же таким могут похвастать новые процессоры? Прежде всего, как уже говорилось, они выполнены на очень тонком техпроцессе, что дает все основания заявлять о высокой экономичности. Впрочем, и тут громкой революции ожидать не приходится, хотя эффективность Sandy Bridge лучше, чем у Clarkdale — пока на бумаге, разумеется. Реальные параметры энергоэффективности можно будет узнать только после сравнительных тестов. Вторым отличием от Clarkdale можно считать то, что процессор и видеоядро объединены, наконец, на одном кристалле. Кроме того, Intel обновили и само графическое ядро, увеличив его частоту, однако DirectX 11 оно все так же не поддерживает — об этом ниже.

Отныне канули в лету и прибавляющиеся от версии к версии SIMD-расширения SSE, которые заменяются более универсальными инструкциями для векторных вычислений AVX (Advanced Vector Extensions). Последние включают все функции MMX и SSE, присущих всем предыдущим процессорам Intel, а также реализуют новые возможности для современного и производительного мультимедийного программного обеспечения. Применение инструкций AVX создаст дополнительный стимул для появления новых программ, которые будут гораздо быстрее обрабатывать научные и мультимедийные задачи, выполнять вычисления с плавающей точкой, выполнять параллельные вычисления.

Остальные отличия архитектурные. Скажем, еще со времен Intel Core 2 Duo применяется небольшое расширение под названием Loop Stream Detector, отвечающее за энергосбережение процессоров. Эта инструкция детектирует простаивающие блоки во время работы процессора и отключает их, экономя энергию. В процессорах Sandy Bridge данная функция была усовершенствована: теперь блоки не отключаются совсем, однако регулируется число выполняемых ими инструкций и команд, что приводит не только к более гибкому управлению экономией энергии, но и к гораздо меньшим потерям производительности.

Упрощенная блок-схема Sandy Bridge
Упрощенная блок-схема Sandy Bridge

Данное решение достигается при помощи нового буфера микрокоманд, причем этот буфер полностью включен в состав L1-кэша. Кроме того, усовершенствован механизм предсказания ветвлений (Branch Prediction Unit), который стал более точным по сравнению с ранними процессорами. Новый BPU хранит вдвое больше целевых адресов и более длинную историю команд. К BPU подключен блок, детектирующий взаимодействие с uop-кэшем, благодаря чему процессор гибко управляет декодерами и кэшем в области их энергопотребления.

Взаимодействие кэш-памяти с блоком предсказания ветвлений
Взаимодействие кэш-памяти с блоком предсказания ветвлений

Изменения коснулись и конвейера, причем они еще более глубокие. Связано это, прежде всего, с введением в конструкцию новых инструкций AVX, которые мы упоминали выше. Вместе с ними произошел переход от полного буфера ROB к комбинации сокращенного ROB и PRF (Integer PRF и Float-Point PRF).

Функциональность Nehalem и Sandy Bridge — преимущество на стороне новинки
Функциональность Nehalem и Sandy Bridge — преимущество на стороне новинки

PRF (Physical Registry Files) можно перевести как «Физические регистровые файлы». Разница с предыдущими процессорами в том, что теперь сами данные необязательно пересылать, достаточно отправить ссылки на них, что гораздо быстрее, поскольку адресация в этом случае гораздо эффективнее. А вот с инструкциями AVX всё не так просто.

256-битные регистры AVX
256-битные регистры AVX

Теперь 128-битные регистры XMM, присутствующие в наборах SSE, расширяются до 256-битных регистров YMM, вместе с возможностью использования трех или четырех операндов без удаления исходных данных. Преимущество трехоперандных команд заключается в уменьшении времени выполнения инструкций, поскольку не тратится время на перенос данных. Также для исполнения команд с нужной скоростью расширились и внутрипроцессорные шины, в частности, у кэша данных L1 увеличилась пропускная способность.

Среди прочих нововведений можно отметить кольцевую шину на 32 байта, соединяющую графическое, вычислительные ядра, кэш L3 и северный мост. Эта шина, можно сказать, пришла из архитектуры Nehalem-EX, некогда анонсированной в серверном сегменте. Кстати, кэш L3 у новых процессоров предоставляет по одному банку на каждое вычислительное ядро процессора. Становится ясно, что благодаря такому построению общего разделяемого кэша производительность кэш-памяти будет возрастать с увеличением количества ядер, однако из-за применения общей шины возможен рост латентности кэша.

Блок-схема общей кольцевой шины
Блок-схема общей кольцевой шины

А теперь стоит сказать пару слов о встроенном обновленном графическом ядре. Как обещает Intel, производительность графики в новых процессорах должна вырасти, причем этому утверждению можно верить, ведь количество исполнительных процессоров в новом ядре увеличилось максимум вдвое. Однако их число будет зависеть от модели процессора: максимальное количество — двенадцать — ядер будет иметь старшая модель процессора, остальные удовольствуются шестью ядрами. Еще одним плюсом является то, что графическое ядро получит возможность доступа к общей быстрой кэш-памяти третьего уровня.

Блок-схема графической подсистемы
Блок-схема графической подсистемы

Впрочем, как было указано выше, ожидаемого многими перехода интеловских интегрированных графических ядер на API DirectX 11 не произошло — видеоядро поддерживает лишь устаревший DirectX 10.1. При этом Intel делает ставку на улучшение производительности параллельных вычислений посредством мощностей видеоядра (отсылка к мифическому Larrabee).

Подсистема питания также претерпела некоторые изменения. Процессор будет получать три линии питания: две регулируемых для вычислительных ядер (Core) и графики, одну, нерегулируемую, для Uncore. Улучшения коснулись и режима Turbo Boost.

Более агрессивная работа Turbo Boost
Более агрессивная работа Turbo Boost

Как и в случае с другими процессорами Intel, процессоры Sandy Bridge будут делиться на модели с разной тепловой мощностью (TDP). Так, в линейке будут представлены модели на 35, 45, 65 и 95 Вт для настольных систем и 35, 45 и 55 Вт для мобильных систем. Наверняка позже появятся модели с пониженным напряжением питания для экономичных ноутбуков.

Другие особенности

С названиями и маркировкой процессоров в Intel мудрить не стали. В общих чертах стиль наименования сохраняется от старых линеек, за исключением появившейся цифры 2 в названии модели, что означает второе поколение процессоров Intel Core i.

Название новых процессоров будет знакомым
Название новых процессоров будет знакомым

Буква после цифр в названии будет определять возможности процессоров. Так, буква K в конце укажет на незаблокированный множитель (как и сегодня), буква S — на экономичный процессор, T — энергосберегающий, M — мобильный. Кстати, у новых процессоров разгон будет возможен только на моделях с незаблокированным множителем, поскольку базовая частота жестко «зашита» в процессор — это следствие того, что тактовый генератор отныне встроен в процессор. Ранее тактовый генератор устанавливался на системной плате в виде отдельной микросхемы, чем всегда пользовались энтузиасты, особенно на ноутбуках — определив модель микросхемы, можно было увеличивать производительность процессора. Встроенный в процессор тактовый генератор подразумевает, что владелец просто не сможет изменить базовую частоту, поэтому привычный для многих разгон повышением базовой частоты у новых процессоров невозможен в принципе. Хотя жаловаться не на что: Intel заботливо предусмотрела улучшенную технологию Turbo Boost, которая нивелирует данный недочет. Повышать же частоту памяти или шины PCI-E все-таки будет возможно.

Не слишком радужно для многих из нас дело обстоит с системными платами под новые процессоры: Intel запускает не только новую серию чипсетов, но и новые процессорные разъемы для всей линейки Sandy Bridge. С каждой новой серией процессоров Intel вносит достаточно много изменений, чтобы обосновать переход к новому разъему, но всё равно остается неприятное ощущение. Для покупающих новый компьютер особой разницы нет, а вот при улучшении существующей конфигурации необходимость тратиться также на недешевую материнскую плату совершенно не радует.

Новый процессорный разъем будет называться LGA1155. Габариты 1156 и 1155 процессоров совпадают, но расположенные в разных местах «ключи» не позволят допустить фатальную ошибку. Крепежные отверстия будут идентичны LGA 1156, что гарантирует совместимость систем охлаждения. Здесь же можно отметить и появление в будущем новых процессорных разъемов LGA1355, которые будут предназначены для процессоров высшей ценовой категории и производительных систем для игр, вычислений и бизнеса. Под LGA1355 будут выпускаться процессоры-наследники современных ЦП с кодовыми именами Bloomfield и Gulftown, которые оккупировали сейчас сегмент высшего класса.

Новые чипсеты шестой серии (судя по всему, первенцем будет Intel P67 Express) также будут одночиповыми. В них появится поддержка SATA-III 6 Гбит/с. Однако надеждам на встроенный интерфейс Super Speed USB 3.0 сбыться не суждено — его поддержка будет на совести производителей системных плат. А что? До сих пор им это неплохо удается, как и внедрение SATA-III. Кое-кто тут может припомнить и разрабатываемую Intel технологию быстрой передачи данных, известную под названием Light Peak. Вдруг, да и готовится появление нового оптического интерфейса со скоростью передачи до 10 Гбит/с? От Intel всего можно ожидать…

Когда ждать?

Intel уже приступила к массовому производству новых процессоров, ждать осталось недолго. Уже в следующем году вы сможете приобрести один из процессоров, как в настольном, так и в мобильном варианте (в составе ноутбука, разумеется). Первые процессоры должны появиться уже в самом начале 2011 года, а после пойдет экспансия в крупные ритэйлерские сети. Основная масса моделей должна появиться в первом квартале следующего года, тогда же установятся и розничные цены на новый продукт, которые поначалу наверняка будут завышенными: известная практика «снятия сливок», применяемая всеми крупными производителями электронного оборудования. Список моделей уже можно найти на просторах сети:

Список моделей настольных процессоров Sandy Bridge
Список моделей настольных процессоров Sandy Bridge

Понятное дело, сразу появятся не все, но их список впечатляет уже сейчас. Как можно заметить, технология HyperThreading поддерживается только в старшей четырехъядерной модели и во всех двуядерных процессорах. Впрочем, особого прироста производительности от её активации ожидать не приходится, более того, в некоторых приложениях можно наблюдать падение производительности. Наконец, можно пожалеть о том, что ни о какой, даже примерной, стоимости процессоров ничего не сообщается.

Выводы

Sandy Bridge — очередной «так» на часах Intel, однако существенной революции новые кристаллы в себе не несут. Просто очередное обновление архитектуры Nehalem, учитывающее старые ошибки и применяющее все наработки, создаваемые Intel в последние годы.

Стратегия «Тик-так» в действии
Стратегия «Тик-так» в действии

Конечно, работа инженеров не прекращается, но Sandy Bridge — это уже не «подопытный кролик», как Clarkdale, а полноценный продукт. Компании удалось создать новый, еще более быстрый процессор, который должен завоевать мир, однако существенных сдвигов в экономичности ждать не стоит — представленные на материалах Intel пакеты тепловыделения соответствуют продуктам прошлых поколений и снижаться, похоже, пока не собираются.

Появление четырехъядерных процессоров со встроенным видеоядром должно положительно сказаться на рынке мультимедийных систем и рабочих станций. Однако для обычных пользователей, которые уже являются владельцами систем на основе Westmere и Lynnfield новые чипы особого интереса представлять, скорее всего, не будут. Впрочем, однозначно ответить на этот вопрос мы сможем, только когда сами оценим эффективность новых процессоров.


Автор
Егор Емельянов

Комментарии

Загрузка...