14. Обзор архитектуры Intel Broadwell и процессоров Core M

Екатерина Михеева-Капанжа, 

Совсем недавно компания Intel представила процессоры Core M, базирующиеся на новой 14-нанометровой архитектуре Broadwell. Первые решения будут предназначены для высокопроизводительных планшетов и ультрабуков, однако уже в начале года нас побалуют и десктопными устройствами. В преддверии старта жизненного цикла нового поколения процессоров мы знакомимся со всеми нововведениями, изменениями и улучшениями перспективной архитектуры.

Оглавление

Intel Core M, система-на-кристалле на базе архитектуры Broadwell, анонсирована как сильный конкурент ARM-процессоров, способный «вписаться» в планшеты или ультрабуки с толщиной менее 10 мм, обладающие пассивным охлаждением. Данные SoC предлагают TDP на уровне 4,5 Вт. Но эти параметры — только вершина айсберга. Из данной статьи вы узнаете обо всех изменениях, нововведениях и разработках, ставших основной Intel Core M.

Планшеты и смартфоны будущего по версии Intel
Планшеты и смартфоны будущего по версии Intel

Обновление линейки Haswell уже состоялось, поэтому сейчас, во второй половине 2014 года, Intel обратила внимание уже на следующее поколение продуктов — чипы Broadwell, которые должны поступить в продажу к новогодним праздникам. Стратегия «тик-так» в совокупности с длительными сроками разработки каждого продукта говорят о том, что компания всегда имеет в работе несколько проектов. Несмотря на то, что с названием Broadwell на продуктовой карте Intel мы знакомы уже давно, в реальности же до недавнего времени мы знали об архитектуре следующего поколения не так много. В середине августа компания приоткрыла завесу тайны и представила широкой публике подробные характеристики грядущего процессора Intel Core M на архитектуре Broadwell, а именно версии Broadwell-Y, основной сферой применения которого станут планшетные ПК и другие ультратонкие мобильные устройства. Сейчас это один из наиболее перспективных рынков, и Intel чувствует его высокий потенциал, но в то же время осознает, насколько велик риск проиграть борьбу конкурентам.

Intel Core M одним взглядом
Intel Core M одним взглядом

Возможность потерять доминирование на рынке процессоров в целом пусть и кажется невероятной, но все же существует. Причем по причинам от Intel, в общем-то, независящим. Сюда можно отнести постепенно уменьшающиеся продажи традиционных ПК и ноутбуков и, напротив, стремительное развитие сегмента ARM-девайсов. Все это уже через несколько лет может окончательно свергнуть Intel с Олимпа. Поэтому бездействие в данной ситуации выглядит хуже выпуска даже самого «провального» продукта. Intel должна была ответить на вызов мобильного рынка и представить реального конкурента имеющимся ARM-процессорам. Ответ компания готовит постепенно и уже не один год, уменьшая размеры чипа и энергозатратность. После интеграции графического ядра в Sandy Bridge в 2011 году компания продолжила работу над оптимизацией в Ivy Bridge и Haswell и теперь убеждена, что с Broadwell имеет все необходимые возможности для того, чтобы стать лидером на рынке высокопроизводительных мобильных чипов. Стоит отметить, что мы не встретим решения Broadwell-Y в дешевых планшетах, сферой их использования будут устройства премиум-класса. В первом же случае обязанности по завоеванию рынка будут лежать на плечах чипов Intel Atom, построенных на базе платформ Bay Trail и Airmont.

Эволюция архитектуры Intel Эволюция архитектуры Intel

Улучшения в области производительности и снижение энергопотребления вкупе с уменьшением размера самого чипа — это основные моменты, на которые обращала внимание Intel во время презентации Broadwell-Y. Процессорный гигант хочет заполучить свою площадку на рынке мобильных девайсов и верит, что наконец-то она имеет все необходимое, чтобы достигнуть этой цели.

Пока ожидается три модели Intel Core M: 5Y10, 5Y10a и 5Y70. Все три процессора имеют два ядра, но четыре потока, встроенную графику Intel HD Graphics 5300 и показатель TDP всего 4,5 Вт. Первые два работают на штатной тактовой частоте 800 МГц с максимальной скоростью 2 ГГц, модель 5Y70 — на штатной частоте 1,1 ГГц с максимальным значением 2,6 ГГц.

Фотография среза кристалла Core M. Как видите, Intel продолжает разрабатывать продолговатые чипы
Фотография среза кристалла Core M. Как видите, Intel продолжает разрабатывать продолговатые чипы

Энергоэффективность

Рассказывая об Intel Core M, недостаточно просто перечислить особенности Broadwell: помимо глобальных доработок архитектуры в общем, Intel внесла внушительное число изменений исключительно в Core M — начиная с характеристик CPU в частности и заканчивая процессорным узлом в целом. И все эти изменения позволяют Intel заявлять о явном превосходстве Broadwell-Y над Haswell-Y и одновременно быть уверенной в том, что Broadwell-Y прекрасно подойдет под форм-фактор 10-дюймвого планшета.

Когда речь заходит о Core M, Intel не устает повторять, что все силы были брошены в ответ на «безвентиляционный вызов» рынка планшетных ПК толщиной менее 10 мм с пассивным охлаждением. Корпорации пришлось встретиться с серьезным ограничением тепловыделения, ведь 10-дюймовые планшеты требуют наличия SoC с TDP менее 5 Вт. И оптимизация производительности чипа в целом, доработки GPU, а также использование 14-нм техпроцесса позволили Broadwell-Y «втиснуться» в необходимый уровень тепловыделения.

Суровые требования планшетных ПК
Суровые требования планшетных ПК

Фактически для Intel Core M была создана отдельная версия 14-нм чипа Broadwell — с урезанным на 10% напряжением, уменьшенным на 15% емкостным сопротивлением и улучшенным показателем потери потребляемой мощности. Также благодаря снижению допустимой рабочей температуры чипа сократилось напряжение и уменьшились потери энергии, зависимые от температуры. Совокупность всех этих факторов позволила значительно сократить энергопотребление относительно традиционного стандартного чипа на 14-нм техпроцессе.

Сравнение Broadwell-Y с традиционной архитектурой
Сравнение Broadwell-Y с традиционной архитектурой

Дополнительной оптимизации подвергся встроенный чип PCH (Plattform Controller Hub), контроллер-коммутатор платформы, выполняющий функции южного моста и некоторые другие, например, контролера ввода/вывода. Расход электроэнергии чипом в режиме простоя сократился на 25%, а в режиме активной работы — на 20%. PCH также получил функцию audio DSP с большим объемом памяти и более высоким показателем скорости обработки инструкций (MIPS).

Контроллер-коммутатор платформы PCH
Контроллер-коммутатор платформы PCH

Чтобы «прокормить» все имеющиеся чипы, Intel использует полностью интегрированный регулятор напряжения (FIVR) второго поколения, который тоже подвергся оптимизации. Во-первых, он был перенастроен на низкое энергопотребление Broadwell-Y, что сделало его более эффективным в вопросах распределения энергии. Во-вторых, была реализована функция нелинейного снижения частоты для лучшего регулирования напряжения при переходе чипа из состояния простоя в состояние под нагрузкой без скачка напряжения и, соответственно, без потери энергии. В-третьих, был внедрен дополнительный режим LVR, который активируется при невысоких изменениях напряжения, когда FIVR можно частично обойти, чтобы уменьшить потребление им энергии.

Стоит отметить, что некоторые доработки принесли «прибыль» не только в плане энергоэффективности, но и в вопросе оптимального использования пространства. Например, новые более эффективные 3D-индукторы (3DLs) были размещены на обратной стороне чипа, что позволило не только снизить потери энергии, но и сэкономить место на плате.

FIVR и 3DL
FIVR и 3DL

Broadwell-Y получил Turbo boost, третий уровень мощности PL3, который позволяет максимально поднимать частоту процессора, но только на несколько миллисекунд — Intel полагает, что справиться с задачей быстро и на пределах возможностей эффективнее в плане энергопотребления, чем выполнить ту же задачу медленнее и без максимальной нагрузки на систему.

Turbo boost нового Broadwell-Y Turbo boost нового Broadwell-Y

Компактность

Сокращение техпроцесса с 22 нм до 14 нм указывает на изменение соотношения физического размера узла к размеру узла предыдущего поколения, а не на размер какого-либо компонента, как может показаться на первый взгляд. Проще говоря, основные компоненты Broadwell-Y имеют размер, в среднем равный 0,64 размера компонентов Haswell-Y (коэффициент миниатюризации колеблется от 0,70 до 0,54). Расстояние между плавниками транзисторов уменьшилось с 60 нм до 42 нм, расстояние между границами соседних затворов — с 90 нм до 70 нм, минимальное расстояние между слоями соединений внутри схемы — с 80 нм до 52 нм, а ячейка памяти SRAM теперь занимает площадь в 59 нм2 вместо 108 нм2.

Сравнение техпроцессов Сравнение техпроцессов Сравнение техпроцессов

Наряду с изменением размера компонентов, тесно связанных с уменьшением процессорного узла, Intel также поработала над оптимизацией транзисторов FinFET, второе поколение которых представлено в Broadwell. В сравнении с 22-нм вариантом плавники транзистора расположены более плотно (что, понятно, продиктовано 14-нм техпроцессом). Они тоньше и выше, что повышает значение тока и производительность, и их меньше на одном транзисторе, что также улучшает плотность и уменьшает емкостное сопротивление транзистора, вызванное самими плавниками.

Оптимизация транзисторов
Оптимизация транзисторов

Если речь идет о возможности интеграции SoC в планшет с диагональю 10 дюймов и толщиной меньше 1 см, то, помимо тепловыделения, важное значение имеет и размер чипа. Поэтому Intel поставила перед собой цель создать наименьший процессор Core и вписать SoC в размер 500 мм2. Для достижения этой цели разработчики были вынуждена сократить размер как отдельных элементов, так и всего кристалла в целом. Размер CPU составляет 82 мм2, что на 37% меньше, чем CPU у Intel Haswell-Y. Сама же плата Broadwell-Y меньше Haswell-Y практически на 50%.

Сравнение размеров
Сравнение размеров

Intel также внесла изменения в толщину платы, ведь даже лишние доли миллиметра в контексте мобильных устройств могут играть ключевую роль. Во-первых, толщина кристалла сократилась до 170 мкм. Во-вторых, толщина основания печатной платы чипа уменьшилась практически вдвое — с 400 мкм до 200 мкм. В итоге толщина Broadwell-Y составит 1,04 мм в противовес 1,5 мм у Haswell-Y, то есть примерно на 30% меньше. Это означает, что плата SoC теперь не возвышается на другими компонентами (например, RAM), и это существенно экономит пространство.

Пример печатной платы с распаянным процессором Core M (снизу). Сверху находится системная плата Apple MacBook
Пример печатной платы с распаянным процессором Core M (снизу). Сверху находится системная плата Apple MacBook

Источник

Стратегия «тик-так»

Ожидается, что прирост IPC (инструкции за цикл) составит 5% относительно Haswell, примерно такой же показатель был и у Ivy Bridge (4-6%), предыдущей архитектуры шага «тик». Перед Intel сейчас стояла другая задача — уменьшение техпроцесса с 22 нм до 14 нм, а «прорывы» в производительности больше свойственны моделям «так», например, Haswell или Sandy Bridge.

Стратегия «тик-так» Intel

Микроархитектура

65 нм

Так

2006

Conroe/Merom

45 нм

Тик

2007

Nehalem

45 нм

Так

2008

Westmere

32 нм

Тик

2010

Sandy Bridge

32 нм

Так

2011

Ivy Bridge

22 нм

Тик

2012

Haswell

22 нм

Так

2013

Broadwell

14 нм

Тик

2014

Skylake

14 нм

Так

2015

Тик-Так
Тик-Так

Улучшения в CPU

Для увеличения показателя IPC Intel проводит несколько усовершенствований в архитектуре чипа. Главными среди них являются увеличение числа записей планировщика внеочередного исполнения команд, что позволяет переупорядочивать большее количество инструкций, и увеличение числа записей буфера ассоциативной трансляции (TLB) второго уровня с 1 тысячи до 1,5 тысяч записей. На страницах буфера TLB был добавлен второй обработчик страничного нарушения, позволяющий Broadwell утилизировать обоих обработчиков одновременно для параллельного перехода по страницам. Также добавляется режим работы со страницами по 1 Гбайт, дающий Broadwell способность обрабатывать эти очень большие страницы поверх существующих страниц на 2 Мбайт. Intel в очередной раз повторила, что доработан предсказатель ветвлений для сокращения потерянных ветвей и, соответственно, ненужных операций с памятью. Определение адреса прогнозатора ветвей у Broadwell усовершенствовано и для ветвлений, и для возвращений для более точных манипуляций.

Intel также вносит некоторые фундаментальные улучшения и в вычислительные характеристики, например, ожидается прирост производительности в операциях умножения и деления благодаря некоторым улучшениям соответствующих аппаратных средств. Умножение с плавающей точкой получило сокращение времени ожидания с пяти циклов до трех. Деление выполняется благодаря использованию 10-битного делителя Radix-1024. Intel также заявляет о повышении скорости векторных вычислений и улучшении инструкций шифрования.

Эталонная плата для сборки планшетов с Core M на борту
Эталонная плата для сборки планшетов с Core M на борту

Говоря об «апгрейде» вычислительных мощностей процессора, важно не забывать, что для Intel он не был первостепенной задачей. Рынок мобильных девайсов диктовал совсем другое требование — снижение энергопотребления. И если соотношение улучшений в производительности к необходимой энергии у Haswell составляло 1:1, то у Broadwell оно должно было быть 2:1. Естественно, это наложило свои ограничения на выбор «новшеств», которые Intel могла бы внести в дизайн архитектуры Broadwell. Более того, пришлось поработать и над уже имеющимся соотношением производительности к энергопотреблению. Грубо говоря, 5% улучшений в производительности обойдутся всего в 2,5% увеличения немедленного потребления энергии.

Компания продолжит оптимизацию энергопотребления не только для Intel Core M, но и для всех будущих продуктов Broadwell. Больше внимания будет уделяться отключению тех частей CPU, которые не используются и уменьшению потребления энергии различными блоками по мере необходимости. Эти доработки в совокупности с увеличением энергоэффективности от использования 14-нм техпроцесса — основные способы снижения потребления энергии в Intel Core M.

Улучшения в GPU

В целом принцип «тик-так» работает и для графической подсистемы процессоров Intel: значительные архитектурные изменения на стадии «так» и улучшения техпроцесса имеющейся архитектуры на стадии «тик». Но с одним отличием: обычно для GPU доработки на стадии «тик» гораздо существеннее, нежели для CPU. И Broadwell — не исключение.

Графическая подсистема Broadwell основана на Gen8 GPU — это продолжение архитектуры Intel Gen7, впервые появившейся в процессорах Ivy Bridge и доработанной версии Gen7,5 в Haswell. На фундаментальном уровне это тот же самый GPU, только более оптимизированный и «отшлифованный».

Broadwell теперь поддерживает последние графические API, например, Direct3D FL 11_2, OpenCL 2.0, включая поддержку общей виртуальной памяти, что приближает интегрированную графику Broadwell-Y к интегрированным и дискретным решениям от AMD и NVIDIA. Чип получит нативную поддержку UHD и 4K-разрешения.

Особенности GPU Особенности GPU

Haswell-Y использовал конфигурацию GT2, которая состояла из одного модуля, содержащего два суб-фрагмента. В данном случае суб-фрагмент был наименьшей функциональной строительной единицей GPU, включающей исполнительные устройства (EU), а также кэш и семплы текстур, данных и медиа. Каждый блок, в свою очередь, состоит из двух четырехсторонних векторных SIMD. На одном суб-фрагменте размешается до 10 исполнительных устройств. В Broadwell-Y фундаментальная архитектура GPU осталась неизменной, однако был добавлен еще один суб-фрагмент и откалиброваны операционные блоки — теперь на трех суб-фрагментах размещено по 8 операционных блоков, то есть в сумме 24 против 20 у Haswell-Y. Но не только число EU увеличилось на 20%, вырос и объем кэша первого уровня. В итоге пропускная способность исполнительных устройств увеличилась на 25%, в то время как частота устройства стробирования — на 50%.

Общий блок, ответственный за ROP, прорисовку и порт кэша третьего уровня, получил некоторые улучшения на уровне микроархитектуры, которые позволили увеличить скорость заполнения пикселей.

Llama Mountain — первый планшетный компьютер на базе процессора Intel Core M 5Y70
Llama Mountain — первый планшетный компьютер на базе процессора Intel Core M 5Y70

Уровень производительности Core M Уровень производительности Core M

Источник

Выводы

Intel Core M — это не решающий чип для Intel, не сенсация и не SoC, призванная «взорвать» рынок. Это продукт, к которому компания шла довольно долго и постепенно, с каждой итерацией прорабатывая детали, оттачивая будущую систему под жесткие требования рынка ультратонких мобильных девайсов. На данном этапе Intel сделала все возможное, чтобы ее продукция удовлетворяла основным условиям: соответствию форм-фактору 10-дюймового планшета или ультрабуку толщиной менее 10 мм с TDP не выше 5 Вт и пассивным охлаждением.

Преимущества Intel Core M
Преимущества Intel Core M

Intel не ставила перед собой цели существенно увеличить производительность Broadwell в сравнении с Haswell — компания придерживается стратегии «тик-так», поэтому сейчас во главу угла ставится уменьшение техпроцесса. Прирост производительности в х86-вычислениях Broadwell-Y над Haswell-Y составил всего около 5%. Зато улучшения графической подсистемы получились более значительные: помимо прироста производительности, GPU получила поддержку новейших API, что подтягивает ее до уровня встроенной и дискретной графики AMD и NVIDIA. Но значительные усовершенствования коснулись другого: TDP Broadwell-Y в сравнении с Haswell-Y снизилось с 11,5 Вт до 4,5 Вт, а площадь SoC стала меньше практически в два раза. Поэтому Intel есть чем гордиться, и чип Intel Core M в глазах компании воспринимается больше как самостоятельный продукт, нежели как просто часть модельного ряда Broadwell. Во-первых, он получил гораздо больше оптимизаций и усовершенствований, чем просто архитектура Broadwell. Во-вторых, Intel видит в нем большой потенциал для уверенного выхода на рынок планшетных ПК.

Угроза потерять лидирующие позиции производителя процессоров с каждым годом будет нависать над Intel все чаще и чаще, ведь рынок классических ПК и ноутбуков постепенно сжимается, а на рынке мобильных устройств практически царит монополия ARM-архитектуры. И выпуск Intel Core M может стать шансом закрепиться на этом рынке. Единственная сложность — ориентированность чипов исключительно на устройства премиум-класса, что, конечно, принесет неплохую маржу, но не привлечет массового покупателя.


Автор
Екатерина Михеева-Капанжа

Комментарии