Опубликовано 15 марта 2002, 00:33

Процессоры Intel Xeon MP/DP и чипсет Intel E7500

Обзор процессоров Intel Xeon DP/MP и двухканального чипсета Intel E7500 для памяти DDR.

Серверы на базе архитектуры Intel все шире применяются в различных сферах бизнеса. Этому способствуют их высокая производительность и доступные цены. Например, превосходные показатели эталонных тестов TPC-C для многопроцессорных систем на базе Intel Xeon сочетаются с вполне умеренной ценой (см. www.tpc.org и www.intel.ru/eBusiness):
_- 709220 tpm для 272-процессорной системы Compaq (около 15 долларов на единицу tpm);

  • 165218 tpm для 32-процессорной системы Unisys ES7000 (21,33 долл./tpm) или
  • 69901 tpm для 8-процессорной системы Dell 8450 - менее 8 долларов на tpm._

В предшествующем обзоре (см. www.ferra.ru/online/system/16656) вы могли познакомиться с особенностями современного рынка серверов и предложениями корпорации Intel по процессорам для каждого класса серверов. В настоящем обзоре мы хотим подробнее остановиться на технических особенностях некоторых новейших серверных продуктов Intel, объявленных буквально на днях - на февральском IDF в Сан-Франциско и мартовской CeBIT в Ганновере. Речь пойдет о процессорах Intel Xeon MP/DP, серверном чипсете Intel E7500 для двухканальной памяти DDR и некоторых сопутствующих продуктах.

Семейство процессоров Intel Xeon MP/DP оптимизировано для современных многопроцессорных (Xeon MP) и двухпроцессорных (Xeon DP) серверных платформ. Несмотря на одновременное появление и схожее предназначение, эти процессоры (MP и DP) различаются между собой достаточно сильно.

Intel Xeon DP (Prestonia)

Intel Xeon DP (Prestonia)

Объявленный чуть раньше (25 февраля на IDF) процессор Intel Xeon (он же Xeon DP - процессор второго поколения для двухпроцессорных систем с архитектурой NetBurst) базируется на более современном ядре Prestonia, производимом по технологии 0,13 микрон, имеет встроенную кэш-память L2 объемом 512 кбайт, системную шину 400 МГц, поддержку технологии Hyper-Threading и варианты с частотой ядра 2,2, 2,0 и 1,8 ГГц. Фактически, Intel Xeon DP есть не что иное, как хорошо знакомый нам Pentium 4 на ядре Northwood, но с аппаратно активизированной поддержкой двухпроцессорности (APIC) и Hyper-Threading (многопоточности вычислений внутри одного чипа). Вполне возможно, что эти два процессора даже имеют один и тот же дизайн кристалла - просто на этапе, предшествующем корпусировке, чипы для Xeon подвергаются более тщательным и всесторонним тестированиям (и отбраковке), а в чипы для Pentium 4 прошивается микрокод, отключающий в них функции APIC и HT. В пользу этого говорит как опознавание программами наличия APIC в Northwood (см. www.ferra.ru/online/system/15067), так и упорные слухи (в том числе, со слов некоторых руководящих сотрудников Intel), что технология Hyper-Threading уже присутствует в Northwood и может быть легко активирована в ближайшем будущем. Тем не менее, использовать Northwood в двухпроцессорных системах вряд ли удастся, поскольку Xeon (Prestonia) упаковывается в другой корпус - 603-контактный FC-mPGA2P/INT-mPGA (см. фото; напомню, что Pentium 4 корпусируется в 478-контактный FCPGA2). Новые Intel Xeon (Prestonia) отличаются от прежних (первого поколения) двухпроцессорных Intel Xeon (Foster) точно тем же, чем Pentium 4 Northwood отличается от Willamette, за исключением появившейся поддержки Hyper-Threading. Несмотря на выход более прогрессивных Xeon DP (Prestonia), процессоры Xeon (Foster) с частотой до 2 ГГц и кэш-памятью L2 256 кбайт будут производиться корпорацией как минимум до конца этого года.

Intel Xeon MP (Foster MP)

Intel Xeon MP (Foster MP)

Представленный 12 марта на CeBIT мультипроцессорный Intel Xeon MP на ядре Foster MP фактически является первым поколением процессоров для многопроцессорных (4-8) систем с микроархитектурой Intel NetBurst. Производимое по технологии 0,18 микрон ядро Foster MP является аналогом ядра Willamette первого поколения процессоров Pentium 4 и, соответственно, ядра Foster дуальных процессоров Intel Xeon (напомню, что как и для Northwood, программы определяют наличие аппаратного блока APIC в современных кристаллах Willamette, см. предыдущий линк). Однако Foster MP отличается от Foster гораздо существеннее, чем Foster от Willamette, поскольку помимо кэш-памяти L2 емкостью 256 кбайт (с улучшенной по сравнению с Willamette передачей данных) содержит на том же кристалле еще и кэш-память третьего уровня (L3) емкостью 512 или 1024 кбайт (в зависимости от модификации процессора), а также поддерживает технологию Hyper-Threading. Как и остальные Intel Xeon, процессоры на ядре Foster MP пока предназначены для системной шины 400 МГц и пакуются в 603-контактный корпус INT-mPGA. Однако на данный момент они выпускаются только с частотами от 1,4 до 1,6 ГГц - видимо, наличие высокоскоростного кэша L3 не только затрудняет теплоотвод, но и пока препятствует достижению предельных для данной технологии 2 ГГц даже при идеальном теплоотводе (низкий выход годных выше 1,6 ГГц). Хотя спрос «на гигагерцы» есть и на рынке серверов.

Процессор Intel Xeon MP содержит 108 миллионов транзисторов - это примерно вдвое больше, чем для кристалла Willamette, то есть на «пририсованный» кэш L3 пришлось более 50 миллионов «затворов». Кэш-память третьего уровня в мультипроцессорных чипах нужна, чтобы «развязать» ядро и системную шину (FSB). В отличие от кэш-памяти L2, которая является синхронной (то есть при ее заполнении процессор «простаивает»), кэш-память третьего уровня асинхронная, что позволяет процессору полноценно работать при ее заполнении. Для мультипроцессорных CPU наличие емкого кэша L3 важно еще и потому, что системная шина у процессоров общая (а их на ней может сидеть до 8 штук), то есть соседние «камни» не будут простаивать в вычислениях, пока один из них полез в системную память за данными.

NetBurst for Xeons

Микроархитектура Intel Xeon.

NetBurst for Xeons

Микроархитектура Intel Xeon.

Такая архитектура как нельзя лучше отвечает требованиям приложений для мощных серверов масштаба предприятия и серверов для электронного бизнеса (см. обзор www.ferra.ru/online/system/16656). Кэш-память с отслеживанием исполнения (L1, 12 кбайт микрокоманд) обеспечивает ускоренный доступ к декодированным микрокомандам и увеличивает пропускную способность конвейера, кэш-память данных L1 (8 кбайт) уменьшает задержки в работе блока быстрого исполнения благодаря применению новейших технологий доступа, кэш-память L2 с улучшенной передачей данных ускоряет доступ к данным сервера за счет точной синхронизации с кэш-памятью данных L1 и блоком быстрого исполнения, а интегрированная кэш-память L3 в сочетании с быстрой системной шиной формирует высокоскоростной канал обмена данными с системной памятью. Максимальная пропускная способность подсистемы кэш-памяти этих процессоров составляет 51,2 Гбайт/с, тогда как для Intel Pentium III Xeon (которые еще долго будут продаваться) она составляет всего 28,8 Гбайт/с при ширине шины 32 байта против 128 байт у Foster MP. Для сравнения в таблице приведены основные характеристики описанных выше процессоров.

Intel Xeon Table small

Таблица сравнительных характеристик процессоров.

Intel Xeon Table small

Таблица сравнительных характеристик процессоров.

Серия процессоров Intel Xeon MP пришла на смену многопроцессорным Intel Pentium III Xeon (см. www.ferra.ru/online/system/16656), а им на смену, в свою очередь, разрабатываются процессоры на ядре Gallatin, изготавливаемом пр технологии 0,13 микрон (фактически это Prestonia с интегрированным кэшем L3). Последние должны появиться в четвертом квартале этого года. Текущие оптовые цены на процессоры Xeon MP составляют 3692 доллара за старшую модель (1,6 ГГц, L3=1 Мбайт), 1980 долларов за модель с частотой 1,5 ГГц и L3=512 кбайт и «всего» 1177 долларов за младшую модель с 512 кбайт L3.

Hyper-Threading Technology

Hyper-Threading Technology

Попутно отмечу, что цены на Xeon DP (Prestonia) будут гораздо ниже - почти как на аналогичные по частоте модели Northwood: 615 долларов за 2,2 ГГц, 417 и 251 долларов за младшие модели 2 и 1,8 ГГц. Компания Hewlett-Packard уже объявила о выпуске шести серверов на новых чипах Intel Xeon. Почти все они выполнены на чипсете ServerWorks GC-HE (шина PCI-X). Наиболее интересные для нас сейчас: tc6100 за $7599 на двух Intel Xeon (Pentium 4) и tc7100 за $12559 на четырех Xeon MP высотой 8,75 дюйма с монтажом в стойках.

Коротко о технологии Hyper-Threading. Эта новейшая технология Intel дает возможность операционной системе и многопоточному ПО рассматривать каждый физический процессор как два логических (физически раздельны только наборы регистров и блоки XAPIC - Extended APIC, см. схему), распараллеливая решение нескольких задач между ними и повышая тем самым скорость отклика системы, производительность и скорость обработки транзакций. При этом эти логические процессоры осуществляют совместный доступ ко всей кэш-памяти и вычислительным блокам - FP, ALU и пр. Существующее ПО, оптимизированное для многопроцессорных систем, может использоваться с Hyper-Threading без каких-либо изменений. Для операционных систем нужна минимальная оптимизация, чтобы избежать ненужных простоев. Работу технологии поясняет блок-схема ниже.

Hyper-Threading Technology diagram

Блок-схема работы технологии Hyper-Threading.

Hyper-Threading Technology diagram

Блок-схема работы технологии Hyper-Threading.

Преимущества новой технологии очевидны: эффективнее используются ресурсы процессора, производительность при использовании многопоточного серверного ПО повышается до 30% в четырехпроцессорных системах и до 80% (в зависимости от задачи) в двухпроцессорных системах (по однопроцессорным пока данных нет). То есть повышается масштабируемость, уменьшается время отклика, увеличивается число обрабатываемых транзакций в масштабе предприятия. Огорчает, что для применения Hyper-Threading в системах на Windows XP требуется лицензирование системы для дополнительных логических процессоров. Кроме того, чипсет системной логики и BIOS серверной платы должны быть специально «заточены» для распределения задач между процессорами.

Теперь переходим к тому, без чего ни один серверный процессор работать не будет - к серверным чипсетам системной логики и материнским платам.

Одновременно с выпуском процессоров Xeon DP Intel объявила (в компанию к старичку i860 на RDRAM) новый серверный чипсет E7500 (Plumas), предназначенный для двухпроцессорных систем и двухканальной памяти DDR200 (см. www.intel.com/design/chipsets/e7500). Отрадно, что почти сразу вслед за бытовым DDR-чипсетом i845D корпорация привнесла DDR «в массы» серверов. Однако тут не обошлось без своих «особенностей»: дело в том, что чипсет этот поддерживает только память устаревшего стандарта PC1600 и строго двухканальную (как, например, i850 для RDRAM). И, разумеется, только регистровые модули памяти. Между тем, в таком подходе есть свой резон. Видно памятуя об скоростных успехах незабвенных синхронных чипсетов i440BX/GX, Intel и этот чипсет решила сделать полностью синхронным, то есть шины процессора и памяти работают всегда на одинаковой тактовой частоте (в данном случае - 100 МГц). При этом пропускная способность шины процессора в точности совпадает с пропускной способностью двух каналов DDR200 - 3,2 Гбайт/с. В принципе, в отсутствии мощного графического ускорителя на шине AGP 4X (зачем он в серверах) такой подход вполне оправдан, хотя прожорливые клиенты на высокопроизводительной шине PCI могут все же сместить баланс системы в сторону недостатка скорости памяти. Тем не менее, синхронность, по видимому, делает обмен данными между процессором и памятью наиболее быстрым из всех возможных вариантов. Что ж, при случае мы это проверим на практике. А в будущем, с выходом Xeon на шине 533 МГц этот чипсет может быть легко модифицирован для работы с DDR266 («разгонять» свои собственные продукты Intel умеет великолепно J).

Chipset Intel E7500

Чипсет Intel E7500.

Chipset Intel E7500

Чипсет Intel E7500.

Chipset Intel E7500, block diagram

Chipset Intel E7500, block diagram

Максимальный объем памяти, поддерживаемый чипсетом E7500 - 16 Гбайт (до 4 модулей DIMM на канал). Разумеется, есть ECC, аппаратная очистка памяти и отключение неисправных микросхем. В чипсете применена новая система связи компонентов наборов микросхем - Intel Hub Interface 2.0 c пониженной амплитудой напряжения сигналов 0,7 В. Она позволяет достичь скорости обмена свыше 1 Гбайт/с (точнее - 1,066) в любом парном соединении «северного» хаба MCH с каждым из трех «периферийных» устройств. Чипы-компаньоны P64H2 (до трех штук) обеспечивает чипсету поддержку широкой профессиональной шины PCI/PCI-X с функцией «горячей замены» PCI-устройств (!) для лучшего обслуживания, надежную сегментацию I/O и улучшенный доступ к скоростным сетям. Чип P64H2 выводит технологию PCI/PCI-X на новый уровень скорости и универсальности, обеспечивая два контроллера «горячего подключения» и два независимых 64-бит 133 МГц сегмента PCI-X, то есть всего до 6 независимых шин PCI-X в системе (плюс 1 сегмент PCI 32-бит/33 МГц от хаба ICH3-S, который подключен с MCH по прежнему Hub Interface 1.5). По высокоскоростному HI 2.0 можно также подключать Network InfiniBand и будущие хабы ICH. Быстрые карты PCI-X (например, гигабитный Ethernet, Ultra320 SCSI и пр.) лучше подключать на разные мосты PCI-X для более полной реализации скоростного потенциала системы. Сегменты PCI-X независимы, каждый поддерживает до 4 слотов PCI: 1 64-битный слот может работать на частоте 133 МГц, а 4 слота - на 66 МГц.

Разумеется, чипсет E7500 обучен поддержке технологии Hyper-Threading, чтобы оптимально управлять прерываниями при установке двух CPU. В чипсете есть специальная шина управления системой. Оптовые цены на чипсет E7500 пока установлены в размере 92 и 132 доллара за минимальную и максимальную конфигурацию, соответственно. На чипсете E7500 Intel выпустила уже две серверные системные платы - SE7500CW2 и SE7500WV2 (другие «матерестроители» тоже не дремлют). Об их возможностях вы можете частично судить по приведенным фотографиям, а подробнее - на www.intel.com. Не следует думать, что все это очень далеко от простого компьютерного обывателя. Сейчас Intel обкатывает новые технологии процессоров и чипсетов в серверах, а завтра они придут в каждый дом (вспомните про Интернет-холодильники - они не дремлют J).

У Intel нет своих чипсетов для многопроцессорных систем - она отдала этот рынок на откуп сторонним производителям, в частности, своим многолетним партнерам. Наиболее популярным здесь является чипсет от ServerWorks c поддержкой DDR200 и выбором I/O, а также шиной управления системой. Есть свой чипсет для этого и у IBM (Summit) - до 16 процессоров. Многопроцессорный чипсет ServerWorks GC-HE для процессоров Intel Xeon MP обладает, в принципе, очень похожими на Intel E7500 характеристиками (см. рисунок).

Chipset ServerWorks

Структура чипсета ServerWorks GC-HE для процессоров Intel Xeon MP.

Chipset ServerWorks

Структура чипсета ServerWorks GC-HE для процессоров Intel Xeon MP.

Прекрасную масштабируемость систем на базе процессора Intel Xeon MP наглядно демонстрирует нижеследующая диаграмма. При удвоении числа процессоров (с 1 до 2 или с 2 до 4) производительность сервера на специализированном ПО возрастает примерно на 70%. Все это обеспечивает новейшим серверным продуктам Intel отличные перспективы на рынке серверов самых разных классов.

Scalability

Масштабируемость многопроцессорных серверов на Intel Xeon MP.

Scalability

Масштабируемость многопроцессорных серверов на Intel Xeon MP.

В заключение взглянем на неофициальный родмэп серверных процессоров Intel до конца 2003 года (например, по данным Tweakers.net). В стане мультипроцессорных решений на IA-32 начиная с последнего квартала и на год вперед начнется гегемония ядра Gallatin с частотой от 2 ГГц и кэшем L3 емкостью 1 и 2 Мбайт. В стане IA-64 летом этого года произойдет полный переход на McKinley, а в 2003 году - и на ядро Madison с кэшем L3 в 3 и 6 Мбайт. Двухпроцессорный рынок средних по мощности серверов очень скоро и надолго полностью захватит Prestonia, постепенно пересев на шину 533 МГц и чипсет Plumas 533, а летом 2003 года нас ждут новинки. В классе компактных экономичных серверов процессоры Pentium III на ядре Tualatin с частотами до 1,4 и 1,53 ГГц еще долго будут вне конкуренции.

Intel Server Roadmap

Неофициальный родмэп серверных процессоров Intel до конца 2003 года (по данным Tweakers.net).

Intel Server Roadmap

Неофициальный родмэп серверных процессоров Intel до конца 2003 года (по данным Tweakers.net).

 

Intel Xeon Table

Intel Xeon Table