1 SANDY BRIDGE
2 12.1.
BRIDGE
ОСНОВНЫЕ ОСОБЕННОСТИ АРХИТЕКТУРЫ SANDY
15
4
В процессорах добавились поддержка нового набора векторных
инструкций AVX (Advanced Vector Extensions), их принципиальное отличие
от векторных инструкций семейства SSE заключается в увеличении
разрядности операндов со 128 до 256 бит. Выполнена поддержка на
аппаратном уровне ускоренной обработки инструкций шифрования AES
(Advanced Encryption Standard) и алгоритмов шифрования RSA и SHA.
Таким образом, микропроцессор Sandy Bridge представляет собой
четырехъядерный 64-разрядный процессор с поддержкой двух потоков на
ядро, обладающий следующими особенностями:
• новая кольцевая внутренняя шина;
• интегрированное графическое ядро;
• интеллектуальный системный агент для работы с оперативной памятью
и внешними устройствами, который содержит также блок управления
питанием, обеспечивающий сокращение энергопотребления;
• интегрированная кэш-память третьего уровня;
• поддержка расширенного набора команд AVX;
• аппаратный модуль ускоренной обработки инструкций шифрования AES
и алгоритмов шифрования RSA и SHA;
• новая версия технологии Turbo Boost, направленной на снижение
тепловыделения, что позволяет работать на более высоких частотах. В Intel
не стали отказываться от зарекомендовавшей себя на рынке марки Core,
поэтому Sandy Bridge официально считается вторым поколением
микроархитектуры Core. С этим связаны некоторые изменения в
наименованиях процессоров — новые модели должны четко отличаться от
старых. Для этого перед цифровым индексом каждой модели ставится
цифра «2», обозначающая второе поколение. Пример: чип Intel Core 15-
2500К. «Intel Core» — марка, «i5» — серия, «2» — поколение, «500» —
индекс модели, а «К» — буквенный индекс. Индексы определяют в
основном назначение процессора и TDP (от англ. thermal design power,
иногда thermal design point — величина, показывающая, на отвод какой
тепловой мощности должна быть рассчитана система охлаждения
процессора) модели. Индекс «S» присваивается чипам, ориентированным
на домашние мультимедийные машины. В штатном режиме они
экономичнее, а их система охлаждения тише, чем у «стандартных»
моделей. Микропроцессоры, не имеющие индекса, потребляют 95 Вт, а с
индексом «S» — 65 Вт.
Модификации с индексом «Т» работают на еще более низкой тактовой
частоте, чем «базовые», при этом «турбочастота» у них тоже ниже. TDP
таких процессоров составляет всего 35—45 Вт, что вполне сравнимо с
ТОРсовременных мобильных чипов. Индекс «К» означает
разблокированный множитель, что позволяет беспрепятственно разгонять
процессор, повышая его тактовую частоту. Используемая в про- ueccopax
Sandy Bridge частота базового тактового генератора установлена в 100 М
Гц. Генератор позволяет варьировать значения этой частоты в очень
широких пределах с шагом 0,1 МГц. Однако так как от этого генератора
работают все блоки процессора, то попытки ее повышения очень быстро
упираются в нестабильность работы системы. Модели с индексом «К» не
имеют заблокированного множителя и теоретически способны разгоняться
до 5,7 ГГц (57 — максимальное значение множителя, заложенное в
микроархитектурс). Однако такие процессоры отнесены к верхней ценовой
категории. Некоторые соотношения между индексами и TDP моделей
микропроцессоров представлены в табл. 12.1.
Таблица 12.1
Тепловыделение микропроцессоров Sandy Bridge
Индекс модели ТОР модели
Безындексные модели 95 Вт
X Более 75 Вт
Е До 45 Вт
Т До 35 Вт
Р До 25 Вт
1 До 17 Вт
и До 10 Вт
SP До 25 Вт
SL До 17 Вт
SU До 10 Вт
Характеристики некоторых моделей микропроцессоров с архитектурой
Sandy Bridge представлены в табл. 12.2.
Таблица 12.2
Характеристики микропроцессоров Sandy Bridge
Параметры Corei 7-2600 Corei7-2600S Corei5-2500 Corei5-2500S Corei5-2500T
Ядра/потоки 4/8 4/8 4/4 4/4 4/4
Тактовая частота, 3.4 2.8 3.3 2.7 2.3
ГГц
VZEROUPPER
Обнуляет старшие половины всех регистров YMM. Используется при
переключении между 128-разрядным режимом и 25Б-раз- рядным
Для эффективного исполнения 256-разрядных инструкций испол-
нительные устройства процессора были подвергнуты специальному
перепроектированию. Суть изменений сводится к тому, что для работы с
256-разрядными данными 128-разрядные исполнительные устройства
объединяются попарно. Так как каждый из 3 исполнительных портов Sandy
Bridge имеет устройства для работы одновременно с тремя видами данных
— 64-разрядными, 128-разрядными целыми или 128-разрядными числами с
плавающей запятой, то такое попарное объединение SIMD устройств в
рамках одного порта является вполне логичным.
Регистры YMM требуют поддержки со стороны операционной системы.
Недооценка этого обстоятельства привела, в частности, в свое время к
необходимости отображения регистров М MX в первых микропроцессорах,
использующих эту технологию, на регистры с плавающей точкой. В
настоящее время регистры YMM поддерживают следующие операционные
системы и их более поздние версии:
• Linux: с версии ядра 2.6.30 выпущена 9 июня 2009 г.;
• Windows?: поддержка добавлена в Service Pack 1;
• Windows Server 2008 R2: поддержка добавлена в Service Pack.
AVX-инструкции подходят для интенсивных вычислений с плавающей
точкой в мультимедиа, научных и финансовых задачах.
Благодаря существенной доработке, нацеленной на удвоение про-
изводительности при работе с 256-битными векторными инструкциями AVX
и возможности исполнения большинства из них как единой микрокоманды,
исполнительные блоки микроархитектуры Sandy Bridge стали вдвое
мощнее, чем у чипов Nehalem. Они способны обрабатывать 8 операций
двойной точности с плавающей точкой (FP) или 16 FP-операний одинарной
точности затакт. Таким образом, ядро Sandy Bridge способно исполнять за
каждый такт 256-битное FP-ум- ножение, 256-битное FP-сложение и 256-
битное смещение.
Тогда же, в марте 2008 г., компанией Intel с целью ускорения работы
приложений, использующих шифрование и дешифрование информации по
алгоритму AES, было предложено расширение системы команд AES.
Примеры новых команд этого набора и их назначение представлены в табл.
12.4.
Таблица 12.4
Примеры команд AES
Инструкция Описание
AESENC Выполнить один раунд шифрования AES
AESENCLAST Выполнить последний раунд шифрования AES
AESDEC Выполнить один раунд расшифрования AES
AESDECLAST Выполнить последний раунд расшифрования AES
AESKEYGENASSIST Поспособствовать в генерации раундового ключа AES
AESIMC Inverse Mix Columns
14 „ 6 7 7 7
••
коп Предикат R1 R2 R3
Рис. 13.3. Формат команды микропроцессора Itanium
Переменная длина и большое Фиксированная длина и малое число типов команд упрощают
число команд разных типов декодирование
усложняют декодирование
Инструкции разнообразны, что Сокращенный набор команд Инструкции довольно разнообразны, что
уменьшает потребность в приводит к большому числу уменьшает потребность в условных
условных ветвлениях и условных ветвлений, что ветвлениях и повышает эффективность
повышает эффективность снижает эффективность спекулятивного выполнения
спекулятивного выполнения спекулятивного выполнения
Несколько наиболее известных компаний в области профессиональных
вычислений объединились в альянс, чтобы проводить согласованную
разработку и поддержку решений на базе процессоров Intel Itanium. Среди
участников альянса такие компании, как Fujitsu, Hitachi, HP, Intel, NEC, SGI,
Microsoft, Novell, Oracle, Red Hat, SAP, SAS. Альянс предлагает обширные
ресурсы для поставщиков ПО и корпоративных IT-организаций,
заинтересованных в разработке и внедрении решений на базе процессоров
Intel Itanium.
Как отмечалось ранее, в ноябре 2007 г. Intel переименовала серию
процессоров Itanium 2 обратно в Itanium. В настоящее время процессорам
Itanium присваиваются четырехзначные номера. Последняя разработка в
этом направлении — процессор Intel Itanium 9560 — изготавливается по
технологическому процессу 32 нм и имеет следующие характеристики:
• число ядер —8;
• число потоков — 16;
• тактовая частота — 2,53 ГГц;
• емкость кэш-памяти — 32 Мбайт;
• максимальное тепловыделение — 170 Вт.
Процессор использует технологию Intel Platform Protection Technology,
включающую бит отмены выполнения, — аппаратную функцию
безопасности, которая позволяет уменьшить уязвимость к вирусам и
вредоносному коду, а также предотвратить выполнение вредоносного ПО и
его распространение на сервере или в сети.
Itanium 9560 ориентирован на решение наиболее требовательных к
ресурсам задач планирования ресурсов предприятия, управления
цепочками поставок, управления взаимоотношениями с клиентами, а также
для других рабочих нагрузок высокой готовности.