Вы находитесь на странице: 1из 29
Технология Технология CHARM CHARM для для POWER7 POWER7 Mikhalev Dmitry IBM CTS Power Systems
Технология Технология CHARM CHARM для для POWER7 POWER7 Mikhalev Dmitry IBM CTS Power Systems

ТехнологияТехнология CHARMCHARM длядля POWER7POWER7

Технология Технология CHARM CHARM для для POWER7 POWER7 Mikhalev Dmitry IBM CTS Power Systems

Mikhalev Dmitry IBM CTS Power Systems

Повестка дня:

Что такое CHARM?

CHARM для 795

CHARM для 770/780

Правила

Необходимые требования

Конфигурация

Выводы

 Необходимые требования  Конфигурация  Выводы © 2011 IBM

© 2011 IBM

Что такое CHARM?

© 2011 IBM

Технология

(CHARM)

обеспечивает новые возможности в надежности, готовности и удобства обслуживания (RAS) для серверов IBM POWER 770,780 и 795

CEC

Hot

Add

and

Repair

Maintenance

Добавление

модернизация ресурсов: позволит добавить

процессоры, память и подсистемы ввода / вывода без отключения

системы

или

Ремонт системы: можно произвести замену процессора, памяти, концентратора ввода / вывода, а также других аппаратных средств CEC без выключения системы

Выполнение

CHARM

планирования

требует

тщательного

предварительного

Power 795

Новый сервер High-end класса От 24 до 256 ядер Функция TurboCore Частота процессора 3.7, 4.0 or 4.25 GHz Capacity on Demand

24x7 обслуживание PowerCare

© 2011 IBM

3.7, 4.0 or 4.25 GHz ✓ Capacity o n D e m a n d ✓

CHARM для сервера 795 (вид спереди)

© 2011 IBM

Media дровер Система питания Сервисный процессор x 2 Книга (book, node)
Media дровер
Система питания
Сервисный
процессор x 2
Книга (book, node)
От 1 до 8
Node контролер x 2
На каждую книгу
GX адаптер
До 32
Блок ввода/вывода

CHARM для сервера 795 (вид сзади)

CHARM для сервера 795 (вид сзади) © 2011 IBM Система питания DCA х 2 На каждую

© 2011 IBM

Система питания
Система питания
DCA х 2 На каждую книгу
DCA х 2
На каждую книгу
Вентляторы Системы Охлаждения От 2 до 4-х
Вентляторы
Системы
Охлаждения
От 2 до 4-х

© 2011 IBM

CHARM для сервера 795 Процессорная книга

Системная плата TPM карта Модули памяти Процессор (MCM) x 4
Системная плата
TPM карта
Модули памяти
Процессор
(MCM) x 4

Система питания

© 2011 IBM

BPF (вентилятор) BPR (регулятор) BPC (контроллер) BPH (концентратор)
BPF (вентилятор)
BPR (регулятор)
BPC (контроллер)
BPH (концентратор)

© 2011 IBM

Блок ввода/вывода

PCI адаптеры Системная плата Вентиляторы Системы охлаждения
PCI адаптеры
Системная плата
Вентиляторы
Системы охлаждения
Жесткие диски
Или SSD
DCA

Power 770/780

Новый сервер High-end класса (780) От 8 до 64 ядер Функция TurboCore (780) Частота процессора 3.8 или 4.1 GHz Capacity on Demand

24x7 обслуживание (780)

© 2011 IBM

3.8 или 4.1 GHz ✓ Capacity o n D e m a n d ✓ 24x7

© 2011 IBM

CHARM для сервера 770/780 (вид спереди)

Вентиляторы Системы охлаждения Процессорный блок DVD привод
Вентиляторы
Системы охлаждения
Процессорный блок
DVD привод
Операторская
панель
Жесткие диски

© 2011 IBM

CHARM для сервера 770/780 (вид сзади) GX адаптер Блок питания х 2 Карты
CHARM для сервера 770/780 (вид сзади)
GX адаптер
Блок питания х 2
Карты
Ввода/вывода
Сервисный
процессор
Системная плата

© 2011 IBM

CHARM для сервера 770/780 Процессорный блок

Модули памяти TPM карта Процессор (MCM) Регуляторы Напряжения VRM
Модули памяти
TPM карта
Процессор
(MCM)
Регуляторы
Напряжения VRM

Общие правила

© 2011 IBM

Не более 1 задачи CHARM с одной HMC консоли

Все работы с использованием технологии CHARM выполняются сервисным инженером IBM

Запустить процедуру “Prepare for Hot Repair/Upgrade” на HMC консоли которая определяет количество системных ресурсов (процессоров, памяти и портов ввода/вывода), которые необходимо освободить до проведения работ CHARM (Это обязанность системного администратора).

В серверах p795 оба сервисных процессора должны быть в рабочем состоянии, в серверах p770/780 в конфигурации от 2-х до 4-х блоков должны быть установлены два сервисных процессора и быть в рабочем состоянии и оба подключены к HMC консоли

Необходимо установить и включить Electronic Service Agent (ESA)

© 2011 IBM

Правила для добавления или модернизации

Все открытые сервисные события на HMC должны быть закрыты

Для

нескольких

добавлений,

которые

включают

в

себя

добавления

блока

I/O,

а

также

книги

или

GX-адаптера,

необходимо установить сперва книгу или GX-адаптер.

Если добавление ресурсов включает в себя добавление книги и GX - адаптера, сперва установите адаптер в книгу затем установите книгу в сервер.

В таком случае 128 MB памяти требуемой для работы GX – адаптера, возьмется из новой книги когда она заработает а не из памяти сервера

© 2011 IBM

Правила для ремонта

Для

замены

неработающей

использовать

Во

модернизировать.

точно

ремонта

время

такие

нельзя

запчасти

же

ничего

FRU

запчасти

необходимо

FRU.

или

добавлять

Например, если сломался 4 ГБ DIMM, он должен быть заменен таким же 4 ГБ DIMM - а не 2 ГБ или 8 ГБ DIMM

Адаптер RIO GX должен быть заменен на аптер RIO GX, а не адаптер InfiniBand GX

Что не поддерживается

Что не поддерживается © 2011 IBM  Системы технологии RIO-SAN (эта

© 2011 IBM

Системы

технологии

RIO-SAN (эта технология есть только у пользователей IBM i

используя switchable towers и virtual OptiConnect)

связанные

в

кластер

по

Системы связанные в кластер по технологии InfiniBand (эта возможность обычно используется заказчиками для High Performance Computing, используя InfiniBand switch)

I/O Processors (IOPs), используемые разделами IBM I, не поддерживают CHARM (в разделе IBM i который использует IOPs должны быть выключены IOPs или выключен весь раздел)

CHARM операции очень сложны

© 2011 IBM

они влекут за собой многочисленные шаги, которые выполняются инженером

IBM

и/или

системным

администратором,

на

включенном

сервере.

Так как вероятность отказа возрастает со сложностью операции, следующие минимальные критерии обеспечат необходимую защиту в любых непредвиденных ситуациях:

1. Настоятельно рекомендуется, все запланированные работы по горячей

замене, модернизации или ремонту делать во время минимальной загрузки системы.

2. настроить резервные пути, для критических ресурсов ввода-вывода для

ремонта или модернизации книг и/или GX адаптеров.

3. включить ESA (Electronic Service Agent) , чтобы обеспечить своевременное,

с минимальными задержками, разрешение возможных проблем при любых аппаратных сбоях во время операции CHARM.

4. переместить критические бизнес-приложения на другой сервер с помощью

Live Partition Mobility (LPM), если таковые имеются, или их остановить для добавления/ремонта/модернизации книг или GX адаптеров.

CHARM минимальные критерии:

© 2011 IBM

 

Критерии

 

Операции

Минимальная

Резервирование

ресурсов

Включение ESA

LPM или

загрузка

ввода/вывода

Quiesce

Fan/Blower/Control добавление или ремонт

рекомендовано

 

Power Supply/Bulk Power добавление или ремонт

рекомендовано

Op Panel

рекомендовано

DASD / Media Drive & Drawer добавление

рекомендовано

DASD / Media Drive & Drawer ремонт

рекомендовано

необходимо

 

PCI Adapter добавление

рекомендовано

 

PCI Adapter ремонт

рекомендовано

необходимо

 

I/O Drawer добавлене

рекомендовано

 

I/O Drawer ремонт, удаление

рекомендовано

необходимо

 

System Controller ремонт

рекомендовано

 

GX Adapter добавление

рекомендовано

 

необходимо

 

GX Adapter ремонт

рекомендовано

необходимо

необходимо

необходимо

Node добавлене

рекомендовано

 

необходимо

необходимо

Node модернизация (memory)

рекомендовано

необходимо

необходимо

необходимо

Hot Node ремонт

рекомендовано

необходимо

необходимо

необходимо

Необходимые требования для POWER7

© 2011 IBM

Необходимые требования CHARM для POWER7

HMC V7R7.2 или выше

Микрокод системы AM720_64 или выше для Power 770 и Power 780;

Необходимый микрокод для Power 795 — AH720_101 или AH730_035

(обновления по необходимым требованиям можно проверить в InfoCenter)

Система должна содержать 2 или более книги

Добавление нового GX адаптера требует заранее зарезервированной памяти 128М. По умолчанию возможно увеличить:

Power Systems 770, 780,

1 дополнительно и максимально, если есть свободный слот

Power Systems 795

1 дополнительно в каждую книгу и 2 максимально, если есть свободные слоты

© 2011 IBM

Необходимые требования для IBM i

IBM i вопросы планирования

Для возможности ремонта/модернизации на включенной машине с работающими разделами IBM I, необходимо установить следующие PTFs:

V5R4: MF45678

V6R1: MF45581

Если PTFs не активированы, разделы IBM i необходимо выключить перед работами CHARM.

активированы, разделы IBM i необходимо выключить перед работами CHARM.

© 2011 IBM

Конфигурация

Для обеспечения максимально возможной доступности системы и разделов при выполнении задач CEC Concurrent Repair, следуйте этим основным пунктам при конфигурировании системы:

1. Система должна иметь достаточный объем свободных процессоров

и памяти, для возможности отключения книги при минимальном влиянии на работающий сервер.

2. Все критические I/O ресурсы должны быть подключены

конфигурацию multi-path I/O.

используя

3. Дублирующие I/O адаптеры должны находится в разных блоках ввода/вывода, которые подключены к разным GX адаптерам, которые должны находится в разных книгах

Необходимость и важность MPIO

© 2011 IBM

Необходимость и важность MPIO © 2011 IBM

Утилита Prepare for Hot Repair/Upgrade

© 2011 IBM

Утилита Prepare for Hot Repair/Upgrade: ее необходимо запускать на HMC перед проведением работ по ремонту или добавлению/модернизации

Эта утилита показывает сколько нужно высвободить ресурсов процессоров, памяти и устройств ввода/вывода для возможности изъятия книги из сервера.

Эту утилиту запускает системный администратор перед приездом сервисного инженера IBM

Утилита запускается автоматически при запуске процедуры ремонта или добавления ресурсов для подтверждения того, что все необходимые ресурсы для изъятия книги были высвобождены системным администратором

Этот шаг можно пропустить, если не требуется изъятия книги, например для добавления новой книги или GX адаптера

© 2011 IBM

Prepare for Hot Repair/Upgrade

Новое подменю Раньше использовалась
Новое
подменю
Раньше
использовалась

Обновляемая информация

© 2011 IBM

Обновляемая информация © 2011 IBM  Whitepaper – Google: POW03058USEN.PDF –

Whitepaper

Google: POW03058USEN.PDF

Дата
Дата

Concurrent Maintenance pages in IBM System Hardware Information Center

Поиск по ключевым словам:

“concurrent maintenance”

POWER7

Выводы

Технология CHARM работает ! При соблюдении некоторых условий:

• Установить последний (рекомендуемый) уровень микрокода сервера и консоли HMC (за актуальностью микрокода следит системный администратор)

ввода/вывода

Настроить

резервные

пути

к

ресурсам

© 2011 IBM

резервные пути к ресурсам © 2011 IBM • В системе должно быть
резервные пути к ресурсам © 2011 IBM • В системе должно быть

• В системе должно быть достаточно ресурсов (процессоров, памяти и ввода/вывода) для изъятия книги с минимальным влиянием на работающий сервер

• Включен сервисный агент ESA

Спасибо!

Спасибо! © 2011 IBM

© 2011 IBM

Вопросы и ответы Михалев Дмирий Технический консультант Power Systems

Вопросы и ответы Михалев Дмирий

Технический консультант Power Systems dmikhalev@ru.ibm.com

+7-985-761-8936

© 2011 IBM