Вы находитесь на странице: 1из 38

Mise en uvre dune stratgie de

continuit ou de reprise dactivit


complte avec VMware

VMware vForum, 2014


Matthieu Gross
Solutions Consultant, Global Accounts
grossm@vmware.com

2014 VMware Inc. Tous droits rservs.

lordre du jour
Dfinition du problme
Dfinitions
Technologies VMware qui assurent des fonctions de continuit et de

reprise dactivit
vSphere High Availability et App HA (HA, App HA)
vSphere Fault Tolerance (FT)
vSphere Data Protection / Advanced (VDP / VDPA)
vSphere Replication (VR)
vCloud Hybrid Service Disaster Recovery (vCHS DR)
vCenter Site Recovery Manager (SRM)
vCenter Infrastructure Navigator (VIN)

En savoir plus

La disponibilit et la protection des donnes


sont critiques pour lentreprise
Revenue

Productivit

Conformit

Rputation

Continuit informatique

Quelle est la diffrence ?

Reprise
dactivit

vitement
de sinistre

Interruptions planifies
ou non planifies

Tolrance la panne / Haute disponibilit


Tolrance la panne
Capacit de rcupration aprs une panne de composant
Exemple : dfaillance dun disque dur

Haute disponibilit

Pourcentage de temps
disponible sur un an

Interruptions de service sur un an

99

3,65 jours

99,9

8,76 heures

99,99

52 minutes

99,999 Les cinq neufs

5 minutes

RTO, RPO et MTD


Objectif de temps de rcupration (RTO)
Quel devrait tre le dlai de reprise ?

Objectif de point de rcupration (RPO)


Volume de perte de donnes potentiel

Tolrance dinterruptions de service maximum (MTD)


Nombre dinterruptions possibles avant que dimportantes pertes

ne surviennent
Exemples : domaine financier, rputation
MTD
RTO

RPO

Temps
Dernire
sauvegarde

Evnement

Service restaur
Impact potentiel

Service restaur
Impact critique

VMware : plusieurs niveaux de protection


Protection au niveau de la VM par HA/App HA, FT

Site A

SQL

vSphere HA/FT

Rendre un service dapplication hautement


disponible
vSphere HA
NOUVEAU (vSphere 5.5) : prise en compte des rgles danti-affinit

avant dmarrage de la VM
NOUVEAU (vSphere 5.5) : vSphere App HA

vSphere App HA

Nouveau

Protection des applications prtes lemploi

VMware vFabric tc Server

Bas sur des rgles

Nouveau

vSphere App HA
Agents Hyperic

vFabric Hyperic

sexcutant
dans les VM

vSphere App HA

Appliance virtuelle Appliance virtuelle

vCenter
Server

vSphere

vSphere

vSphere

Cluster vSphere HA

vSphere

vSphere App HA

Nouveau

vSphere HA retenir
Le RTO se mesure en minutes (et non en secondes)
Requiert un stockage partag
Meilleures pratiques
Utilisation du contrle dadmission rgle de pourcentage
Test post-dfaillance des performances en mode maintenance de lhte
Rponse disolement Laisser sous tension
Redondance du stockage et du rseau

vSphere Fault Tolerance (FT)


Pas de dlai de reprise ni de perte de donnes
Panne matrielle de lhte uniquement
Ne protge pas contre les pannes dapplication et dOS

Parfaitement compatible avec HA, App HA

Pourquoi ne pas mettre en place FT ?


Besoins en ressources ; est-ce vraiment ncessaire pour la charge de travail ?
VM dote de plusieurs processeurs (voir BCO5065 )
Pas de snapshot de VM ; agent ncessaire pour les sauvegardes

VMware : plusieurs niveaux de protection


Protection des donnes: vSphere Data Protection (Advanced)

Site A

VDPA
SQL

vSphere HA/FT

Protection des donnes


(sauvegarde et restauration)
Des agents ? Aucun agent ? Les deux !
Pas dagent pour la plupart des charges de travail (simplicit garantie)
Des agents pour certaines applications

vSphere Data Protection (VDP) Advanced


Sauvegarde et rcupration pour et par VMware
Bas sur la technologie prouve et aboutie EMC Avamar
Sauvegarde et restauration de VM sans agent
Agents pour une protection granulaire des applications

de niveau 1

vSphere Data Protection

Nouveau

VDP Advanced retenir


Conu pour les environnements de PME
Utilise VADP (vStorage API for Data Protection) snapshots de VM,

Changed Block Tracking


Utilise Windows Volume Shadow Copy Service dans les outils VMware
Parfaitement compatible avec HA, mais pas avec FT
Le Raw Device Mapping en mode virtuel est pris en charge, mais pas

le RDM en mode physique


Sagit-il dune solution de reprise dactivit ?
Peut-tre, cela dpend des attentes en matire de RTO/RPO
La rplication hors site est ncessaire, nest-ce pas ?

VMware : plusieurs niveaux de protection


Protection de site: vSphere Replication, Site Recovery Manager

Site A

Site B

VDPA

VR/SRM
SQL

vSphere HA/FT

SQL

vSphere Replication Reprise dactivit


Outil natif intgr dans la plate-forme
Rplication par VM au niveau de lhyperviseur, gre dans VC

Choix du RPO :
de 15 minutes
24 heures
Datastore de
destination
slectionnable
(indpendant du
type de disque)

Rplication sur tous les sites

Appliance
vSphere
Replication

Appliance
vSphere
Replication

vCenter Server

vCenter Server

VMware
ESXi

VMware
ESXi

VMware
ESXi

VMware
ESXi

VMware
ESXi

VMware
ESXi

VRA

VRA

VRA

VRA

VRA

VRA

NFC

NFC

Stockage
Stockage
VMDK1

NFC

NFC

NFC

NFC

StockageStockage
(VMDK1)

Une reprise complte en quatre tapes


Cliquez avec le bouton
droit et slectionnez
Recover (Rcuprer).

Slectionnez un
dossier cible.

Slectionnez une
ressource cible.

Cliquez sur Finish


(Terminer).

Validation de vos choix lacte

Nouvelle fonction : conservation de rpliques


historiques

vSphere
Agent
vSphere
Replication

La rtention
de multiples
instantans
permet de
revenir des
tats antrieurs
connus

Aprs la rcupration, utilisez le gestionnaire de snapshot pour


revenir des tats antrieurs

Instantans multiples prsents comme des


snapshots de VM aprs un basculement

Utilisation du gestionnaire de snapshot pour revenir des


tats antrieurs ; une interface dont tous les administrateurs
sont familiers depuis longtemps.

vSphere Replication Interoprabilit

HA, vMotion, DRS

VDP

Storage vMotion et
Storage DRS

Pratiquement aucun

La prise en charge

Si vous utilisez VSS

est maintenant
assure

problme !
assurez-vous que
cest la version 5.5 !

Fault tolerance : non


compatible avec VR
FT entre en conflit au
niveau du filtre de
disque vSCSI.

vCloud Hybrid Services


Disaster Recovery to Cloud 1.0
Rplication asynchrone et reprise simple et scurise pour les
environnements virtuels vSphere
Repose sur vSphere Replication
Capacits warm standby sur vCHS

Site A (Primaire)
VMware
vCenter Server

vCHS, Site B (Recovery)

vSphere
Replication

Protection self-service, Workflow

failover et failback par VM


RPO (Recovery Point Objective de 15

min. 24h

VMware vSphere
US East Region

RTO (Recovery Time Objective)

garanti de 4 heures
Support de lenvoi de donnes offline

(via un transporteur)

US West Region
Servers

Support et SLA de niveau Production


Options de souscription flexibles

1Dependant

US-Nevada
US-Virginia
US-Texas
US-California
EUR-United Kingdom

de la bande passante disponible

26

Site Recovery Manager (SRM)


De quoi sagit-il ?
Un moteur de reprise dactivit
Un outil qui utilise des donnes rpliques en externe
(VR ou bas sur la baie) pour acclrer le RTO dun plan
de continuit dactivit
Un produit qui permet de tester, automatiser, planifier,
rpter et personnaliser la reprise dactivit
Ce quil nest pas
Un moteur de rplication
Un outil pour des systmes ncessitant un RPO quasi
instantan
Un cluster tir pour la prvention des sinistres

Principaux composants de SRM


vCenter Server

Rplication
Site Recovery
Manager
Server

Un vCenter Server
(Windows ou VCVA) par
site (versions identiques)
Un SRM Server par site
(versions identiques)

Des htes vSphere,


versions identiques par site
recommandes (antrieurs
vSphere 5.x uniquement
si la rplication de baie
est utilise)
vSphere Essentials Plus et les versions ultrieures sont prises en charge

Options de rplication SRM


Rplication base sur le stockage
Application n-tier

rplication base sur les baies


ET la rplication vSphere

LUN 1

Web

SRM peut utiliser LA FOIS la

Application

Hub
LUN 2

BD

SRM voit les VM existantes et

autonomes
protges par vSphere Replication
vSphere Replication
Application n-tier
Web
Application

BD

SRM peut installer

vSphere Replication intgralement


si ncessaire

Workflows de reprise
Automatisation du
basculement
Plan de reprise dfini par lutilisateur
Rduction des erreurs
Test de basculement sans
interruption de lactivit
Environnement de test isol
Amlioration de la confiance dans le
processus de reprise dactivit
Migration planifie
Aucune perte de donnes
Migration des oprations
Automatisation des retours
arrire
Nouvelle protection des VM, annulation de
la migration

Interoprabilit avec SRM


Fonctionne avec VR et Array

Based Replication
Les sauvegardes, VADP ou

autre conviennent
HA ne pose aucun problme

Storage vMotion and Storage

DRS On peut dire a


Dpendance vis--vis de la

rplication

FT est au jaune
Rpliqu sur baie uniquement et

vMotion et DRS fonctionnent

correctement

le statut FT nest pas rcupr


Web / Client vSphere

SRM : quelques pratiques dexcellence


Liste non
exhaustive

De nombreux documents de support sont disponibles sur les blogs,


vmware.com et les sites d'informations techniques

Pratiques
importantes :

Topologie du stockage
Test de la configuration rseau
Frquence des tests
Dimensionner vCenter correctement

La plus
importante :

Effectuer une analyse dimpact


commercial

RPO, RTO, cot des interruptions


de service, interdpendances,
importance stratgique des
applications, priorits, units de
basculement, facteurs externes
ngligs, adhsion des cadres
dirigeants, etc.

Groupes de protection
Davantage de groupes de protection = test granulaire/basculement amplifis
Le test de reprise dactivit est plus facile et ncessite moins de ressources
Basculement uniquement des lments ncessaires
Configuration plus complexe / Complexit accrue

Moins de groupes de protection =

complexit rduite
Moins de LUN, de groupes de protection et de

La majorit des pannes


sont partielles (naffectent
quune partie du data
center) Conception en
consquence

plans de reprise
Flexibilit rduite

Trouver un bon quilibre entre flexibilit et simplicit


Moins de LUN /
groupes de protection
Complexit rduite
Flexibilit rduite

Dpend du client

Un bon quilibre
entre complexit
et flexibilit

Davantage de LUN /
groupes de protection
Complexit accrue
Une flexibilit accrue

Rseau de test
Utiliser un VLAN ou un rseau isol pour lenvironnement de tests
Le paramtre Auto par dfaut ne permet pas la communication des VM entre
les htes
Diffrents vSwitch peuvent tre spcifis dans SRM (test / excution)
Indiqus dans le plan de reprise

vSphere Infrastructure Navigator

Ressources
complmentaires

En savoir plus
Exercez-vous dans un laboratoire
dessai pratique en ligne
Demandez voir une
dmonstration
Installez une version dvaluation
de 60 jours

Merci
Matthieu Gross
Solutions Consultant, Global Accounts
grossm@vmware.com