JSS2013 : Haute disponibilité

Les journées

SQL Server 2013

Un événement organisé par GUSS

#JSS2013

Les journées

SQL Server 2013

Session Haute-disponibilité
Christophe LAPORTE
David BARBARIN
David BAFFALEUF

Un événement organisé par GUSS

#JSS2013

Présentation
Christophe LAPORTE

David BARBARIN

David BAFFALEUF

~ depuis 1997
6.5 <= SQL Server <= 2014

~ depuis 2002
7 <= SQL Server <= 2014

~ depuis 1999
7.0 <= SQL Server <= 2014

christophe_laporte@hotmail.fr

mikedavem1@hotmail.com

dbaffaleuf@capdata-osmozium.com

http://conseilit.wordpress.com/

http://blog.developpez.com/mikedavem

http://blog.capdata.fr

@conseilit

@mikedavem

@dbaffaleuf

#JSS2013

Merci à nos sponsors

#JSS2013

Agenda
• Des questions
–
–
–
–

Pourquoi la haute disponibilité
La non disponibilité
Définition d’une stratégie
Problèmes et limitations

• Les solutions
– Des plus anciennes aux plus récentes
#JSS2013

• Des questions
–
–
–
–

La non disponibilité
Problèmes et limitations

• Les solutions
– Des plus anciennes aux plus récentes
#JSS2013

• Définition basique

– Etre capable d’accéder à une donnée lorsque l’on en a besoin
dans un laps de temps acceptable !

• BD point central dans le SI

– Sharepoint, sites Web de paris ou commerce en ligne
– Progiciels (RH, Compta, production, CRM)
– Logiciels « maison »

• La non disponibilité a un coût
– Chiffre d’affaire …
– Coût en temps
– Salaires d’employés …

#JSS2013

Mesurer la haute disponibilité

#JSS2013

Cause de non disponibilité
Coupure de service planifiée
• Création / Reconstruction d’index non cluster : éventuellement pas de modifications
sur la table
• Création / Reconstruction d’index cluster : éventuellement pas de lecture et
modifications sur la table
• Changement de matériel, application de Service Packs
Coupure de service non planifiée
• Perte du Datacenter (électricité, réseau, catastrophe naturelle, incendie)
• Perte du serveur (alimentation, CPU, mémoire, réseau, OS crash)
• Problème disque (corruption d’I/O, panne contrôleur disque, panne disque, panne
carte RAID)
Ne pas confondre PCA et PRA
• HA et DR …

#JSS2013

Granularité
RPO
RTO

•Chiffre d’affaire
•Salaires
•Datacenter -> Instance -> Groupe de bases -> Base > Table -> Traitement
•Coordination des dépendances

• Perte maximale de données autorisée

• Durée maximale de non disponibilité
autorisée

Période ouvrée

• 24 H / 24 , 7 J /7
• Entre 8h00 et 18h00 les jours ouvrés …

En cas de panne

Stratégie

Quantifier
l’indisponibilité

• Même niveau de performance requis ?
• Dégradation acceptable ?

#JSS2013

Cluster de basculement SQL
Terminologie
• Cluster, nœud, quorum, SAN, LUN, groupe
de ressources, dépendance, instance virtuelle

Technologie éprouvée
• Couche cluster Windows
#JSS2013

Avantages du FCI
Tolérance de panne
• Matérielle, logicielle

Instance virtuelle
• Adresse IP et Nom réseau virtuels

Granularité
• Instance (donc agent SQL …)

#JSS2013

Points remarquables
Windows 2012

SQL 2012
Windows 2012 R2
SQL 2014

• Quorum dynamique
• TempDB locale
• Témoin dynamique
• Data sur disque CSV
#JSS2013

Démo
• Ajout d’une instance sur disque CSV

#JSS2013

Inconvénients de la solution
Défaillance du système disque
• SPOF

Répartition de charge impossible
• Un seul nœud actif à la fois

Coût
• Cartes, switch, fibres, SAN …

Durée de recovery
• Nombre de bases

Granularité
• Protection de niveau instance
#JSS2013

GEO Cluster
• != Multi subnet failover cluster
• Résolution SPOF disque
• Solutions constructeur
– EMC, HP, Unisys

• Solutions logicielles

– DoubleTake, DataKeeper (Démo à suivre)

• Solutions SQL Server

– Database mirroring, log shipping, réplication
– Groupes de disponibilité
#JSS2013

Démo
• Ajout d’un disque cluster SIOS DataKeeper

#JSS2013

Outsiders
Database Mirroring

Log Shipping
Réplication (transactionnelle)

#JSS2013

L’union fait la force
• Prises indépendamment elles ne présentent que peu d’avantages
par rapport aux solutions ‘reines’.
FCI

Database
Mirroring

Virtualisation

Log
Shipping

Availability
Groups

Réplication
(?)

• Mais si on les combine toutes les trois ?
#JSS2013

Exemple DBM + LS + Réplication
Données
ouvertes
pour DSS

Secours
dormant
Réplication

Database Mirroring

Log Shipping
.trn
.trn
.trn
.trn
Reporting

Refresh -8h
contre les
erreurs
humaines

#JSS2013

Démo
• Exemple d’une topologie combinée

#JSS2013

Intérêts de la solution
Perte de la machine principale, perte du
stockage local, problème OS, corruption…
• On bascule sur le miroir
• Qui est aussi paramétré pour reprendre le rôle d’éditeur
et de source du LS

Moins d’indisponibilité sur les plages de
maintenance.
#JSS2013

Réplication vs réplicas readonly, avantages
Volumétrie:
• On n’est pas obligé de dupliquer toute la volumétrie

Indexes DSS:
• On peut créer des indexes custom DSS sur les bases abonnées

Store & forward
• Perte de la connexion avec l’abonné, la base distribution joue le rôle de tampon. Pas d’impact sur le journal de transactions
primaire.

Coût:
• Pas besoin d’avoir toutes les instances en édition Enterprise.

Scale-out
• En ajoutant des abonnés, pas de limitation à 2 réplicas.

Contrainte AD:
• Moins d’adhérence avec un domaine

#JSS2013

Réactivité:
• Pas de bascule automatisée (sauf avec witness)

DBM et reporting?
• db snapshot pas très pratique quand même

Complexité
• Plusieurs systèmes à maintenir au lieu d’un seul.

Point d’entrée unique:
• Pas de détection d’intention pour la lecture seule (ApplicationIntent)

Conflits en mise à jour:
• L’abonné est ouvert en lecture /écriture donc pas de garde-fou contre le conflit en mise à jour.

Paramétrage manuel :
• La bascule est transparente pour la réplication, mais pas pour le log shipping (paramétrage manuel).

#JSS2013

SQL Server AlwaysOn
Terminologie
• Groupe de
disponibilités, réplicas, cluster, nœud, quorum, stockage
asymétrique, réplication synchrone et asynchrone

Technologie éprouvée
• Couche cluster Windows, mirroring ++

#JSS2013

Avantages des groupes de disponibilité
Tolérance de panne
• Matérielle, logicielle, corruption physique des données

Connexion unique via point d’accès client (listener)
• Adresse IP et Nom réseau virtuel

Granularité
• Groupe de base de données

#JSS2013

Avantages des groupes de disponibilité
Rentabilisation des serveurs secondaires standby
• Répartition de charge avec utilisation en lecture seule en temps réel, sauvegardes

Stockage
• Indépendance vis-à-vis d’un stockage partagé,
• Stockage asymétrique avec disaster recovery sur site distant

Complexité
• Une seule fonctionnalité pour gérer la haute disponibilité et les situations de
désastre

#JSS2013

Points remarquables
Windows 2012

SQL 2012
Windows 2012 R2
SQL 2014

• Quorum dynamique

• 4 réplicas secondaires

• Quorum amélioré (témoin dynamique, résilience du quorum, arbitrage des votes)
• Support CSV
• Déploiement de cluster sans dépendance d’objets dans l’active directory

• 8 réplicas secondaires + plus forte intégration avec Azure + support Hekaton

#JSS2013

Démo
DSS

Standby
Backups
Réplica synchrone
Réplication
asynchrone

Réplication
synchrone

#JSS2013

Démo
• Exemple d’une topologie AlwaysOn avec
Windows Server 2012 et SQL14

#JSS2013

Coût
• Nécessite une édition Enterprise de SQL Server 2012 avec licence par cœur logique
• Chaque serveur secondaire actif (backup ou lecture seule) doit être licencié

Limite du nombre de réplicas synchrones
• Limite à 3 réplicas

Lecture / écriture sur un seul point d’entrée
• Pas de possibilité d’avoir plusieurs réplicas primaires en même temps

Répartition de charge en lecture seule impossible via les listeners
• L’algorithme de redirection des connexions en intention de lecture seule sont toujours redirigés vers le même réplica

Paramétrage
• Certains paramétrages s’effectuent depuis la GUI alors que d’autres ne sont disponibles que par T-SQL ou PowerShell

Monitoring
• Pas forcément évident en utilisant les divers axes de troubleshooting en natif avec SQL Server
• Pas de solution réelle de monitoring fournie en natif

#JSS2013

Virtualisation
Flexibilité
• Live storage migration
• Live migration
• MàJ hyperviseur
• Mémoire dynamique
• Redimensionnement VHDX

HA
• Live migration
• Storage live migration
• Host cluster
• Guest cluster
• Peu ou pas de coupure de service
• Scénario supporté (KB956893)

DR
• Hyper-V replica (30 secs, 5 mins, 15 mins))
• Attention compatibilité avec autres solutions

#JSS2013

Virtualisation
Exploitation
• Rapidité déploiement
• Export et clonage de VM à chaud
• Cluster Aware Updating

Performance
•
•
•
•
•

Quasi similaire (6% – 7%)
VHDX secteurs 4KB, max 64 TB
Storage tiering
Storage QoS
Offloaded Data Transfer (ODX)
#JSS2013

Demo – Shared VHDX
• Si le temps le permet …

#JSS2013

Questions / Réponses
Merci à tous pour votre présence.

#JSS2013

Rappels : haute disponibilité
• Définition basique

– Etre capable d’accéder à une donnée lorsque l’on en a
besoin dans un laps de temps acceptable !

• BD point central dans le SI

– Sharepoint, sites Web de paris ou commerce en ligne
– Progiciels (RH, Compta, production, CRM)
– Logiciels « maison »

• La non disponibilité a un coût
– Chiffre d’affaire …
– Salaires d’employés …

#JSS2013

Granularité
RPO
RTO

•Chiffre d’affaire
•Salaires

•Datacenter -> Instance -> Groupe de bases -> Base -> Table ->
Traitement
•Coordination des dépendances

• Perte maximale de données autorisée

• Durée maximale de non disponibilité
autorisée

Période ouvrée

• 24 H / 24 , 7 J /7
• Entre 8h00 et 18h00 les jours ouvrés …

En cas de panne

Stratégie

Quantifier
l’indisponibilité

• Même niveau de performance requis ?
• Dégradation acceptable ?

#JSS2013

Mesurer la disponibilité
• Les « neufs »

#JSS2013

Des fonctionnalités

Table

Database

Infrastructure

Online index Operations

Fast Recovery

Instant File Initialization

Online LOB index Operations

Partial Database Availability

Auto page repair

Table Partitioning

Online piecemeal restore

Hot-add CPU / Memory

Database Snapshot

Resource Governor

#JSS2013

Des solutions connues
•
•
•
•
•
•

Log Shipping
Failover Cluster
Database Mirroring
Réplication
Windows Azure SQL Databases / Federation
Virtualisation
– On Premise (Hyper-V)
– Off Premise (Windows Azure)
#JSS2013

JSS2013 : Haute disponibilité

Contenu connexe

Tendances (20)

En vedette (20)

Similaire à JSS2013 : Haute disponibilité (20)

Dernier (10)

JSS2013 : Haute disponibilité

Notes de l'éditeur