Les journées

SQL Server 2013

Un événement organisé par GUSS

#JSS2013
Les journées

SQL Server 2013

Session Haute-disponibilité
Christophe LAPORTE
David BARBARIN
David BAFFALEUF

Un événement organisé par GUSS

#JSS2013
Présentation
Christophe LAPORTE

David BARBARIN

David BAFFALEUF

~ depuis 1997
6.5 <= SQL Server <= 2014

~ depuis 2002
7 <= SQL Server <= 2014

~ depuis 1999
7.0 <= SQL Server <= 2014

christophe_laporte@hotmail.fr

mikedavem1@hotmail.com

dbaffaleuf@capdata-osmozium.com

http://conseilit.wordpress.com/

http://blog.developpez.com/mikedavem

http://blog.capdata.fr

@conseilit

@mikedavem

@dbaffaleuf

#JSS2013
Merci à nos sponsors

#JSS2013
Agenda
• Des questions
–
–
–
–

Pourquoi la haute disponibilité
La non disponibilité
Définition d’une stratégie
Problèmes et limitations

• Les solutions
– Des plus anciennes aux plus récentes
#JSS2013
• Des questions
–
–
–
–

Pourquoi la haute disponibilité
La non disponibilité
Définition d’une stratégie
Problèmes et limitations

• Les solutions
– Des plus anciennes aux plus récentes
#JSS2013
Pourquoi la haute disponibilité
• Définition basique

– Etre capable d’accéder à une donnée lorsque l’on en a besoin
dans un laps de temps acceptable !

• BD point central dans le SI

– Sharepoint, sites Web de paris ou commerce en ligne
– Progiciels (RH, Compta, production, CRM)
– Logiciels « maison »

• La non disponibilité a un coût
– Chiffre d’affaire …
– Coût en temps
– Salaires d’employés …

#JSS2013
Mesurer la haute disponibilité

#JSS2013
Cause de non disponibilité
Coupure de service planifiée
• Création / Reconstruction d’index non cluster : éventuellement pas de modifications
sur la table
• Création / Reconstruction d’index cluster : éventuellement pas de lecture et
modifications sur la table
• Changement de matériel, application de Service Packs
Coupure de service non planifiée
• Perte du Datacenter (électricité, réseau, catastrophe naturelle, incendie)
• Perte du serveur (alimentation, CPU, mémoire, réseau, OS crash)
• Problème disque (corruption d’I/O, panne contrôleur disque, panne disque, panne
carte RAID)
Ne pas confondre PCA et PRA
• HA et DR …

#JSS2013
Définition d’une stratégie
Granularité
RPO
RTO

•Chiffre d’affaire
•Salaires
•Datacenter -> Instance -> Groupe de bases -> Base > Table -> Traitement
•Coordination des dépendances

• Perte maximale de données autorisée

• Durée maximale de non disponibilité
autorisée

Période ouvrée

• 24 H / 24 , 7 J /7
• Entre 8h00 et 18h00 les jours ouvrés …

En cas de panne

Stratégie

Quantifier
l’indisponibilité

• Même niveau de performance requis ?
• Dégradation acceptable ?

#JSS2013
• Des questions
–
–
–
–

Pourquoi la haute disponibilité
La non disponibilité
Définition d’une stratégie
Problèmes et limitations

• Les solutions
– Des plus anciennes aux plus récentes
#JSS2013
Cluster de basculement SQL
Terminologie
• Cluster, nœud, quorum, SAN, LUN, groupe
de ressources, dépendance, instance virtuelle

Technologie éprouvée
• Couche cluster Windows
#JSS2013
Avantages du FCI
Tolérance de panne
• Matérielle, logicielle

Instance virtuelle
• Adresse IP et Nom réseau virtuels

Granularité
• Instance (donc agent SQL …)

#JSS2013
Points remarquables
Windows 2012

SQL 2012
Windows 2012 R2
SQL 2014

• Quorum dynamique
• TempDB locale
• Témoin dynamique
• Data sur disque CSV
#JSS2013
Démo
• Ajout d’une instance sur disque CSV

#JSS2013
Inconvénients de la solution
Défaillance du système disque
• SPOF

Répartition de charge impossible
• Un seul nœud actif à la fois

Coût
• Cartes, switch, fibres, SAN …

Durée de recovery
• Nombre de bases

Granularité
• Protection de niveau instance
#JSS2013
GEO Cluster
• != Multi subnet failover cluster
• Résolution SPOF disque
• Solutions constructeur
– EMC, HP, Unisys

• Solutions logicielles

– DoubleTake, DataKeeper (Démo à suivre)

• Solutions SQL Server

– Database mirroring, log shipping, réplication
– Groupes de disponibilité
#JSS2013
Démo
• Ajout d’un disque cluster SIOS DataKeeper

#JSS2013
Outsiders
Database Mirroring

Log Shipping
Réplication (transactionnelle)

#JSS2013
L’union fait la force
• Prises indépendamment elles ne présentent que peu d’avantages
par rapport aux solutions ‘reines’.
FCI

Database
Mirroring

Virtualisation

Log
Shipping

Availability
Groups

Réplication
(?)

• Mais si on les combine toutes les trois ?
#JSS2013
Exemple DBM + LS + Réplication
Données
ouvertes
pour DSS

Secours
dormant
Réplication

Database Mirroring

Log Shipping
.trn
.trn
.trn
.trn
Reporting

Refresh -8h
contre les
erreurs
humaines

#JSS2013
Démo
• Exemple d’une topologie combinée

#JSS2013
Intérêts de la solution
Perte de la machine principale, perte du
stockage local, problème OS, corruption…
• On bascule sur le miroir
• Qui est aussi paramétré pour reprendre le rôle d’éditeur
et de source du LS

Moins d’indisponibilité sur les plages de
maintenance.
#JSS2013
Réplication vs réplicas readonly, avantages
Volumétrie:
• On n’est pas obligé de dupliquer toute la volumétrie

Indexes DSS:
• On peut créer des indexes custom DSS sur les bases abonnées

Store & forward
• Perte de la connexion avec l’abonné, la base distribution joue le rôle de tampon. Pas d’impact sur le journal de transactions
primaire.

Coût:
• Pas besoin d’avoir toutes les instances en édition Enterprise.

Scale-out
• En ajoutant des abonnés, pas de limitation à 2 réplicas.

Contrainte AD:
• Moins d’adhérence avec un domaine

#JSS2013
Inconvénients de la solution
Réactivité:
• Pas de bascule automatisée (sauf avec witness)

DBM et reporting?
• db snapshot pas très pratique quand même

Complexité
• Plusieurs systèmes à maintenir au lieu d’un seul.

Point d’entrée unique:
• Pas de détection d’intention pour la lecture seule (ApplicationIntent)

Conflits en mise à jour:
• L’abonné est ouvert en lecture /écriture donc pas de garde-fou contre le conflit en mise à jour.

Paramétrage manuel :
• La bascule est transparente pour la réplication, mais pas pour le log shipping (paramétrage manuel).

#JSS2013
SQL Server AlwaysOn
Terminologie
• Groupe de
disponibilités, réplicas, cluster, nœud, quorum, stockage
asymétrique, réplication synchrone et asynchrone

Technologie éprouvée
• Couche cluster Windows, mirroring ++

#JSS2013
Avantages des groupes de disponibilité
Tolérance de panne
• Matérielle, logicielle, corruption physique des données

Connexion unique via point d’accès client (listener)
• Adresse IP et Nom réseau virtuel

Granularité
• Groupe de base de données

#JSS2013
Avantages des groupes de disponibilité
Rentabilisation des serveurs secondaires standby
• Répartition de charge avec utilisation en lecture seule en temps réel, sauvegardes

Stockage
• Indépendance vis-à-vis d’un stockage partagé,
• Stockage asymétrique avec disaster recovery sur site distant

Complexité
• Une seule fonctionnalité pour gérer la haute disponibilité et les situations de
désastre

#JSS2013
Points remarquables
Windows 2012

SQL 2012
Windows 2012 R2
SQL 2014

• Quorum dynamique

• 4 réplicas secondaires

• Quorum amélioré (témoin dynamique, résilience du quorum, arbitrage des votes)
• Support CSV
• Déploiement de cluster sans dépendance d’objets dans l’active directory

• 8 réplicas secondaires + plus forte intégration avec Azure + support Hekaton

#JSS2013
Démo
DSS

Standby
Backups
Réplica synchrone
Réplication
asynchrone

Réplication
synchrone

#JSS2013
Démo
• Exemple d’une topologie AlwaysOn avec
Windows Server 2012 et SQL14

#JSS2013
Inconvénients de la solution
Coût
• Nécessite une édition Enterprise de SQL Server 2012 avec licence par cœur logique
• Chaque serveur secondaire actif (backup ou lecture seule) doit être licencié

Limite du nombre de réplicas synchrones
• Limite à 3 réplicas

Lecture / écriture sur un seul point d’entrée
• Pas de possibilité d’avoir plusieurs réplicas primaires en même temps

Répartition de charge en lecture seule impossible via les listeners
• L’algorithme de redirection des connexions en intention de lecture seule sont toujours redirigés vers le même réplica

Paramétrage
• Certains paramétrages s’effectuent depuis la GUI alors que d’autres ne sont disponibles que par T-SQL ou PowerShell

Monitoring
• Pas forcément évident en utilisant les divers axes de troubleshooting en natif avec SQL Server
• Pas de solution réelle de monitoring fournie en natif

#JSS2013
Virtualisation
Flexibilité
• Live storage migration
• Live migration
• MàJ hyperviseur
• Mémoire dynamique
• Redimensionnement VHDX

HA
• Live migration
• Storage live migration
• Host cluster
• Guest cluster
• Peu ou pas de coupure de service
• Scénario supporté (KB956893)

DR
• Hyper-V replica (30 secs, 5 mins, 15 mins))
• Attention compatibilité avec autres solutions

#JSS2013
Virtualisation
Exploitation
• Rapidité déploiement
• Export et clonage de VM à chaud
• Cluster Aware Updating

Performance
•
•
•
•
•

Quasi similaire (6% – 7%)
VHDX secteurs 4KB, max 64 TB
Storage tiering
Storage QoS
Offloaded Data Transfer (ODX)
#JSS2013
Demo – Shared VHDX
• Si le temps le permet …

#JSS2013
Questions / Réponses
Merci à tous pour votre présence.

#JSS2013
#JSS2013
#JSS2013
Rappels : haute disponibilité
• Définition basique

– Etre capable d’accéder à une donnée lorsque l’on en a
besoin dans un laps de temps acceptable !

• BD point central dans le SI

– Sharepoint, sites Web de paris ou commerce en ligne
– Progiciels (RH, Compta, production, CRM)
– Logiciels « maison »

• La non disponibilité a un coût
– Chiffre d’affaire …
– Salaires d’employés …

#JSS2013
Définition d’une stratégie
Granularité
RPO
RTO

•Chiffre d’affaire
•Salaires

•Datacenter -> Instance -> Groupe de bases -> Base -> Table ->
Traitement
•Coordination des dépendances

• Perte maximale de données autorisée

• Durée maximale de non disponibilité
autorisée

Période ouvrée

• 24 H / 24 , 7 J /7
• Entre 8h00 et 18h00 les jours ouvrés …

En cas de panne

Stratégie

Quantifier
l’indisponibilité

• Même niveau de performance requis ?
• Dégradation acceptable ?

#JSS2013
Mesurer la disponibilité
• Les « neufs »

#JSS2013
Des fonctionnalités

Table

Database

Infrastructure

Online index Operations

Fast Recovery

Instant File Initialization

Online LOB index Operations

Partial Database Availability

Auto page repair

Table Partitioning

Online piecemeal restore

Hot-add CPU / Memory

Database Snapshot

Resource Governor

#JSS2013
Des solutions connues
•
•
•
•
•
•

Log Shipping
Failover Cluster
Database Mirroring
Réplication
Windows Azure SQL Databases / Federation
Virtualisation
– On Premise (Hyper-V)
– Off Premise (Windows Azure)
#JSS2013

Contenu connexe

PPTX
Always On - Les solutions de haute disponibilité avec SQL Server 2012
PPTX
Comment combiner les AlwaysOn Availability Groups avec la Réplication dans SQ...
PPTX
JSS2014 – Infrastructure et Always-On
PPTX
Always on les solutions de haute disponibilité avec sql server 2012 (dat302)
PPTX
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
PPTX
Tout sur les solutions de Haute Disponibilité et Disaster Recovery de SQL Ser...
PPTX
SQLSaturday Paris 2014 - SQL Server AlwaysOn et les groupes de disponibilités...
PPTX
Sql Server et SharePoint le couple de l'année 2012
Always On - Les solutions de haute disponibilité avec SQL Server 2012
Comment combiner les AlwaysOn Availability Groups avec la Réplication dans SQ...
JSS2014 – Infrastructure et Always-On
Always on les solutions de haute disponibilité avec sql server 2012 (dat302)
Tout sur les solutions de haute disponibilité et disaster recovery de sql ser...
Tout sur les solutions de Haute Disponibilité et Disaster Recovery de SQL Ser...
SQLSaturday Paris 2014 - SQL Server AlwaysOn et les groupes de disponibilités...
Sql Server et SharePoint le couple de l'année 2012

Tendances (20)

PDF
[Café Techno] Les nouveautés de TSM V 6.4
PPT
Techdays 2009 - Administration centralisée des infrastructures de virtualisation
PPT
Techdays 2009 - Hyper-V en profondeur, bonnes pratiques et quoi de neuf avec ...
PPT
Comment créer, gérer et sauvegarder éfficacement vos environnements virtuels ...
PDF
Pvaul md3000i exchange_performance_whitepaper_fr
PDF
Sharepoint Summit Québec mise à niveau Sharepoint 2007 vers Sharepoint 2010
PPSX
Virtualisation et intégration des applications d'entreprise en environnement ...
PDF
Windows Azure, plongée en eaux profondes (300)
PPT
Virtualisation de Machines avec Windows Hyper V
PPTX
Java dans Windows Azure: l'exemple de Jonas
PDF
Livre blanc Windows Azure et les éditeurs de logiciel
PPTX
Accélérez vos entrepôts de données avec les Appliances Microsoft : SQL Server...
PPTX
Administration glassfish 3
PPTX
System Center 2012 | SCO : Retours d’expériences projets et déploiements Syst...
PPTX
Etude de la virtualisation : Réseau & Cloisonnement
PDF
Etude de la virtualisation
PDF
Hyper-V Replica : Plan de Reprise d'Activité avec Windows Server 2012
PPTX
Microsoft - Solution Virtualisation Windows Server 08
PPT
Techdays 2009 - La virtualisation de machines avec Hyper-V
PPTX
Windows Server 2012, quelles évolutions pour les services de stockage et de c...
[Café Techno] Les nouveautés de TSM V 6.4
Techdays 2009 - Administration centralisée des infrastructures de virtualisation
Techdays 2009 - Hyper-V en profondeur, bonnes pratiques et quoi de neuf avec ...
Comment créer, gérer et sauvegarder éfficacement vos environnements virtuels ...
Pvaul md3000i exchange_performance_whitepaper_fr
Sharepoint Summit Québec mise à niveau Sharepoint 2007 vers Sharepoint 2010
Virtualisation et intégration des applications d'entreprise en environnement ...
Windows Azure, plongée en eaux profondes (300)
Virtualisation de Machines avec Windows Hyper V
Java dans Windows Azure: l'exemple de Jonas
Livre blanc Windows Azure et les éditeurs de logiciel
Accélérez vos entrepôts de données avec les Appliances Microsoft : SQL Server...
Administration glassfish 3
System Center 2012 | SCO : Retours d’expériences projets et déploiements Syst...
Etude de la virtualisation : Réseau & Cloisonnement
Etude de la virtualisation
Hyper-V Replica : Plan de Reprise d'Activité avec Windows Server 2012
Microsoft - Solution Virtualisation Windows Server 08
Techdays 2009 - La virtualisation de machines avec Hyper-V
Windows Server 2012, quelles évolutions pour les services de stockage et de c...
Publicité

En vedette (20)

PDF
Migration d’annuaires propriétaires vers OpenLDAP : retours d’expérience et b...
PPTX
Haute disponibilité jss2012
PPTX
Haute Disponibilité et Tolérance de Panne
PDF
Architectures haute disponibilité avec MySQL
PDF
Bases de données réparties
PPT
Oracle Data Guard
PPT
Dataguard presentation
KEY
Projet de fin d'études Plateforme de E-Insurance
PPTX
Data Guard Architecture & Setup
PPTX
Réplication des bases de données
PPT
Oracle Cluster Rac
PDF
Administration Base de données Oracle
PDF
MHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
PPTX
Qu'est ce qu'un Cluster?
PDF
Active dataguard
PDF
Dba oracle-v1
PDF
Examens Khaled Jouini ISITCOM ORACLE BD
PPT
Oracle dataguard overview
PDF
Architecture d'annuaire hautement disponible avec OpenLDAP
PDF
Pl/sql - interaction avec la base de données & structures de contrôle
Migration d’annuaires propriétaires vers OpenLDAP : retours d’expérience et b...
Haute disponibilité jss2012
Haute Disponibilité et Tolérance de Panne
Architectures haute disponibilité avec MySQL
Bases de données réparties
Oracle Data Guard
Dataguard presentation
Projet de fin d'études Plateforme de E-Insurance
Data Guard Architecture & Setup
Réplication des bases de données
Oracle Cluster Rac
Administration Base de données Oracle
MHA : MySQL haute dispo, chez Viadeo par Olivier Dasini
Qu'est ce qu'un Cluster?
Active dataguard
Dba oracle-v1
Examens Khaled Jouini ISITCOM ORACLE BD
Oracle dataguard overview
Architecture d'annuaire hautement disponible avec OpenLDAP
Pl/sql - interaction avec la base de données & structures de contrôle
Publicité

Similaire à JSS2013 : Haute disponibilité (20)

PPTX
Serveurs core et virtualisation
PPTX
Azure Camp 9 Décembre - slides session développeurs webmedia
PPTX
Datit207 scénarios hybrides entre sql server et windows azure
PPTX
Guss sql IaaS PaaS 20131202
PDF
JSS2013 Session SharePoint pour le dba sql v1.0
PPTX
Webinar - Enterprise Cloud Databases
PPTX
GAB 2015 - Nouveautes sur le stockage de donnees dans Azure
PPTX
Les nouveautés stockage dans Windows Server 2012 R2
PPTX
Stockage Cloud : il y en aura pour tout le monde
PPTX
Azure Camp 9 Décembre 2014 - slides Keynote
PPTX
Sql saturday 323 paris 2014 azure migration iaas et paas
PDF
MariaDB Paris Workshop 2023 - DARVA presentation
PPTX
JSS2014 – Azure SQL Database : 1 an après
PPTX
Exchange 2013 Bonnes pratiques
PPTX
Monter des environnements dev test efficaces avec Windows Azure
PPTX
SQLSaturday Paris 2014 - Et hop, ma base migre dans Azure
PDF
[JSS2015] Azure SQL Data Warehouse - Azure Data Lake
PDF
Migrez vos bases de données vers SQL Server et SQL Azure avec Microsoft SQL S...
PPTX
DataStax Enterprise et Cas d'utilisation de Apache Cassandra
PPTX
Les bonnes pratiques pour migrer d'Oracle vers Postgres
 
Serveurs core et virtualisation
Azure Camp 9 Décembre - slides session développeurs webmedia
Datit207 scénarios hybrides entre sql server et windows azure
Guss sql IaaS PaaS 20131202
JSS2013 Session SharePoint pour le dba sql v1.0
Webinar - Enterprise Cloud Databases
GAB 2015 - Nouveautes sur le stockage de donnees dans Azure
Les nouveautés stockage dans Windows Server 2012 R2
Stockage Cloud : il y en aura pour tout le monde
Azure Camp 9 Décembre 2014 - slides Keynote
Sql saturday 323 paris 2014 azure migration iaas et paas
MariaDB Paris Workshop 2023 - DARVA presentation
JSS2014 – Azure SQL Database : 1 an après
Exchange 2013 Bonnes pratiques
Monter des environnements dev test efficaces avec Windows Azure
SQLSaturday Paris 2014 - Et hop, ma base migre dans Azure
[JSS2015] Azure SQL Data Warehouse - Azure Data Lake
Migrez vos bases de données vers SQL Server et SQL Azure avec Microsoft SQL S...
DataStax Enterprise et Cas d'utilisation de Apache Cassandra
Les bonnes pratiques pour migrer d'Oracle vers Postgres
 

Dernier (10)

PDF
Frais et décompte dans SAP Transportation Management, TM130 Col18
PDF
Utilisation de la gestion des ressources dans SAP Extended Warehouse Manageme...
PPT
Pratiques des systèmes d'information ppt
PDF
Démystification des QR codes - histoire - utilisations - techniques
PPTX
Projet de Fin d’Études – Plateforme FMS pour la Gestion des FCPR
PDF
SHAKA 2025 - Création d'Images en IA : Mode Expert Activé
PDF
Gestion de la main-d’œuvre dans SAP Extended Warehouse Management, EWM125 Col26
PPTX
843555943-Introduction-a-l-Intelligence-Artificielle.pptx
PDF
Processus dans la gestion des transports, TM100 Col18
PDF
1.3.4-Handling-and-Safety-Instructions-FR-2024.pdf
Frais et décompte dans SAP Transportation Management, TM130 Col18
Utilisation de la gestion des ressources dans SAP Extended Warehouse Manageme...
Pratiques des systèmes d'information ppt
Démystification des QR codes - histoire - utilisations - techniques
Projet de Fin d’Études – Plateforme FMS pour la Gestion des FCPR
SHAKA 2025 - Création d'Images en IA : Mode Expert Activé
Gestion de la main-d’œuvre dans SAP Extended Warehouse Management, EWM125 Col26
843555943-Introduction-a-l-Intelligence-Artificielle.pptx
Processus dans la gestion des transports, TM100 Col18
1.3.4-Handling-and-Safety-Instructions-FR-2024.pdf

JSS2013 : Haute disponibilité

  • 1. Les journées SQL Server 2013 Un événement organisé par GUSS #JSS2013
  • 2. Les journées SQL Server 2013 Session Haute-disponibilité Christophe LAPORTE David BARBARIN David BAFFALEUF Un événement organisé par GUSS #JSS2013
  • 3. Présentation Christophe LAPORTE David BARBARIN David BAFFALEUF ~ depuis 1997 6.5 <= SQL Server <= 2014 ~ depuis 2002 7 <= SQL Server <= 2014 ~ depuis 1999 7.0 <= SQL Server <= 2014 christophe_laporte@hotmail.fr mikedavem1@hotmail.com dbaffaleuf@capdata-osmozium.com http://conseilit.wordpress.com/ http://blog.developpez.com/mikedavem http://blog.capdata.fr @conseilit @mikedavem @dbaffaleuf #JSS2013
  • 4. Merci à nos sponsors #JSS2013
  • 5. Agenda • Des questions – – – – Pourquoi la haute disponibilité La non disponibilité Définition d’une stratégie Problèmes et limitations • Les solutions – Des plus anciennes aux plus récentes #JSS2013
  • 6. • Des questions – – – – Pourquoi la haute disponibilité La non disponibilité Définition d’une stratégie Problèmes et limitations • Les solutions – Des plus anciennes aux plus récentes #JSS2013
  • 7. Pourquoi la haute disponibilité • Définition basique – Etre capable d’accéder à une donnée lorsque l’on en a besoin dans un laps de temps acceptable ! • BD point central dans le SI – Sharepoint, sites Web de paris ou commerce en ligne – Progiciels (RH, Compta, production, CRM) – Logiciels « maison » • La non disponibilité a un coût – Chiffre d’affaire … – Coût en temps – Salaires d’employés … #JSS2013
  • 8. Mesurer la haute disponibilité #JSS2013
  • 9. Cause de non disponibilité Coupure de service planifiée • Création / Reconstruction d’index non cluster : éventuellement pas de modifications sur la table • Création / Reconstruction d’index cluster : éventuellement pas de lecture et modifications sur la table • Changement de matériel, application de Service Packs Coupure de service non planifiée • Perte du Datacenter (électricité, réseau, catastrophe naturelle, incendie) • Perte du serveur (alimentation, CPU, mémoire, réseau, OS crash) • Problème disque (corruption d’I/O, panne contrôleur disque, panne disque, panne carte RAID) Ne pas confondre PCA et PRA • HA et DR … #JSS2013
  • 10. Définition d’une stratégie Granularité RPO RTO •Chiffre d’affaire •Salaires •Datacenter -> Instance -> Groupe de bases -> Base > Table -> Traitement •Coordination des dépendances • Perte maximale de données autorisée • Durée maximale de non disponibilité autorisée Période ouvrée • 24 H / 24 , 7 J /7 • Entre 8h00 et 18h00 les jours ouvrés … En cas de panne Stratégie Quantifier l’indisponibilité • Même niveau de performance requis ? • Dégradation acceptable ? #JSS2013
  • 11. • Des questions – – – – Pourquoi la haute disponibilité La non disponibilité Définition d’une stratégie Problèmes et limitations • Les solutions – Des plus anciennes aux plus récentes #JSS2013
  • 12. Cluster de basculement SQL Terminologie • Cluster, nœud, quorum, SAN, LUN, groupe de ressources, dépendance, instance virtuelle Technologie éprouvée • Couche cluster Windows #JSS2013
  • 13. Avantages du FCI Tolérance de panne • Matérielle, logicielle Instance virtuelle • Adresse IP et Nom réseau virtuels Granularité • Instance (donc agent SQL …) #JSS2013
  • 14. Points remarquables Windows 2012 SQL 2012 Windows 2012 R2 SQL 2014 • Quorum dynamique • TempDB locale • Témoin dynamique • Data sur disque CSV #JSS2013
  • 15. Démo • Ajout d’une instance sur disque CSV #JSS2013
  • 16. Inconvénients de la solution Défaillance du système disque • SPOF Répartition de charge impossible • Un seul nœud actif à la fois Coût • Cartes, switch, fibres, SAN … Durée de recovery • Nombre de bases Granularité • Protection de niveau instance #JSS2013
  • 17. GEO Cluster • != Multi subnet failover cluster • Résolution SPOF disque • Solutions constructeur – EMC, HP, Unisys • Solutions logicielles – DoubleTake, DataKeeper (Démo à suivre) • Solutions SQL Server – Database mirroring, log shipping, réplication – Groupes de disponibilité #JSS2013
  • 18. Démo • Ajout d’un disque cluster SIOS DataKeeper #JSS2013
  • 20. L’union fait la force • Prises indépendamment elles ne présentent que peu d’avantages par rapport aux solutions ‘reines’. FCI Database Mirroring Virtualisation Log Shipping Availability Groups Réplication (?) • Mais si on les combine toutes les trois ? #JSS2013
  • 21. Exemple DBM + LS + Réplication Données ouvertes pour DSS Secours dormant Réplication Database Mirroring Log Shipping .trn .trn .trn .trn Reporting Refresh -8h contre les erreurs humaines #JSS2013
  • 22. Démo • Exemple d’une topologie combinée #JSS2013
  • 23. Intérêts de la solution Perte de la machine principale, perte du stockage local, problème OS, corruption… • On bascule sur le miroir • Qui est aussi paramétré pour reprendre le rôle d’éditeur et de source du LS Moins d’indisponibilité sur les plages de maintenance. #JSS2013
  • 24. Réplication vs réplicas readonly, avantages Volumétrie: • On n’est pas obligé de dupliquer toute la volumétrie Indexes DSS: • On peut créer des indexes custom DSS sur les bases abonnées Store & forward • Perte de la connexion avec l’abonné, la base distribution joue le rôle de tampon. Pas d’impact sur le journal de transactions primaire. Coût: • Pas besoin d’avoir toutes les instances en édition Enterprise. Scale-out • En ajoutant des abonnés, pas de limitation à 2 réplicas. Contrainte AD: • Moins d’adhérence avec un domaine #JSS2013
  • 25. Inconvénients de la solution Réactivité: • Pas de bascule automatisée (sauf avec witness) DBM et reporting? • db snapshot pas très pratique quand même Complexité • Plusieurs systèmes à maintenir au lieu d’un seul. Point d’entrée unique: • Pas de détection d’intention pour la lecture seule (ApplicationIntent) Conflits en mise à jour: • L’abonné est ouvert en lecture /écriture donc pas de garde-fou contre le conflit en mise à jour. Paramétrage manuel : • La bascule est transparente pour la réplication, mais pas pour le log shipping (paramétrage manuel). #JSS2013
  • 26. SQL Server AlwaysOn Terminologie • Groupe de disponibilités, réplicas, cluster, nœud, quorum, stockage asymétrique, réplication synchrone et asynchrone Technologie éprouvée • Couche cluster Windows, mirroring ++ #JSS2013
  • 27. Avantages des groupes de disponibilité Tolérance de panne • Matérielle, logicielle, corruption physique des données Connexion unique via point d’accès client (listener) • Adresse IP et Nom réseau virtuel Granularité • Groupe de base de données #JSS2013
  • 28. Avantages des groupes de disponibilité Rentabilisation des serveurs secondaires standby • Répartition de charge avec utilisation en lecture seule en temps réel, sauvegardes Stockage • Indépendance vis-à-vis d’un stockage partagé, • Stockage asymétrique avec disaster recovery sur site distant Complexité • Une seule fonctionnalité pour gérer la haute disponibilité et les situations de désastre #JSS2013
  • 29. Points remarquables Windows 2012 SQL 2012 Windows 2012 R2 SQL 2014 • Quorum dynamique • 4 réplicas secondaires • Quorum amélioré (témoin dynamique, résilience du quorum, arbitrage des votes) • Support CSV • Déploiement de cluster sans dépendance d’objets dans l’active directory • 8 réplicas secondaires + plus forte intégration avec Azure + support Hekaton #JSS2013
  • 31. Démo • Exemple d’une topologie AlwaysOn avec Windows Server 2012 et SQL14 #JSS2013
  • 32. Inconvénients de la solution Coût • Nécessite une édition Enterprise de SQL Server 2012 avec licence par cœur logique • Chaque serveur secondaire actif (backup ou lecture seule) doit être licencié Limite du nombre de réplicas synchrones • Limite à 3 réplicas Lecture / écriture sur un seul point d’entrée • Pas de possibilité d’avoir plusieurs réplicas primaires en même temps Répartition de charge en lecture seule impossible via les listeners • L’algorithme de redirection des connexions en intention de lecture seule sont toujours redirigés vers le même réplica Paramétrage • Certains paramétrages s’effectuent depuis la GUI alors que d’autres ne sont disponibles que par T-SQL ou PowerShell Monitoring • Pas forcément évident en utilisant les divers axes de troubleshooting en natif avec SQL Server • Pas de solution réelle de monitoring fournie en natif #JSS2013
  • 33. Virtualisation Flexibilité • Live storage migration • Live migration • MàJ hyperviseur • Mémoire dynamique • Redimensionnement VHDX HA • Live migration • Storage live migration • Host cluster • Guest cluster • Peu ou pas de coupure de service • Scénario supporté (KB956893) DR • Hyper-V replica (30 secs, 5 mins, 15 mins)) • Attention compatibilité avec autres solutions #JSS2013
  • 34. Virtualisation Exploitation • Rapidité déploiement • Export et clonage de VM à chaud • Cluster Aware Updating Performance • • • • • Quasi similaire (6% – 7%) VHDX secteurs 4KB, max 64 TB Storage tiering Storage QoS Offloaded Data Transfer (ODX) #JSS2013
  • 35. Demo – Shared VHDX • Si le temps le permet … #JSS2013
  • 36. Questions / Réponses Merci à tous pour votre présence. #JSS2013
  • 38. Rappels : haute disponibilité • Définition basique – Etre capable d’accéder à une donnée lorsque l’on en a besoin dans un laps de temps acceptable ! • BD point central dans le SI – Sharepoint, sites Web de paris ou commerce en ligne – Progiciels (RH, Compta, production, CRM) – Logiciels « maison » • La non disponibilité a un coût – Chiffre d’affaire … – Salaires d’employés … #JSS2013
  • 39. Définition d’une stratégie Granularité RPO RTO •Chiffre d’affaire •Salaires •Datacenter -> Instance -> Groupe de bases -> Base -> Table -> Traitement •Coordination des dépendances • Perte maximale de données autorisée • Durée maximale de non disponibilité autorisée Période ouvrée • 24 H / 24 , 7 J /7 • Entre 8h00 et 18h00 les jours ouvrés … En cas de panne Stratégie Quantifier l’indisponibilité • Même niveau de performance requis ? • Dégradation acceptable ? #JSS2013
  • 40. Mesurer la disponibilité • Les « neufs » #JSS2013
  • 41. Des fonctionnalités Table Database Infrastructure Online index Operations Fast Recovery Instant File Initialization Online LOB index Operations Partial Database Availability Auto page repair Table Partitioning Online piecemeal restore Hot-add CPU / Memory Database Snapshot Resource Governor #JSS2013
  • 42. Des solutions connues • • • • • • Log Shipping Failover Cluster Database Mirroring Réplication Windows Azure SQL Databases / Federation Virtualisation – On Premise (Hyper-V) – Off Premise (Windows Azure) #JSS2013

Notes de l'éditeur

  • #34: Monitoring :SCCM 2012 propose un feature pack pour AlwaysOnSQLSentry V7.5…
  • #40: RP
  • #41: RP Read-only and deferred operations. During a maintenance window, or during a phased disaster recovery, data retrieval is still possible, but new workflows and background processing may be temporarily halted or queued.  Data latency and application responsiveness. Due to a heavy workload, a processing backlog, or a partial platform failure, limited hardware resources may be over-committed or under-sized. User experience may suffer, but work may still get done in a less productive manner.  Partial, transient, or impending failures. Robustness in the application logic or hardware stack that retries or self-corrects upon encountering an error. These types of issues may appear to the end user as data latency or poor application responsiveness.  Partial end-to-end failure. Planned or unplanned outages may occur gracefully within vertical layers of the solution stack (infrastructure, platform, and application), or horizontally between different functional components. Users may experience partial success or degradation, depending upon the features or components that are affected.
  • #42: RP
  • #43: CLou RP ???
  • #44: CL