SlideShare una empresa de Scribd logo
Diagnóstico y Resolución de problemas en Database
Mirroring y evolución a AlwaysON
400
REL40007
@enriquecatala Enrique Catala Bañuls
Mentor ecatala@solidq.com
MVP - MCT – MAP – Technical
Ranger
Rubén Garrigós
Mentor rgarrigos@solidq.com
MCT – MCAD – MCSD – MCITP
EN CUMPLIMIENTO CON LA LEY 15/1999 DE PROTECCION DE DATOS DE
CARÁCTER PERSONAL, PONEMOS EN TU CONOCIMIENTO QUE
ESTA SESIÓN VA A SER GRABADA
POR SOLIDQ Y QUE ESTA GRABACIÓN PODRÍA SER UTILIZADA COMO MATERIAL
DE MARKETING Y HACERSE PUBLICA A TRAVÉS DE DIVERSOS MEDIOS, COMO
POR EJEMPLO NUESTRA PAGINA WEB.
TENIENDO EN CUENTA QUE TU IMAGEN PUEDE APARECER EN ESA GRABACIÓN,
SI NO DESEAS APARECER, ROGAMOS NOS LO COMUNIQUES POR LOS MEDIOS
QUE YA CONOCES.
COMUNICADO
2
Agenda
3
1. Monitorización de DB Mirroring
2. Operaciones inválidas en el log
3. Monitorización AlwaysOn
4. Chequeo de estado AlwaysOn
5. Buenas practicas
6. Bloqueos en réplicas de solo lectura
Monitorización de DB Mirroring
4
Eventos SQL Server del 1400 al 1500
1480  Cambio de rol en mirroring
1440  Activo como principal
1441  Activo como secundario
1442  Mirror inactivo
1443  Mirror finalizado
1432  Reparación de página en curso
1461  Reparación de página con éxito
1481  Reparación de página fallida
Monitorización de DB Mirroring
5
Eventos de SQL Server configurables (warnings)
Eventos 32042, 32043, 32040 y 32044 respectivamente
Monitorización de DB Mirroring
6
Contadores básicos de rendimiento de DB Mirroring
– Log Harden Time (ms)
– Redo Queue KB
– Send/Receive Ack Time
– Log Send Queue KB
– Transaction Delay
Baseline
Límites variables
– WAN/LAN
– Físico vs Virtual
– Mirror para HA o para DR
– Mirror dedicado o compartido
Monitorización de DB Mirroring
7
Eventos WMI DATABASE_MIRRORING_STATE_CHANGE
Alertas con lógica y que reaccionen a ciertos eventos
– Reintentar volver a poner en marcha la sesión si se ha suspendido
– Destruir el mirror si estamos casi sin espacio en el log del principal
Monitorización de DB Mirroring
Threads
8
Revisar que no agotamos los workers de SQL Server
Threads en una sesión de database mirroring
– Principal
• 1 thread global y 2 treads por cada BBDD en mirror
– Secundario
• 1 thread global y 2 threads por base de datos
• EE  +1 thread redo por cada 4 cores
Es en los thread redo donde podemos encontrarnos
con una operación inválida en el secundario
Podemos diagnosticarlos en base al cambio de estado
a SUSPENDED en el principal y secundario
Monitorización de DB Mirroring
Escenarios N a 1
9
Más apropiado para DR que para HA
Problemas por collations distintos
Colisiones de logins, de bbdd, jobs…
N a 1  N a M instancias/virtuales
No subestimar
– Tener en cuenta la IO agregada
– Capacidad de CPU para hacer los
REDO
Peor escenario
– El secundario común convertido en
principal común de todos
Secundario
común
N principales
Operaciones inválidas log
10
Cuando una operación es introducida en el log, se
transmite de forma “ciega” al secundario
– Independiente de que la réplica sea síncrona o asíncrona
– Lo único que podemos garantizar es que se ha escrito en el
log del secundario pero el redo se hace siempre de forma
asíncrona
– La situación puede ser difícil de solucionar una vez ha ocurrido
el error
Añade o modifica un fichero de la base de datos
– En una ruta que no existe en el secundario
– En un disco que no existe en el secundario
– En un disco con capacidad insuficiente en el secundario
DEMO
11
Operaciones inválidas en el
log
Agenda
12
1. Monitorización de DB Mirroring
2. Operaciones inválidas en el log
3. Monitorización AlwaysOn
4. Chequeo de estado AlwaysOn
5. Buenas practicas
6. Bloqueos en réplicas de solo lectura
Hotfix AlwaysOn
No imperativos pero recomendables
13
KB 2654347 para .NET 3.5 SP1
– ApplicationIntent
– Enrutamiento de solo lectura
– MultiSubnetFailover
KB 2544514 para .net 4 (4.0.2)
Para Windows Server 2008 y 2008 R2
– Son unos cuantos (Windows update!)
2494036, 2616514, 2531907, 2687741, 976097, 980915,
2578103, 2578113
Monitorizacion Alwayson
Modelo de evaluación de estado de salud
14
Se ha potenciado el modelo de evaluación de
estado de salud en dos pilares:
– Políticas de administración declarativa
– Powershell
Monitorizacion AlwaysOn
Modelo de evaluación de estado de salud: Políticas
15
Availability Group State
Availability Replica
Database Replica State
Server
– IsHadrEnabled
– ClusterQuorumState
– HadrManagerStatus
– ClusterQuorumType
Nunca olvides asignar una categoría AlwaysOn
Monitorizacion Alwayson
Modelo de evaluación de estado de salud: Políticas
16
Algoritmo de evaluación
Start
Ejecutar políticas
definidas AlwaysOn
Alguna política en
error?
Marcar categoria
como Warning
NO
Marcar categoria
como Error
YES
End
Reportar categoria
como saludable
¿Alguna política en
Warning?
YES
NO
Se obtienen condiciones AlwaysOn
Monitorizacion Alwayson
Modelo de evaluación de estado de salud
17
¿Dónde creéis que se evalúa el estado?
– ¿En la réplica principal?
– ¿En cualquier secundaria?
– ¿En todas por igual?
Monitorizacion Alwayson
Modelo de evaluación de estado de salud
18
Monitorizacion Alwayson
Modelo de evaluación de estado de salud
19
Availability group errors (any replica)
Availability group warnings (any replica)
Availability group errors (primary)
Availability group warnings (primary)
Availability replica errors (any replica)
Availability replica warnings (any replica)
Availability database errors (any replica)
Availability database warnings (any replica)
Monitorización
Modelo de evaluación de estado de salud: PowerShell
20
Necesario módulo SQLPS
Todo automatizado en 3 cmdlets:
– Test-SqlAvailabilityGroup
– Test-SqlAvailabilityReplica
– Test-SqlDatabaseReplicaState
Flag –AllowUserPolicies importante
Monitorizacion Alwayson
Modelo de evaluación de estado de salud: PowerShell equivalencia
21
Test-SqlAvailabilityGroup
Test-SqlAvailabilityReplica
Test-SqlDatabaseReplicaState
DEMO
22
Previniendo problemas con
DMF, PowerShell y alertas
Chequeo estado AlwaysOn
Detección de Failover AlwaysOn
23
Frecuencia de chequeo configurable
– Propiedad HealthCheckTimeout
• En milisegundos
• Por defecto 60000
ALTER SERVER CONFIGURATION SET FAILOVER
CLUSTER PROPERTY HealthCheckTimeout = ###;
Chequeo estado AlwaysOn
Detección de Failover AlwaysOn
24
Resource DLL ahora llama
sp_server_diagnostics
– 3 ejecuciones por cada HealthCheckTimeout
– Fallos de conexión o devolución datos causarán
Failover
– Conexión dedicada para evaluación
sp_server_diagnostics configurable
– Siguiente slide
Chequeo estado AlwaysOn
Detección de Failover AlwaysON
25
ALTER SERVER CONFIGURATION SET FAILOVER
CLUSTER PROPERTY FailureConditionLevel = #;
Level Condition Failover or Restart Conditions
0 No automatic failover or restart No automatic failover or restart
ever
1 Failover or restart on server down SQL Server service is down
2 Failover or restart on server unresponsive SQL Server instance is not
responsive
3 Failover or restart on critical server errors
(default)
sp_server_diagnostics returns
“system error”
4 Failover or restart on moderate server
errors
sp_server_diagnostics returns
“resource error”
5 Failover or restart on any qualified failure
condition
sp_server_diagnostics returns
“query_processing error”
Monitorización AlwaysOn
Buenas prácticas
26
1. Despliega políticas en todos los servidores
2. Crea al menos un job de evaluación
PowerShell que te envíe correos
3. Crea alertas que te envíen correos
1. Detecta cambios de estado y avísate
2. Detecta situaciones anómalas de rendimiento
y avísate
Bloqueos en réplicas de solo lectura
27
Afecta solo a las réplicas secundarias en solo lectura
Threads en los grupos de disponibilidad
– Distinta aproximación a la de Database Mirroring
– Request queue y worker pool compartido por todas las bbdd de la
instancia
– Se reduce la cantidad media de threads  depende de la carga
– Tamaño del pool > bases de datos activas * 2 < bases de datos
activas * 5 < (max worker thread – 40)
– Los backups y filestream generan threads adicionales
select * from sys.dm_exec_requests where command
like '%HADR%' or command like '%DB%' or command
like '%BRKR%'
Bloqueos en réplicas de solo lectura
28
Cuando una replica está marcada como solo lectura
– Pequeña sobrecarga de 14 bytes para el puntero a las
versiones
– Similar a habilitar Snapshot Isolation/RCSI pero sin el row
versioning en origen
– El row versioning se genera en el secundario en tempdb
El bloqueo del thread de redo ocurre al intentar
obtener un bloqueo de modificación de esquema
(SCH-M) que queda bloqueado por un bloqueo de
estabilidad de esquema (SCH-S)
– En un futuro se podrá configurar el matar la query (log
shipping style)
Bloqueos en réplicas de solo lectura
29
Para su detección
– sys.dm_exec_requests
– Evento de proceso bloqueado en profiler
– Evento extendido log_redo_blocked
– Contador de rendimiento Recovery Queue
Prevención
– Reducir la duración de las consultas
– Planificar las operaciones DDL en ventana de mantenimiento
– Usar tablas temporales
Reacción
– Job que mate las queries que bloquean
DEMO
30
Bloqueos en réplicas de
solo lectura
¿Preguntas?
31
¡Gracias!
Siéntate a comer con nosotros o tómate un café y aclara tus
dudas 
@enriquecatala
Mentor
Enrique Catala Bañuls
Mentor
Rubén Garrigós
32
Si quieres disfrutar de las mejores sesiones de
nuestros mentores de España y Latino América,
ésta es tu oportunidad.
http://summit.solidq.com/madrid/
Síguenos:
33

Más contenido relacionado

PDF
UYOUG 2010 - RMAN sin misterios
PDF
Dba PostgreSQL desde básico a avanzado parte2
PPTX
Diagnostico y resolución de problemas en sql server
PDF
Cluster con postgresql
PDF
Cuellos botella en PostgreSQL
PDF
Monit optim iis6_2
PDF
Alternativas de alta disponiblidad en MySQL - MySQL Meetup - Montevideo - Mar...
DOCX
Instalación y Configuración de Pentaho BI y MySQL
UYOUG 2010 - RMAN sin misterios
Dba PostgreSQL desde básico a avanzado parte2
Diagnostico y resolución de problemas en sql server
Cluster con postgresql
Cuellos botella en PostgreSQL
Monit optim iis6_2
Alternativas de alta disponiblidad en MySQL - MySQL Meetup - Montevideo - Mar...
Instalación y Configuración de Pentaho BI y MySQL

La actualidad más candente (20)

PDF
Replicacion Postgresql
PDF
Alta disponibilidad con MySQL
PPTX
Pentaho BI
PDF
Alta Disponibilidad con PostgreSQL
PDF
PPTX
Analizando la performance del subsistema de IO
PPTX
Consideraciones de hardware para SQL Server
PPTX
Clúster de alta Disponibilidad
PDF
Admon PG 1
PDF
Monitorizando y optimizando problemas de paralelismo en SQL Server | SolidQ S...
PDF
Alta disponibilidad con Pacemaker
PDF
OOW LatinAmerica 2011 - RMAN sin misterios
PDF
JIAP2011 - Oracle 11gR2 sin sorpresas
PDF
Migrando de MSSQL a PostgreSQL
DOC
Replicacion con postgresql y slony
PDF
Práctica 3 FTP
PDF
Curso de PostgreSQL
PDF
Es TEMPDB, por qué es tan importante?
PPTX
24 HOP edición Español - Durabilidad diferida de transacciones y mejoras en g...
PPTX
03 24 hopes_2014_eladiorincon
Replicacion Postgresql
Alta disponibilidad con MySQL
Pentaho BI
Alta Disponibilidad con PostgreSQL
Analizando la performance del subsistema de IO
Consideraciones de hardware para SQL Server
Clúster de alta Disponibilidad
Admon PG 1
Monitorizando y optimizando problemas de paralelismo en SQL Server | SolidQ S...
Alta disponibilidad con Pacemaker
OOW LatinAmerica 2011 - RMAN sin misterios
JIAP2011 - Oracle 11gR2 sin sorpresas
Migrando de MSSQL a PostgreSQL
Replicacion con postgresql y slony
Práctica 3 FTP
Curso de PostgreSQL
Es TEMPDB, por qué es tan importante?
24 HOP edición Español - Durabilidad diferida de transacciones y mejoras en g...
03 24 hopes_2014_eladiorincon
Publicidad

Similar a Diagnóstico y resolución problemas mirroring AlwaysOn (20)

PPTX
Optimización de motores sql server 24 horas SQL Pass
PDF
Guias y recomendaciones para instalar y configurar clusters de sql server
PPTX
24 HOP edición Español - Optimizacion de motores sql server desde el codigo h...
PDF
Guia de estudio_oracle 11 g
PDF
Guia de-estudio-oracle-11-g-pdf
PDF
Cosas que “probablemente” no sabes pero deberías de saber en Oracle 12c
PDF
Transformación Digital: Sistemas de Misión Crítica, SAP, Zero Downtime y High...
PDF
Software Open Source – Open Day Oracle 2013
PDF
Software Líbre con respaldo de Oracle ~ OTN Tour 2013
PDF
MySQL Team – Open Day Oracle 2013
PDF
Omega peripherals virtualización de entornos críticos
PPTX
AlwaysON Lecciones Aprendidas
PPTX
Charla técnica comercial v3.0 junio 2014 db visit productos
PPTX
Monitoreo de Base de Datos en Azure
PDF
Actividad No. 1.14: Replicación de datos en MySQL 5.1
PDF
Carbura tusql sesion1_slideshare
PPTX
Taller de Base de datos - Unidad 1 SGBD introduccion
PPTX
Db2 10 afinamiento
PPTX
Recuperación de desastres y soluciones de alta disponibilidad con SQL Server
PDF
Curso sql server_administracion
Optimización de motores sql server 24 horas SQL Pass
Guias y recomendaciones para instalar y configurar clusters de sql server
24 HOP edición Español - Optimizacion de motores sql server desde el codigo h...
Guia de estudio_oracle 11 g
Guia de-estudio-oracle-11-g-pdf
Cosas que “probablemente” no sabes pero deberías de saber en Oracle 12c
Transformación Digital: Sistemas de Misión Crítica, SAP, Zero Downtime y High...
Software Open Source – Open Day Oracle 2013
Software Líbre con respaldo de Oracle ~ OTN Tour 2013
MySQL Team – Open Day Oracle 2013
Omega peripherals virtualización de entornos críticos
AlwaysON Lecciones Aprendidas
Charla técnica comercial v3.0 junio 2014 db visit productos
Monitoreo de Base de Datos en Azure
Actividad No. 1.14: Replicación de datos en MySQL 5.1
Carbura tusql sesion1_slideshare
Taller de Base de datos - Unidad 1 SGBD introduccion
Db2 10 afinamiento
Recuperación de desastres y soluciones de alta disponibilidad con SQL Server
Curso sql server_administracion
Publicidad

Más de Enrique Catala Bañuls (20)

PDF
Sql server ha muerto, larga vida a sql server
PDF
Capas de acceso a datos .net escalables de verdad contra SQL Server
PDF
Paralelismo en SQL Server
PDF
Aplicando R al análisis de rendimiento de un servidor
PDF
Técnicas avanzadas para resolver tus problemas de sql server
PDF
Capas de acceso a datos .NET escalables de verdad: el batido perfecto para el...
PDF
Planes de ejecución 3.0 sql 2016 y v next
PDF
Paralelismo en sql server
PDF
Aplicando R al análisis de rendimiento de un servidor
PDF
PDF
Planes de ejecucion 2016
PDF
Sql server 2016 novedades para desarrolladores
PDF
Dawarehouse como servicio en azure (sqldw)
PDF
PDF
Planes de ejecucion 2
PDF
Planes de ejecucion 1
PDF
Migración a sql server 2016
PDF
Datawarehouse como servicio en azure (sqldw)
PDF
Como hacer tuning a capas de acceso a datos en .NET (dotNetConference2016)
PPTX
Como leer planes de ejecución - edición 2015
Sql server ha muerto, larga vida a sql server
Capas de acceso a datos .net escalables de verdad contra SQL Server
Paralelismo en SQL Server
Aplicando R al análisis de rendimiento de un servidor
Técnicas avanzadas para resolver tus problemas de sql server
Capas de acceso a datos .NET escalables de verdad: el batido perfecto para el...
Planes de ejecución 3.0 sql 2016 y v next
Paralelismo en sql server
Aplicando R al análisis de rendimiento de un servidor
Planes de ejecucion 2016
Sql server 2016 novedades para desarrolladores
Dawarehouse como servicio en azure (sqldw)
Planes de ejecucion 2
Planes de ejecucion 1
Migración a sql server 2016
Datawarehouse como servicio en azure (sqldw)
Como hacer tuning a capas de acceso a datos en .NET (dotNetConference2016)
Como leer planes de ejecución - edición 2015

Último (20)

PDF
CyberOps Associate - Cisco Networking Academy
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
PPTX
Presentación de Redes de Datos modelo osi
PDF
Influencia-del-uso-de-redes-sociales.pdf
PDF
Plantilla para Diseño de Narrativas Transmedia.pdf
PPTX
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PPTX
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PDF
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
PDF
Liceo departamental MICRO BIT (1) 2.pdfbbbnn
PDF
Diapositiva proyecto de vida, materia catedra
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PPTX
Propuesta BKP servidores con Acronis1.pptx
PDF
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...
PPTX
REDES INFORMATICAS REDES INFORMATICAS.pptx
PDF
Estrategia de apoyo tecnología miguel angel solis
PDF
Calidad desde el Docente y la mejora continua .pdf
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
CyberOps Associate - Cisco Networking Academy
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
Presentación de Redes de Datos modelo osi
Influencia-del-uso-de-redes-sociales.pdf
Plantilla para Diseño de Narrativas Transmedia.pdf
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
Power Point Nicolás Carrasco (disertación Roblox).pptx
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
Liceo departamental MICRO BIT (1) 2.pdfbbbnn
Diapositiva proyecto de vida, materia catedra
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
Propuesta BKP servidores con Acronis1.pptx
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...
REDES INFORMATICAS REDES INFORMATICAS.pptx
Estrategia de apoyo tecnología miguel angel solis
Calidad desde el Docente y la mejora continua .pdf
historia_web de la creacion de un navegador_presentacion.pptx

Diagnóstico y resolución problemas mirroring AlwaysOn

  • 1. Diagnóstico y Resolución de problemas en Database Mirroring y evolución a AlwaysON 400 REL40007 @enriquecatala Enrique Catala Bañuls Mentor ecatala@solidq.com MVP - MCT – MAP – Technical Ranger Rubén Garrigós Mentor rgarrigos@solidq.com MCT – MCAD – MCSD – MCITP
  • 2. EN CUMPLIMIENTO CON LA LEY 15/1999 DE PROTECCION DE DATOS DE CARÁCTER PERSONAL, PONEMOS EN TU CONOCIMIENTO QUE ESTA SESIÓN VA A SER GRABADA POR SOLIDQ Y QUE ESTA GRABACIÓN PODRÍA SER UTILIZADA COMO MATERIAL DE MARKETING Y HACERSE PUBLICA A TRAVÉS DE DIVERSOS MEDIOS, COMO POR EJEMPLO NUESTRA PAGINA WEB. TENIENDO EN CUENTA QUE TU IMAGEN PUEDE APARECER EN ESA GRABACIÓN, SI NO DESEAS APARECER, ROGAMOS NOS LO COMUNIQUES POR LOS MEDIOS QUE YA CONOCES. COMUNICADO 2
  • 3. Agenda 3 1. Monitorización de DB Mirroring 2. Operaciones inválidas en el log 3. Monitorización AlwaysOn 4. Chequeo de estado AlwaysOn 5. Buenas practicas 6. Bloqueos en réplicas de solo lectura
  • 4. Monitorización de DB Mirroring 4 Eventos SQL Server del 1400 al 1500 1480  Cambio de rol en mirroring 1440  Activo como principal 1441  Activo como secundario 1442  Mirror inactivo 1443  Mirror finalizado 1432  Reparación de página en curso 1461  Reparación de página con éxito 1481  Reparación de página fallida
  • 5. Monitorización de DB Mirroring 5 Eventos de SQL Server configurables (warnings) Eventos 32042, 32043, 32040 y 32044 respectivamente
  • 6. Monitorización de DB Mirroring 6 Contadores básicos de rendimiento de DB Mirroring – Log Harden Time (ms) – Redo Queue KB – Send/Receive Ack Time – Log Send Queue KB – Transaction Delay Baseline Límites variables – WAN/LAN – Físico vs Virtual – Mirror para HA o para DR – Mirror dedicado o compartido
  • 7. Monitorización de DB Mirroring 7 Eventos WMI DATABASE_MIRRORING_STATE_CHANGE Alertas con lógica y que reaccionen a ciertos eventos – Reintentar volver a poner en marcha la sesión si se ha suspendido – Destruir el mirror si estamos casi sin espacio en el log del principal
  • 8. Monitorización de DB Mirroring Threads 8 Revisar que no agotamos los workers de SQL Server Threads en una sesión de database mirroring – Principal • 1 thread global y 2 treads por cada BBDD en mirror – Secundario • 1 thread global y 2 threads por base de datos • EE  +1 thread redo por cada 4 cores Es en los thread redo donde podemos encontrarnos con una operación inválida en el secundario Podemos diagnosticarlos en base al cambio de estado a SUSPENDED en el principal y secundario
  • 9. Monitorización de DB Mirroring Escenarios N a 1 9 Más apropiado para DR que para HA Problemas por collations distintos Colisiones de logins, de bbdd, jobs… N a 1  N a M instancias/virtuales No subestimar – Tener en cuenta la IO agregada – Capacidad de CPU para hacer los REDO Peor escenario – El secundario común convertido en principal común de todos Secundario común N principales
  • 10. Operaciones inválidas log 10 Cuando una operación es introducida en el log, se transmite de forma “ciega” al secundario – Independiente de que la réplica sea síncrona o asíncrona – Lo único que podemos garantizar es que se ha escrito en el log del secundario pero el redo se hace siempre de forma asíncrona – La situación puede ser difícil de solucionar una vez ha ocurrido el error Añade o modifica un fichero de la base de datos – En una ruta que no existe en el secundario – En un disco que no existe en el secundario – En un disco con capacidad insuficiente en el secundario
  • 12. Agenda 12 1. Monitorización de DB Mirroring 2. Operaciones inválidas en el log 3. Monitorización AlwaysOn 4. Chequeo de estado AlwaysOn 5. Buenas practicas 6. Bloqueos en réplicas de solo lectura
  • 13. Hotfix AlwaysOn No imperativos pero recomendables 13 KB 2654347 para .NET 3.5 SP1 – ApplicationIntent – Enrutamiento de solo lectura – MultiSubnetFailover KB 2544514 para .net 4 (4.0.2) Para Windows Server 2008 y 2008 R2 – Son unos cuantos (Windows update!) 2494036, 2616514, 2531907, 2687741, 976097, 980915, 2578103, 2578113
  • 14. Monitorizacion Alwayson Modelo de evaluación de estado de salud 14 Se ha potenciado el modelo de evaluación de estado de salud en dos pilares: – Políticas de administración declarativa – Powershell
  • 15. Monitorizacion AlwaysOn Modelo de evaluación de estado de salud: Políticas 15 Availability Group State Availability Replica Database Replica State Server – IsHadrEnabled – ClusterQuorumState – HadrManagerStatus – ClusterQuorumType Nunca olvides asignar una categoría AlwaysOn
  • 16. Monitorizacion Alwayson Modelo de evaluación de estado de salud: Políticas 16 Algoritmo de evaluación Start Ejecutar políticas definidas AlwaysOn Alguna política en error? Marcar categoria como Warning NO Marcar categoria como Error YES End Reportar categoria como saludable ¿Alguna política en Warning? YES NO Se obtienen condiciones AlwaysOn
  • 17. Monitorizacion Alwayson Modelo de evaluación de estado de salud 17 ¿Dónde creéis que se evalúa el estado? – ¿En la réplica principal? – ¿En cualquier secundaria? – ¿En todas por igual?
  • 18. Monitorizacion Alwayson Modelo de evaluación de estado de salud 18
  • 19. Monitorizacion Alwayson Modelo de evaluación de estado de salud 19 Availability group errors (any replica) Availability group warnings (any replica) Availability group errors (primary) Availability group warnings (primary) Availability replica errors (any replica) Availability replica warnings (any replica) Availability database errors (any replica) Availability database warnings (any replica)
  • 20. Monitorización Modelo de evaluación de estado de salud: PowerShell 20 Necesario módulo SQLPS Todo automatizado en 3 cmdlets: – Test-SqlAvailabilityGroup – Test-SqlAvailabilityReplica – Test-SqlDatabaseReplicaState Flag –AllowUserPolicies importante
  • 21. Monitorizacion Alwayson Modelo de evaluación de estado de salud: PowerShell equivalencia 21 Test-SqlAvailabilityGroup Test-SqlAvailabilityReplica Test-SqlDatabaseReplicaState
  • 23. Chequeo estado AlwaysOn Detección de Failover AlwaysOn 23 Frecuencia de chequeo configurable – Propiedad HealthCheckTimeout • En milisegundos • Por defecto 60000 ALTER SERVER CONFIGURATION SET FAILOVER CLUSTER PROPERTY HealthCheckTimeout = ###;
  • 24. Chequeo estado AlwaysOn Detección de Failover AlwaysOn 24 Resource DLL ahora llama sp_server_diagnostics – 3 ejecuciones por cada HealthCheckTimeout – Fallos de conexión o devolución datos causarán Failover – Conexión dedicada para evaluación sp_server_diagnostics configurable – Siguiente slide
  • 25. Chequeo estado AlwaysOn Detección de Failover AlwaysON 25 ALTER SERVER CONFIGURATION SET FAILOVER CLUSTER PROPERTY FailureConditionLevel = #; Level Condition Failover or Restart Conditions 0 No automatic failover or restart No automatic failover or restart ever 1 Failover or restart on server down SQL Server service is down 2 Failover or restart on server unresponsive SQL Server instance is not responsive 3 Failover or restart on critical server errors (default) sp_server_diagnostics returns “system error” 4 Failover or restart on moderate server errors sp_server_diagnostics returns “resource error” 5 Failover or restart on any qualified failure condition sp_server_diagnostics returns “query_processing error”
  • 26. Monitorización AlwaysOn Buenas prácticas 26 1. Despliega políticas en todos los servidores 2. Crea al menos un job de evaluación PowerShell que te envíe correos 3. Crea alertas que te envíen correos 1. Detecta cambios de estado y avísate 2. Detecta situaciones anómalas de rendimiento y avísate
  • 27. Bloqueos en réplicas de solo lectura 27 Afecta solo a las réplicas secundarias en solo lectura Threads en los grupos de disponibilidad – Distinta aproximación a la de Database Mirroring – Request queue y worker pool compartido por todas las bbdd de la instancia – Se reduce la cantidad media de threads  depende de la carga – Tamaño del pool > bases de datos activas * 2 < bases de datos activas * 5 < (max worker thread – 40) – Los backups y filestream generan threads adicionales select * from sys.dm_exec_requests where command like '%HADR%' or command like '%DB%' or command like '%BRKR%'
  • 28. Bloqueos en réplicas de solo lectura 28 Cuando una replica está marcada como solo lectura – Pequeña sobrecarga de 14 bytes para el puntero a las versiones – Similar a habilitar Snapshot Isolation/RCSI pero sin el row versioning en origen – El row versioning se genera en el secundario en tempdb El bloqueo del thread de redo ocurre al intentar obtener un bloqueo de modificación de esquema (SCH-M) que queda bloqueado por un bloqueo de estabilidad de esquema (SCH-S) – En un futuro se podrá configurar el matar la query (log shipping style)
  • 29. Bloqueos en réplicas de solo lectura 29 Para su detección – sys.dm_exec_requests – Evento de proceso bloqueado en profiler – Evento extendido log_redo_blocked – Contador de rendimiento Recovery Queue Prevención – Reducir la duración de las consultas – Planificar las operaciones DDL en ventana de mantenimiento – Usar tablas temporales Reacción – Job que mate las queries que bloquean
  • 30. DEMO 30 Bloqueos en réplicas de solo lectura
  • 32. ¡Gracias! Siéntate a comer con nosotros o tómate un café y aclara tus dudas  @enriquecatala Mentor Enrique Catala Bañuls Mentor Rubén Garrigós 32
  • 33. Si quieres disfrutar de las mejores sesiones de nuestros mentores de España y Latino América, ésta es tu oportunidad. http://summit.solidq.com/madrid/ Síguenos: 33