Introducción a la Filogenia
Molecular
Dr. Juan Pablo Cárdenas Astudillo
Data Scientist, μBiome
Genoma
Célula
Genes
Los genes contienen
instrucciones para
sintetizar RNA y
proteínas
Proteínas
las proteínas actúan
solas o en complejos
para realizar las
funciones celulares
Cromosomas
Charles Darwin (1859)
http://en.wikipedia.org/wiki/Evolution_of_the_horse
Clase: Introducción a la Filogenia 2016
¿Qué nos puede decir este alineamiento sobre la
relación evolutiva entre estas secuencias?
http://en.wikipedia.org/wiki/Multiple_sequence_alignment
Filogenia Molecular
Estudio de la historia evolutiva de los seres vivos
(o sus genes y proteínas), realizado a partir de
sus secuencias.
Principal supuesto
En estudios filogenético-moleculares, se asume
que las secuencias a comparar son homólogas.
Homología
https://www.reddit.com/r/besteurope/comments/3knxne/
Cada posición reflejaría la variación de un
residuo desde un ancestro común
http://en.wikipedia.org/wiki/Multiple_sequence_alignment
Con raíz Sin raíz
Representación de un árbol
Nodo
Clado
Taxones
Rama
“Outgroup”
(Grupo externo)
Relaciones filogenéticas: Ortología y Paralogía
Ortólogos: generados por la
transferencia vertical,
producida por la
especiación
Parálogos: generados por
duplicaciones dentro de una
especie dada
Baldauf SL, Trends Genet. 2003, 19(6):345-351
Relaciones filogenéticas: “Xenología”(HGT)
Transferencia de genes
entre diversos puntos
(no directamente
relacionados) del árbol
de la vida
Brown JR, Nat Rev Genet. 2003, 4(2):121-32
Clase: Introducción a la Filogenia 2016
Cladograma Filograma Cladograma inclinado
Representaciones filogenéticas
Árbol circular Árbol sin raíz
Representaciones filogenéticas
¿Cómo se construye un árbol filogenético?
Selección
de
secuencias
Elaboración y
curación de un
alineamiento múltiple
Aplicación de
métodos y
modelos
evolutivos
Evaluación de la robustez
de los clados
Representación e
interpretación
¿Cómo se construye un árbol filogenético?
Selección
de
secuencias
Elaboración y
curación de un
alineamiento múltiple
Aplicación de
métodos y
modelos
evolutivos
Evaluación de la robustez
de los clados
Representación e
interpretación
Seleccionando secuencias
• ¿Qué se desea hacer? ¿Cuál es el enfoque
evolutivo?
• Proteínas
– Si se necesita evaluar evolución familias por función
– Filogenia genómica (sets concatenados de genes
conservados y/o proteínas ribosomales)
• DNA
– Evolución de regiones altamente variables (por ej: D-
loop mitocondrial, región espaciadora entre genes de
rRNA)
– Marcadores para evolución de organismos (por ej:
rRNA 16S / 18S
Recopilando secuencias
Una aproximación secuencia/especie: el árbol de la
vida
Woese & Fox, Proc Natl Acad Sci U S A. 1977;74(11):5088-5090
Woese et al., Proc Natl Acad Sci U S A. 1990;87(12):4576-4579
rRNA 16S / 18S
Filogenia para el análisis de familias de proteínas
http://jcs.biologists.org/content/118/5/843
Árboles filogenómicos
“…The tree was
constructed
from
concatenated
protein
sequence
alignments
derived from 31
housekeeping
genes…”
Wu & Eisen, Genome Biology 2008; 9:R151
¿Cómo se construye un árbol filogenético?
Selección
de
secuencias
Elaboración y
curación de un
alineamiento múltiple
Aplicación de
métodos y
modelos
evolutivos
Evaluación de la robustez
de los clados
Representación e
interpretación
Posición homóloga
Alineamiento múltiple
• Clustal-Omega (Sievers et al., 2011)
• T-COFFEE (Notredame et al., 2000)
• MAFFT (Katoh et al., 2002)
• COBALT (Papadopoulos & Agarwala, 2007)
• MUSCLE (Edgar, 2004)
• PROBCONS (Do et al., 2005)
etc…
Alineamiento múltiple
No es trivial cuál herrramienta usar
Wong KM et al., Science. 2008;319(5862):473-476
Wong KM et al., Science. 2008;319(5862):473-476
No es trivial cuál herrramienta usar
¿Cuál es el mejor?
Golubchik T et al., Mol Biol Evol. 2007, 24(11):2433-2442.
Secuencias con alta divergencia muestran patrones de alineamiento ricos
en gaps pueden señalar un error de método.
Problemas en un alineamiento
Posible razón: presencia de secuencias fragmentadas (ricas en gaps)
Posible razón: presencia de secuencias muy divergentes (no serían
reales miembros de una familia)
Problemas en un alineamiento
¿Cómo se construye un árbol filogenético?
Selección
de
secuencias
Elaboración y
curación de un
alineamiento múltiple
Aplicación de
métodos y
modelos
evolutivos
Evaluación de la robustez
de los clados
Representación e
interpretación
Maximum
Likelihood
Maximum
Parsimony
Bayes inference
Minimum
Evolution
Least Squares
UPGMA
“Neighbor-Joining”
Fitch/Margoliash
Métodos de inferencia filogenética
Criterio por optimización Algoritmos de agrupamiento
Distancias“Caracteres”
Tipodeinformaciónusada
Estrategia computacional utilizada
Métodos de inferencia filogenética
UPGMA
• Unweighted Pair Group Method with Arithmetic Mean
• Asume estado de “reloj molecular”, o sea, que todas las secuencias
evolucionan a una tasa constante (por lo tanto, no puede ofrecer
largos de rama diferentes)
• Utiliza promedios aritméticos, siempre entre pares
http://www.southampton.ac.uk/~re1u06/teaching/upgma/
Métodos de inferencia filogenética
UPGMA
A B C D E
B 2
C 4 4
D 6 6 6
E 6 6 6 4
F 8 8 8 8 8
UPGMA
A B C D E
B 2
C 4 4
D 6 6 6
E 6 6 6 4
F 8 8 8 8 8
UPGMA
A B C D E
B 2
C 4 4
D 6 6 6
E 6 6 6 4
F 8 8 8 8 8
UPGMA
dist(A,B),C = (distAC + distBC) / 2 = 4
dist(A,B),D = (distAD + distBD) / 2 = 6
dist(A,B),E = (distAE + distBE) / 2 = 6
dist(A,B),F = (distAF + distBF) / 2 = 8
A,B C D E
C 4
D 6 6
E 6 6 4
F 8 8 8 8
UPGMA
A,B C D,E
C 4
D,E 6 6
F 8 8 8
UPGMA
AB,C D,E
D,E 6
F 8 8
UPGMA
ABC,DE
F 8
UPGMA
Métodos de inferencia filogenética
UPGMA
Asumir un estado de “reloj” molecular puede
conducir a topologías erradas
Métodos de inferencia filogenética
Neighbor-Joining
http://en.wikipedia.org/wiki/Neighbor_joining
Métodos de inferencia filogenética
Neighbor-Joining
1. Elegir las hojas (secuencias) i, j tales que Dij - ui - uj
sea la menor posible
2. Definir una nueva hoja k, cuyas distancias a i y j sean
3. Calcular la distancia desde k a cualquier otra hoja r
4. Omitir i y j
Conectar las dos hojas por una rama cuya longitud sea Dij
( )
( )ijijjk
jiijik
uuDd
uuDd
-+=
-+=
2
1
2
1
2
1
2
1
( )ijjrirkr
DDDD -+=
2
1
Continuar hasta que sólo queden 2 hojas
http://en.wikipedia.org/wiki/Neighbor_joining
Métodos de inferencia filogenética
Máxima Parsimonia (Maximum parsimony, MP)
• El concepto de parsimonia está en el corazón de todos
los métodos basados ​​en caracteres de la reconstrucción
filogenética (por ejemplo, filogenia basada en fósiles).
• Las 2 ideas fundamentales de la parsimonia biológica
son:
– Las mutaciones son eventos extremadamente raros
– En cuanto más improbable sean los cambios que
generan un árbol, más probable es que tal sea
incorrecto.
• Por lo tanto, el árbol que involucre el menor número
de cambios es el más probable.
Fitch, WM., Systematic Zoology. 1971; 20(4), 406-416
Posición 1 2 3
#1 T G C
#2 T A C
#3 A G G
#4 A A G
El mejor árbolà
Fitch, WM., Systematic Zoology. 1971; 20(4), 406-416
Métodos de inferencia filogenética
Máxima Parsimonia (Maximum parsimony, MP)
http://evolution-textbook.org/content/free/figures/ch27.html
El problema de la ”atracción de ramas largas”: cuando el
árbol posee secuencias muy divergentes, MP infiere
incorrectamente los clades
Métodos de inferencia filogenética
Máxima Verosimilitud (Maximum likelihood, ML)
• ML utiliza un criterio estadístico y
computacionalmente intensivo para evaluar una
hipótesis evolutiva:
– Toma un alineamiento múltiple (observación)
– Formula todos los árboles posibles para cada
columna (partición) del alineamiento
– Calcula la probabilidad de todas las topologías
posibles, basándose en un modelo evolutivo
seleccionado por el usuario
– Combina la información para cada partición
– Identifica el árbol con la mayor probabilidad general,
cómo la filogenia más probable
http://homes.cs.washington.edu/~ruzzo/courses/gs559/09wi/lectures/8A_likelihood.pdf
Métodos de inferencia filogenética
Máxima Verosimilitud (Maximum likelihood, ML)
• Entrada: un set de secuencias y un modelo de
sustitución
• Salida: El árbol que maximice la verosimilitud del set de
datos
• Verosimilitud: la probabilidad condicional de reproducir
los datos, bajo un modelo dado.
http://homes.cs.washington.edu/~ruzzo/courses/gs559/09wi/lectures/8A_likelihood.pdf
Métodos de inferencia filogenética
Inferencia bayesiana
• Al igual que ML, es puramente estadístico y
computacionalmente intensivo
• Se basa en la regla de Bayes: Puede introducir
supuestos sobre la probabilidad inicial (”conocimiento
previo”)
• El método bayesiano utiliza parámetros aleatorios en el
modelo aplicado al árbol, mientras que ML utiliza
constantes fijadas y de valor desconocido
• Utilizando MCMC (Markov Chain Monte Carlo), se
genera una muestra de árboles que representan la
distribución de las probabilidades posteriores. En cuanto
más grande la muestra, más confiable el resultado.
http://faculty.fortlewis.edu/mccauley_r/Ecol_mol/Archibald%20et%20al%202003%20Bayesian%20Inference.pdf
Métodos de inferencia filogenética
Yang & Rannala, Nat Rev Genet. 2012; 13(5):303-314
Qué cosas consideran los modelos evolutivos
Los modelos de sustitución de
bases consideran diferencias
entre las transiciones y
transversiones
Los modelos de sustitución de
proteínas consideran cambios
entre aminoácidos de similares y
diferentes propiedades
Los modelos de sustitución de proteínas asignan diferente
impacto a las substituciones entre aminoácidos de similares y
diferentes propiedades
Qué cosas consideran los modelos evolutivos
Le & Gascuel, Mol Biol Evol. 2008;25(7):1307-1320
Algunos
modelos
consideran las
sustituciones
de acuerdo a
cuál posición
están dentro
de un codón.
Qué cosas consideran los modelos evolutivos
El valor numérico gamma
(α): En cuanto más bajo,
más baja es la variación de
las tasas de sustitución
entre los sitios.
La aplicación de este
criterio es particularmente
útil en ML y Bayesiano
Qué cosas consideran los modelos evolutivos
Yang Z., Trends Ecol Evol. 1996; 11(9):367-372
Qué cosas consideran los modelos evolutivos
Yang Z., Trends Ecol Evol. 1996; 11(9):367-372
¿Cómo se construye un árbol filogenético?
Selección
de
secuencias
Elaboración y
curación de un
alineamiento múltiple
Aplicación de
métodos y
modelos
evolutivos
Evaluación de la robustez
de los clados
Representación e
interpretación
• Bootstrapping: un método de medición de la
precisión que realiza un proceso repetitivo de
construcción de árboles que se producen después
de una alteración discreta de un mismo set de
datos (generalmente, un re-arreglo de las
columnas)
Evaluación de los árboles filogenéticos
Bootstrapping
Baldauf SL, Trends Genet. 2003, 19(6):345-351
Software para filogenia
Yang & Rannala, Nat Rev Genet. 2012; 13(5):303-314
Taubenberger JK., Proc Am Philos Soc. 2006; 150(1):86-112
Nos ayuda a comprender cómo agentes infecciosos
emergieron
Filogenia de la hemaglutinina
(segmento HA1) de la Influenza
Nos ayuda a comprender la evolución y diversidad de
las especies
Woese & Fox, Proc Natl Acad Sci U S A. 1977;74(11):5088-5090
Woese et al., Proc Natl Acad Sci U S A. 1990;87(12):4576-4579
rRNA 16S / 18S
http://tolweb.org/tree/
Hug LA et al., Nat Microbiol. 2016; 1:16048
El mundo incultivable
Hug LA et al., Nat Microbiol. 2016; 1:16048
El mundo incultivable
Un sector completo del Árbol
de la Vida (recuperado por
reconstrucción
metagenómica) permanece
sin cultivar
Spang A. et al., Nature. 2015; 521(7551):173-179
El caso de Lokiarchaeota
Nos ayuda a comprender la evolución y diversidad de
las especies
Spang A. et al., Nature. 2015; 521(7551):173-179
El caso de Lokiarchaeota
Nos ayuda a comprender la evolución y diversidad de
las especies
Spang A. et al., Nature. 2015; 521(7551):173-179
El caso de Lokiarchaeota
Nos ayuda a comprender la evolución y diversidad de
las especies
Ingles-Prieto A. et al., Structure. 2013; 21(9):1690-1697
Nos ayuda a reconstruir proteínas ancestrales
Perez-Jimenez R. et al., Nat Struct Mol Biol. 2011; 18(5):592-596
Nos ayuda a reconstruir proteínas ancestrales
Preguntas…?
E-mail: juan.pablo.cardenas@gmail.com
Twitter: @LuisBenjamin_

Más contenido relacionado

PPTX
Diseño primers
PPTX
Sintesís de ADN / Replicación
PPTX
Codigo genetico hip. balanceo
PPT
Marcadores moleculares
PPT
Corpusculo de barr
PPTX
Replicación del ADN y Sistemas de reparación.
PDF
1 estructura bacteriana
Diseño primers
Sintesís de ADN / Replicación
Codigo genetico hip. balanceo
Marcadores moleculares
Corpusculo de barr
Replicación del ADN y Sistemas de reparación.
1 estructura bacteriana

La actualidad más candente (20)

PDF
Informe electroforesis
PPTX
PPTX
Tema16. Herencia Cuantitativa
PPTX
3.replicacion reparacion dna
PPT
Genetica Bacteriana
PPT
1. regulacion de la expresion genica
PDF
Lab enzimas restriccion y clonacion
PPT
Pruebas.bioquimicas.de.identificacion.243338506
PPT
Epigenetica: mas alla de los genes
PPT
Relacion genes proteinas
PPT
Clase 3
PPTX
PPS
PCR en tiempo real
DOC
Grupos Sanguineo.informe
PPT
Práctica 5 Elaboración de idiograma humano.
PPT
Extracción de Ácidos Nucléicos
PPTX
Secuenciación de ADN
PDF
Sistematica filogenetica ejercicios
PDF
Práctica de laboratorio pcr
PPTX
Estructura y organizacon del genoma humano
Informe electroforesis
Tema16. Herencia Cuantitativa
3.replicacion reparacion dna
Genetica Bacteriana
1. regulacion de la expresion genica
Lab enzimas restriccion y clonacion
Pruebas.bioquimicas.de.identificacion.243338506
Epigenetica: mas alla de los genes
Relacion genes proteinas
Clase 3
PCR en tiempo real
Grupos Sanguineo.informe
Práctica 5 Elaboración de idiograma humano.
Extracción de Ácidos Nucléicos
Secuenciación de ADN
Sistematica filogenetica ejercicios
Práctica de laboratorio pcr
Estructura y organizacon del genoma humano
Publicidad

Similar a Clase: Introducción a la Filogenia 2016 (20)

PDF
16-analisis-filogeneticos-Análisis filogenéticos.pdf
PDF
INFORME_FILOGENIA_merged.pdf
PDF
Qué es la filogenética? • Reconstrucción de la historia evolutiva de los orga...
PDF
PRACTICA N.- 05_ FILOGENIA MOLECULAR DE GENES RIBOMALES Y CONSTRUCCIÓN DE UN ...
PPTX
Inferencia filogenética- arboles- filogenia
PPTX
clase althabefoiti sobre el secuenciamiento del DNA
PDF
PRACTICA N° 05 - MEGA DNA.pdf
PPT
Metodos filogeneticos ABP
PPTX
clase 281021.pptx
PDF
INFORME 05 - Filogenia molecular de genes ribomales y construcción de un dend...
PDF
el análisis filogenético, métodos, problemas y perspectivas.pdf
PDF
ELABORACIÓN DE DENDROGRAMAS A PARTIR DE ARTÍCULOS CIENTÍFICOS UTILIZANDO EL P...
PDF
Filogenia_Pinzón
PDF
FILOGENIA - Copia.pdf
PPTX
homologia .
PDF
filogenia1_avanzado desde el manejo de algoritmos
PDF
Taxonomía inductora para principiantes año 2024
PDF
Informe del uso del programa MEGA ADN.pdf
PDF
Alineamiento de secuencias de adn y generación de
DOCX
Uso del software Mega Ácido desoxirribonucleico - INFORME
16-analisis-filogeneticos-Análisis filogenéticos.pdf
INFORME_FILOGENIA_merged.pdf
Qué es la filogenética? • Reconstrucción de la historia evolutiva de los orga...
PRACTICA N.- 05_ FILOGENIA MOLECULAR DE GENES RIBOMALES Y CONSTRUCCIÓN DE UN ...
Inferencia filogenética- arboles- filogenia
clase althabefoiti sobre el secuenciamiento del DNA
PRACTICA N° 05 - MEGA DNA.pdf
Metodos filogeneticos ABP
clase 281021.pptx
INFORME 05 - Filogenia molecular de genes ribomales y construcción de un dend...
el análisis filogenético, métodos, problemas y perspectivas.pdf
ELABORACIÓN DE DENDROGRAMAS A PARTIR DE ARTÍCULOS CIENTÍFICOS UTILIZANDO EL P...
Filogenia_Pinzón
FILOGENIA - Copia.pdf
homologia .
filogenia1_avanzado desde el manejo de algoritmos
Taxonomía inductora para principiantes año 2024
Informe del uso del programa MEGA ADN.pdf
Alineamiento de secuencias de adn y generación de
Uso del software Mega Ácido desoxirribonucleico - INFORME
Publicidad

Último (20)

PDF
E1 Guía_Matemática_5°_grado.pdf paraguay
PDF
MODULO I ENFERMERIA BASICA.pdf HIstoria en enfermeria
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
PDF
Uso de la Inteligencia Artificial en la IE.pdf
PPTX
Juicios Celestiales de Jesus Manuel Locio Lopez..pptx
PPTX
RESUMENES JULIO - QUIRÓFANO HOSPITAL GENERAL PUYO.pptx
PDF
Ficha de Atencion a Estudiantes RE Ccesa007.pdf
PDF
KOF-2022-espanol-mar-27-11-36 coke.pdf jsja
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - TERCER GRADO.docx
PPTX
fisiologia respiratoria pediatria ruza.pptx
PDF
Didáctica de las literaturas infantiles.
PDF
El Genero y Nuestros Cerebros - Gina Ripon Ccesa007.pdf
PPTX
4. Qué es un computador PARA GRADO CUARTO.pptx
PDF
4 CP-20172RC-042-Katherine-Mendez-21239260.pdf
PPTX
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
PDF
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
PDF
NOM-020-SSA-2025.pdf Para establecimientos de salud y el reconocimiento de l...
DOCX
Fisiopatologia bdjdbd resumen de cierta parte
PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PDF
KOF-2022-espanol-mar-27-11-36 coke.pdf tv
E1 Guía_Matemática_5°_grado.pdf paraguay
MODULO I ENFERMERIA BASICA.pdf HIstoria en enfermeria
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
Uso de la Inteligencia Artificial en la IE.pdf
Juicios Celestiales de Jesus Manuel Locio Lopez..pptx
RESUMENES JULIO - QUIRÓFANO HOSPITAL GENERAL PUYO.pptx
Ficha de Atencion a Estudiantes RE Ccesa007.pdf
KOF-2022-espanol-mar-27-11-36 coke.pdf jsja
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - TERCER GRADO.docx
fisiologia respiratoria pediatria ruza.pptx
Didáctica de las literaturas infantiles.
El Genero y Nuestros Cerebros - Gina Ripon Ccesa007.pdf
4. Qué es un computador PARA GRADO CUARTO.pptx
4 CP-20172RC-042-Katherine-Mendez-21239260.pdf
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
NOM-020-SSA-2025.pdf Para establecimientos de salud y el reconocimiento de l...
Fisiopatologia bdjdbd resumen de cierta parte
Telos 127 Generacion Al fa Beta - fundaciontelefonica
KOF-2022-espanol-mar-27-11-36 coke.pdf tv

Clase: Introducción a la Filogenia 2016

  • 1. Introducción a la Filogenia Molecular Dr. Juan Pablo Cárdenas Astudillo Data Scientist, μBiome
  • 2. Genoma Célula Genes Los genes contienen instrucciones para sintetizar RNA y proteínas Proteínas las proteínas actúan solas o en complejos para realizar las funciones celulares Cromosomas
  • 6. ¿Qué nos puede decir este alineamiento sobre la relación evolutiva entre estas secuencias? http://en.wikipedia.org/wiki/Multiple_sequence_alignment
  • 7. Filogenia Molecular Estudio de la historia evolutiva de los seres vivos (o sus genes y proteínas), realizado a partir de sus secuencias. Principal supuesto En estudios filogenético-moleculares, se asume que las secuencias a comparar son homólogas.
  • 9. Cada posición reflejaría la variación de un residuo desde un ancestro común http://en.wikipedia.org/wiki/Multiple_sequence_alignment
  • 10. Con raíz Sin raíz Representación de un árbol Nodo Clado Taxones Rama “Outgroup” (Grupo externo)
  • 11. Relaciones filogenéticas: Ortología y Paralogía Ortólogos: generados por la transferencia vertical, producida por la especiación Parálogos: generados por duplicaciones dentro de una especie dada Baldauf SL, Trends Genet. 2003, 19(6):345-351
  • 12. Relaciones filogenéticas: “Xenología”(HGT) Transferencia de genes entre diversos puntos (no directamente relacionados) del árbol de la vida Brown JR, Nat Rev Genet. 2003, 4(2):121-32
  • 14. Cladograma Filograma Cladograma inclinado Representaciones filogenéticas
  • 15. Árbol circular Árbol sin raíz Representaciones filogenéticas
  • 16. ¿Cómo se construye un árbol filogenético? Selección de secuencias Elaboración y curación de un alineamiento múltiple Aplicación de métodos y modelos evolutivos Evaluación de la robustez de los clados Representación e interpretación
  • 17. ¿Cómo se construye un árbol filogenético? Selección de secuencias Elaboración y curación de un alineamiento múltiple Aplicación de métodos y modelos evolutivos Evaluación de la robustez de los clados Representación e interpretación
  • 18. Seleccionando secuencias • ¿Qué se desea hacer? ¿Cuál es el enfoque evolutivo? • Proteínas – Si se necesita evaluar evolución familias por función – Filogenia genómica (sets concatenados de genes conservados y/o proteínas ribosomales) • DNA – Evolución de regiones altamente variables (por ej: D- loop mitocondrial, región espaciadora entre genes de rRNA) – Marcadores para evolución de organismos (por ej: rRNA 16S / 18S
  • 20. Una aproximación secuencia/especie: el árbol de la vida Woese & Fox, Proc Natl Acad Sci U S A. 1977;74(11):5088-5090 Woese et al., Proc Natl Acad Sci U S A. 1990;87(12):4576-4579 rRNA 16S / 18S
  • 21. Filogenia para el análisis de familias de proteínas http://jcs.biologists.org/content/118/5/843
  • 22. Árboles filogenómicos “…The tree was constructed from concatenated protein sequence alignments derived from 31 housekeeping genes…” Wu & Eisen, Genome Biology 2008; 9:R151
  • 23. ¿Cómo se construye un árbol filogenético? Selección de secuencias Elaboración y curación de un alineamiento múltiple Aplicación de métodos y modelos evolutivos Evaluación de la robustez de los clados Representación e interpretación
  • 25. • Clustal-Omega (Sievers et al., 2011) • T-COFFEE (Notredame et al., 2000) • MAFFT (Katoh et al., 2002) • COBALT (Papadopoulos & Agarwala, 2007) • MUSCLE (Edgar, 2004) • PROBCONS (Do et al., 2005) etc… Alineamiento múltiple
  • 26. No es trivial cuál herrramienta usar Wong KM et al., Science. 2008;319(5862):473-476
  • 27. Wong KM et al., Science. 2008;319(5862):473-476 No es trivial cuál herrramienta usar
  • 28. ¿Cuál es el mejor? Golubchik T et al., Mol Biol Evol. 2007, 24(11):2433-2442.
  • 29. Secuencias con alta divergencia muestran patrones de alineamiento ricos en gaps pueden señalar un error de método. Problemas en un alineamiento
  • 30. Posible razón: presencia de secuencias fragmentadas (ricas en gaps) Posible razón: presencia de secuencias muy divergentes (no serían reales miembros de una familia) Problemas en un alineamiento
  • 31. ¿Cómo se construye un árbol filogenético? Selección de secuencias Elaboración y curación de un alineamiento múltiple Aplicación de métodos y modelos evolutivos Evaluación de la robustez de los clados Representación e interpretación
  • 32. Maximum Likelihood Maximum Parsimony Bayes inference Minimum Evolution Least Squares UPGMA “Neighbor-Joining” Fitch/Margoliash Métodos de inferencia filogenética Criterio por optimización Algoritmos de agrupamiento Distancias“Caracteres” Tipodeinformaciónusada Estrategia computacional utilizada
  • 33. Métodos de inferencia filogenética UPGMA • Unweighted Pair Group Method with Arithmetic Mean • Asume estado de “reloj molecular”, o sea, que todas las secuencias evolucionan a una tasa constante (por lo tanto, no puede ofrecer largos de rama diferentes) • Utiliza promedios aritméticos, siempre entre pares http://www.southampton.ac.uk/~re1u06/teaching/upgma/
  • 34. Métodos de inferencia filogenética UPGMA
  • 35. A B C D E B 2 C 4 4 D 6 6 6 E 6 6 6 4 F 8 8 8 8 8 UPGMA
  • 36. A B C D E B 2 C 4 4 D 6 6 6 E 6 6 6 4 F 8 8 8 8 8 UPGMA
  • 37. A B C D E B 2 C 4 4 D 6 6 6 E 6 6 6 4 F 8 8 8 8 8 UPGMA dist(A,B),C = (distAC + distBC) / 2 = 4 dist(A,B),D = (distAD + distBD) / 2 = 6 dist(A,B),E = (distAE + distBE) / 2 = 6 dist(A,B),F = (distAF + distBF) / 2 = 8
  • 38. A,B C D E C 4 D 6 6 E 6 6 4 F 8 8 8 8 UPGMA
  • 39. A,B C D,E C 4 D,E 6 6 F 8 8 8 UPGMA
  • 40. AB,C D,E D,E 6 F 8 8 UPGMA
  • 42. Métodos de inferencia filogenética UPGMA Asumir un estado de “reloj” molecular puede conducir a topologías erradas
  • 43. Métodos de inferencia filogenética Neighbor-Joining http://en.wikipedia.org/wiki/Neighbor_joining
  • 44. Métodos de inferencia filogenética Neighbor-Joining 1. Elegir las hojas (secuencias) i, j tales que Dij - ui - uj sea la menor posible 2. Definir una nueva hoja k, cuyas distancias a i y j sean 3. Calcular la distancia desde k a cualquier otra hoja r 4. Omitir i y j Conectar las dos hojas por una rama cuya longitud sea Dij ( ) ( )ijijjk jiijik uuDd uuDd -+= -+= 2 1 2 1 2 1 2 1 ( )ijjrirkr DDDD -+= 2 1 Continuar hasta que sólo queden 2 hojas http://en.wikipedia.org/wiki/Neighbor_joining
  • 45. Métodos de inferencia filogenética Máxima Parsimonia (Maximum parsimony, MP) • El concepto de parsimonia está en el corazón de todos los métodos basados ​​en caracteres de la reconstrucción filogenética (por ejemplo, filogenia basada en fósiles). • Las 2 ideas fundamentales de la parsimonia biológica son: – Las mutaciones son eventos extremadamente raros – En cuanto más improbable sean los cambios que generan un árbol, más probable es que tal sea incorrecto. • Por lo tanto, el árbol que involucre el menor número de cambios es el más probable. Fitch, WM., Systematic Zoology. 1971; 20(4), 406-416
  • 46. Posición 1 2 3 #1 T G C #2 T A C #3 A G G #4 A A G El mejor árbolà Fitch, WM., Systematic Zoology. 1971; 20(4), 406-416
  • 47. Métodos de inferencia filogenética Máxima Parsimonia (Maximum parsimony, MP) http://evolution-textbook.org/content/free/figures/ch27.html El problema de la ”atracción de ramas largas”: cuando el árbol posee secuencias muy divergentes, MP infiere incorrectamente los clades
  • 48. Métodos de inferencia filogenética Máxima Verosimilitud (Maximum likelihood, ML) • ML utiliza un criterio estadístico y computacionalmente intensivo para evaluar una hipótesis evolutiva: – Toma un alineamiento múltiple (observación) – Formula todos los árboles posibles para cada columna (partición) del alineamiento – Calcula la probabilidad de todas las topologías posibles, basándose en un modelo evolutivo seleccionado por el usuario – Combina la información para cada partición – Identifica el árbol con la mayor probabilidad general, cómo la filogenia más probable http://homes.cs.washington.edu/~ruzzo/courses/gs559/09wi/lectures/8A_likelihood.pdf
  • 49. Métodos de inferencia filogenética Máxima Verosimilitud (Maximum likelihood, ML) • Entrada: un set de secuencias y un modelo de sustitución • Salida: El árbol que maximice la verosimilitud del set de datos • Verosimilitud: la probabilidad condicional de reproducir los datos, bajo un modelo dado. http://homes.cs.washington.edu/~ruzzo/courses/gs559/09wi/lectures/8A_likelihood.pdf
  • 50. Métodos de inferencia filogenética Inferencia bayesiana • Al igual que ML, es puramente estadístico y computacionalmente intensivo • Se basa en la regla de Bayes: Puede introducir supuestos sobre la probabilidad inicial (”conocimiento previo”) • El método bayesiano utiliza parámetros aleatorios en el modelo aplicado al árbol, mientras que ML utiliza constantes fijadas y de valor desconocido • Utilizando MCMC (Markov Chain Monte Carlo), se genera una muestra de árboles que representan la distribución de las probabilidades posteriores. En cuanto más grande la muestra, más confiable el resultado. http://faculty.fortlewis.edu/mccauley_r/Ecol_mol/Archibald%20et%20al%202003%20Bayesian%20Inference.pdf
  • 51. Métodos de inferencia filogenética Yang & Rannala, Nat Rev Genet. 2012; 13(5):303-314
  • 52. Qué cosas consideran los modelos evolutivos Los modelos de sustitución de bases consideran diferencias entre las transiciones y transversiones Los modelos de sustitución de proteínas consideran cambios entre aminoácidos de similares y diferentes propiedades
  • 53. Los modelos de sustitución de proteínas asignan diferente impacto a las substituciones entre aminoácidos de similares y diferentes propiedades Qué cosas consideran los modelos evolutivos Le & Gascuel, Mol Biol Evol. 2008;25(7):1307-1320
  • 54. Algunos modelos consideran las sustituciones de acuerdo a cuál posición están dentro de un codón. Qué cosas consideran los modelos evolutivos
  • 55. El valor numérico gamma (α): En cuanto más bajo, más baja es la variación de las tasas de sustitución entre los sitios. La aplicación de este criterio es particularmente útil en ML y Bayesiano Qué cosas consideran los modelos evolutivos Yang Z., Trends Ecol Evol. 1996; 11(9):367-372
  • 56. Qué cosas consideran los modelos evolutivos Yang Z., Trends Ecol Evol. 1996; 11(9):367-372
  • 57. ¿Cómo se construye un árbol filogenético? Selección de secuencias Elaboración y curación de un alineamiento múltiple Aplicación de métodos y modelos evolutivos Evaluación de la robustez de los clados Representación e interpretación
  • 58. • Bootstrapping: un método de medición de la precisión que realiza un proceso repetitivo de construcción de árboles que se producen después de una alteración discreta de un mismo set de datos (generalmente, un re-arreglo de las columnas) Evaluación de los árboles filogenéticos
  • 59. Bootstrapping Baldauf SL, Trends Genet. 2003, 19(6):345-351
  • 60. Software para filogenia Yang & Rannala, Nat Rev Genet. 2012; 13(5):303-314
  • 61. Taubenberger JK., Proc Am Philos Soc. 2006; 150(1):86-112 Nos ayuda a comprender cómo agentes infecciosos emergieron Filogenia de la hemaglutinina (segmento HA1) de la Influenza
  • 62. Nos ayuda a comprender la evolución y diversidad de las especies Woese & Fox, Proc Natl Acad Sci U S A. 1977;74(11):5088-5090 Woese et al., Proc Natl Acad Sci U S A. 1990;87(12):4576-4579 rRNA 16S / 18S
  • 64. Hug LA et al., Nat Microbiol. 2016; 1:16048 El mundo incultivable
  • 65. Hug LA et al., Nat Microbiol. 2016; 1:16048 El mundo incultivable Un sector completo del Árbol de la Vida (recuperado por reconstrucción metagenómica) permanece sin cultivar
  • 66. Spang A. et al., Nature. 2015; 521(7551):173-179 El caso de Lokiarchaeota Nos ayuda a comprender la evolución y diversidad de las especies
  • 67. Spang A. et al., Nature. 2015; 521(7551):173-179 El caso de Lokiarchaeota Nos ayuda a comprender la evolución y diversidad de las especies
  • 68. Spang A. et al., Nature. 2015; 521(7551):173-179 El caso de Lokiarchaeota Nos ayuda a comprender la evolución y diversidad de las especies
  • 69. Ingles-Prieto A. et al., Structure. 2013; 21(9):1690-1697 Nos ayuda a reconstruir proteínas ancestrales
  • 70. Perez-Jimenez R. et al., Nat Struct Mol Biol. 2011; 18(5):592-596 Nos ayuda a reconstruir proteínas ancestrales