SlideShare una empresa de Scribd logo
ula
ientífica
Bases de datos en Bioinformática
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 2
Contenidos
1. La bioinformática y las bases de datos
2. Las bases de datos en biología molecular
3. Formato de la información almacenada
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 3
Información en la era genómica
• El proyecto genoma humano y similares genera un
inmenso flujo de información
• Para poder utilizar esta información, ha de estar
almacenada correctamente
• El acceso a la información almacenada ...
– Ha de ser rápido
– Debe poder hacerse de manera flexible
• Esto es posible gracias a la creación de bases de datos y
distribución vía Internet.
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 4
Para que se utilizan las bases de datos ?
• Búsqueda de información.
– Por palabra clave, números de acceso, autores...
• Búsqueda de homologías
– ¿Hay secuencias igual o parecidas a la mía ?
• Búsqueda de patrones
– ¿Mi secuencia contienen patrones conocidos?
• Predicciones
– ¿Puedo encontrar proteínas parecidas a la mía, pero con
función conocida?
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 5
Aspectos a tener en cuenta
• Los proveedores de recursos
– Centros o organizaciones especializadas en tener y
mantener las bases de datos.
• Bases de datos
– Hay mucha variedad y contiene información diversa
• Las herramientas
– Para encontrar información en las BD
– Para contrastar secuencias contra las BD
– Para exportar la información
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 6
Principales proveedores de recursos
• El National Center for Biotechnology Information (NCBI)
centraliza los bancos de datos y aplicacions de EEUU
• El European Bioinformatics Institute (EBI) realiza una
función similar en Europa
• GenomeNet reune bases de datos diversas en Japón
ula
ientífica
Principales bases de datos en
Biología Molecular
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 8
Tipos de bases de datos
• Existen cientos de BD en número tan elevado que no es
práctico enumerarlas (aunque aquí lo intentan)
• Por el tipo de información que contienen distinguimos
– Bases de datos bibliográficas
– Bases de datos taxonómicas
– Bases de datos de nucleótidos
– Bases de datos genómicas
– Bases de datos de proteinas
– Bases de datos de microarrays
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 9
Bases de datos bibliográficas
• Organización de los artículos publicados en la
revistas de ámbito científico.
– Pubmed (NCBI)
– Medline (EBI)
– Biocatalog: organización de los artículos por temáticas
concretas de biología molecular.
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 10
Bases de datos taxonómicas
• Son BD que contienen información sobre la clasificación
de los seres vivos
• Esta clasificación es básicamente jerárquica y basada en
información molecular
• Pretende clasificar cualquier organismo del que se posea
como mínimo una secuencia de acidos nucléicos
• Como puede suponerse el proyecto no está libre de
controversia debido a las visiones diferentes que existen en
la comunidad taxonómica
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 11
Bases de datos de nucleótidos
• Las bases de datos de ácidos nucleicos reciben las
secuencias de los laboratorios experimentales y las
organizan haciéndolas accesibles a diario a toda la
comunidad científica
• Existen varias BD que intercambian diariamente
su contenido
– Genbank (NCBI)
– EMBL (EBI)
– KEGG (Genome net)
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 12
Bases de datos de genomas
• Se encargan de mantener y actualizar las secuencias y las
anotaciones de genomas completos.
– Ensembl (EBI)
– Genome viewer (NCBI)
– Goldenpath (UCSC)
• Existen también recursos genómicos especializados
– Transfact: sitios de unión a factores de transcripción.
– EST: Expressed Sequence Tags
– UTRDB: Untranslated regions
– SpliceSitesDB: Pares de señales de splicing
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 13
Bases de datos de proteínas
• Secuencias primarias de aminoácidos
– Sin revisión humana
• Trembl (EBI)
• nr (NCBI)
– Con revisión de la anotación
• Swisprot (EBI)
– Bases de datos de proteomas
• Proteome analysis (EBI)
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 14
Proteínas (II)
• Estructuras secundarias o dominios. Varían según la fuente
de las proteínas y el análisis que se realiza sobre ellas.
– BLOCKS: Motivos alineados de PROSITE/PRINTS
– PROSITE: Expresiones regulares sobre Swiss-prot
– PRINTS: Conjunto de motivos que definen una familia sobre
Swiss-prot/TrEMBL
– PFAM: Modelos de Markov sobre Swiss-prot
– INTERPRO: Integra la información de muchas bases de datos de
dominios.
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 15
Proteínas (III)
• Estructuras tridimensionales de macromoléculas
con las coordenadas en el espacio de cada átomo.
– PDB: Base de datos principal de estructuras
tridimensionales
– CATH: Clasificación de PDB en diferentes grupos
funcionales y estructurales
– MMDB: subset de PDB mantenido por NCBI
– MSD: subset de PDB mantenido por EBI
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 16
Bases de datos de microarrays
• Bases de datos con las imágenes y resultados
obtenidos por arrays de expresión.
– ArrayExpress (EBI)
– Riken Expression Array Database
– Eisen Laboratory (Lawrence Berkeley National Lab)
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 17
4. El formato de la información
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 18
Estructura de las BD
• La calidad de la información en una base de datos,
está muy relacionas con su estructura
• Este aspecto también es crucial para su eficiencia
y accesibilidad .
• En la actualidad no existe ningún formato único y
estándar, usualmente cada base de datos impone
su propio formato.
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 19
Ejemplo entrada Genbank
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 20
Ejemplo entrada EMBL
ula
ientífica
Introducción a la BioinformáticaIntroducción a la Bioinformática 21
Información sobre los formatos
de las bases de datos

Más contenido relacionado

PPTX
Sistemas de informacion
PDF
Dialnet bioinformatica unaoportunidady-undesafio-2731617
DOCX
Bioinformatica
PPTX
Molinari ana
PPTX
Web analytics 2.0
PDF
Gamification of work - Frederick Williquet
PPT
Bases de datos
PPTX
Bases De Datos
Sistemas de informacion
Dialnet bioinformatica unaoportunidady-undesafio-2731617
Bioinformatica
Molinari ana
Web analytics 2.0
Gamification of work - Frederick Williquet
Bases de datos
Bases De Datos

Similar a Bases de datos (20)

PPTX
Clase 3.pptx
PPSX
Bioinformatics Biostatistics with dynamic programming and sequence alignment
PDF
Caracteristicas de las bases de datos Refseq y Genbank.pdf
PPT
9. bioinformatica bases de datos.
PDF
PDF
Bases de datos del NCBI
PPTX
Bases de datos secundarias|12345678.pptx
PDF
Practica 1 analisis de secuencias del gen16 s
PDF
1_Bases de datos_biologicas_secuencias.pdf
PPTX
Bioinformatica NCBI y REFSEQ
PDF
GRUPO 01_INFORME DE BIOTECNOLOGIA EN CLASE _ GRUPAL.pdf
PDF
SIMULACIÓN DE GEL DE AGAROSA USANDO EL SOFTWARE SNAPGENE_1.pdf
PDF
SIMULACIÓN DE GEL DE AGAROSA USANDO EL SOFTWARE SNAPGENE.pdf
PPTX
BIOINFORMATICA (2).pptx
PDF
Uso GPUs para alineación de secuencias de Genes
PPTX
Biotecnologia grado 9a cgv scc
PPTX
analitica de datos: bioinformatica
ODP
Applying sw mikel_egana
PPT
Biología Computacional
PDF
Practica 1 analisis de secuencias del gen 16 s
Clase 3.pptx
Bioinformatics Biostatistics with dynamic programming and sequence alignment
Caracteristicas de las bases de datos Refseq y Genbank.pdf
9. bioinformatica bases de datos.
Bases de datos del NCBI
Bases de datos secundarias|12345678.pptx
Practica 1 analisis de secuencias del gen16 s
1_Bases de datos_biologicas_secuencias.pdf
Bioinformatica NCBI y REFSEQ
GRUPO 01_INFORME DE BIOTECNOLOGIA EN CLASE _ GRUPAL.pdf
SIMULACIÓN DE GEL DE AGAROSA USANDO EL SOFTWARE SNAPGENE_1.pdf
SIMULACIÓN DE GEL DE AGAROSA USANDO EL SOFTWARE SNAPGENE.pdf
BIOINFORMATICA (2).pptx
Uso GPUs para alineación de secuencias de Genes
Biotecnologia grado 9a cgv scc
analitica de datos: bioinformatica
Applying sw mikel_egana
Biología Computacional
Practica 1 analisis de secuencias del gen 16 s
Publicidad

Bases de datos

  • 1. ula ientífica Bases de datos en Bioinformática
  • 2. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 2 Contenidos 1. La bioinformática y las bases de datos 2. Las bases de datos en biología molecular 3. Formato de la información almacenada
  • 3. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 3 Información en la era genómica • El proyecto genoma humano y similares genera un inmenso flujo de información • Para poder utilizar esta información, ha de estar almacenada correctamente • El acceso a la información almacenada ... – Ha de ser rápido – Debe poder hacerse de manera flexible • Esto es posible gracias a la creación de bases de datos y distribución vía Internet.
  • 4. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 4 Para que se utilizan las bases de datos ? • Búsqueda de información. – Por palabra clave, números de acceso, autores... • Búsqueda de homologías – ¿Hay secuencias igual o parecidas a la mía ? • Búsqueda de patrones – ¿Mi secuencia contienen patrones conocidos? • Predicciones – ¿Puedo encontrar proteínas parecidas a la mía, pero con función conocida?
  • 5. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 5 Aspectos a tener en cuenta • Los proveedores de recursos – Centros o organizaciones especializadas en tener y mantener las bases de datos. • Bases de datos – Hay mucha variedad y contiene información diversa • Las herramientas – Para encontrar información en las BD – Para contrastar secuencias contra las BD – Para exportar la información
  • 6. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 6 Principales proveedores de recursos • El National Center for Biotechnology Information (NCBI) centraliza los bancos de datos y aplicacions de EEUU • El European Bioinformatics Institute (EBI) realiza una función similar en Europa • GenomeNet reune bases de datos diversas en Japón
  • 7. ula ientífica Principales bases de datos en Biología Molecular
  • 8. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 8 Tipos de bases de datos • Existen cientos de BD en número tan elevado que no es práctico enumerarlas (aunque aquí lo intentan) • Por el tipo de información que contienen distinguimos – Bases de datos bibliográficas – Bases de datos taxonómicas – Bases de datos de nucleótidos – Bases de datos genómicas – Bases de datos de proteinas – Bases de datos de microarrays
  • 9. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 9 Bases de datos bibliográficas • Organización de los artículos publicados en la revistas de ámbito científico. – Pubmed (NCBI) – Medline (EBI) – Biocatalog: organización de los artículos por temáticas concretas de biología molecular.
  • 10. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 10 Bases de datos taxonómicas • Son BD que contienen información sobre la clasificación de los seres vivos • Esta clasificación es básicamente jerárquica y basada en información molecular • Pretende clasificar cualquier organismo del que se posea como mínimo una secuencia de acidos nucléicos • Como puede suponerse el proyecto no está libre de controversia debido a las visiones diferentes que existen en la comunidad taxonómica
  • 11. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 11 Bases de datos de nucleótidos • Las bases de datos de ácidos nucleicos reciben las secuencias de los laboratorios experimentales y las organizan haciéndolas accesibles a diario a toda la comunidad científica • Existen varias BD que intercambian diariamente su contenido – Genbank (NCBI) – EMBL (EBI) – KEGG (Genome net)
  • 12. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 12 Bases de datos de genomas • Se encargan de mantener y actualizar las secuencias y las anotaciones de genomas completos. – Ensembl (EBI) – Genome viewer (NCBI) – Goldenpath (UCSC) • Existen también recursos genómicos especializados – Transfact: sitios de unión a factores de transcripción. – EST: Expressed Sequence Tags – UTRDB: Untranslated regions – SpliceSitesDB: Pares de señales de splicing
  • 13. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 13 Bases de datos de proteínas • Secuencias primarias de aminoácidos – Sin revisión humana • Trembl (EBI) • nr (NCBI) – Con revisión de la anotación • Swisprot (EBI) – Bases de datos de proteomas • Proteome analysis (EBI)
  • 14. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 14 Proteínas (II) • Estructuras secundarias o dominios. Varían según la fuente de las proteínas y el análisis que se realiza sobre ellas. – BLOCKS: Motivos alineados de PROSITE/PRINTS – PROSITE: Expresiones regulares sobre Swiss-prot – PRINTS: Conjunto de motivos que definen una familia sobre Swiss-prot/TrEMBL – PFAM: Modelos de Markov sobre Swiss-prot – INTERPRO: Integra la información de muchas bases de datos de dominios.
  • 15. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 15 Proteínas (III) • Estructuras tridimensionales de macromoléculas con las coordenadas en el espacio de cada átomo. – PDB: Base de datos principal de estructuras tridimensionales – CATH: Clasificación de PDB en diferentes grupos funcionales y estructurales – MMDB: subset de PDB mantenido por NCBI – MSD: subset de PDB mantenido por EBI
  • 16. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 16 Bases de datos de microarrays • Bases de datos con las imágenes y resultados obtenidos por arrays de expresión. – ArrayExpress (EBI) – Riken Expression Array Database – Eisen Laboratory (Lawrence Berkeley National Lab)
  • 17. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 17 4. El formato de la información
  • 18. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 18 Estructura de las BD • La calidad de la información en una base de datos, está muy relacionas con su estructura • Este aspecto también es crucial para su eficiencia y accesibilidad . • En la actualidad no existe ningún formato único y estándar, usualmente cada base de datos impone su propio formato.
  • 19. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 19 Ejemplo entrada Genbank
  • 20. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 20 Ejemplo entrada EMBL
  • 21. ula ientífica Introducción a la BioinformáticaIntroducción a la Bioinformática 21 Información sobre los formatos de las bases de datos