SlideShare una empresa de Scribd logo
5
Lo más leído
6
Lo más leído
7
Lo más leído
Bases de datos del
NCBI
B I O I N F O R M Á T I C A
NCBI
NATIONAL CENTER FOR
BIOTECHNOLOGY
INFORMATION
Fue creado en 1988 con el fin de desarrollar
sistemas de información para la biología
molecular. Este centro contiene 35 bases de datos
que juntas mantienen 3.6 millones de registros.
Cada base de datos apoya el texto utilizando la
descarga en varios formatos y enlazando las bases
de datos usando palabras relacionadas.
Bases de datos sobre literatura
P U B M E D
C E N T R A L
Artículos completos.
7325415
registros
P U B M E D
Referencias/resume
nes científicos y
médicos.
33027761
registros
N L M
C A T A L O G
índice de colecciones
de NLM
1629799
registros
B O O K S H E L F
Libros y reportes
892126 registros
M E S H
Ontología utilizada
para los índices de
PubMed.
348370 registros
1 2 3 4 5
Bases de datos de
genomas y su
número de registros
4 D E S E P T I E M B R E D E L 2 0 2 1
La base de datos Nucleotide
almacena secuencias del GenBank y
RefSeq, mientras que BioSample tiene
descripciones de material de origen
biológico. Las funciones de estas bases
de datos incluyen clasificaciones
taxonómicas, información sobre
ensamblaje de genomas, proyectos de
secuenciación, etc.
N
u
c
l
e
o
t
i
d
e
B
i
o
S
a
m
p
l
e
S
R
A
T
a
x
o
n
o
m
y
A
s
s
e
m
b
l
y
B
i
o
p
r
o
j
e
c
t
500,000,000
400,000,000
300,000,000
200,000,000
100,000,000
0
Bases de datos de
genes
D E L N C B I
GEO Profiles
Perfiles de expresión de genes y su abundancia molecular
Gene
Colecciona información sobre los loci de los genes.
GEO DataSets
Estudios de genónmica funcional
PopSet
Secuencias de estudios filogenéticos o de población.
HomoloGene
Colección de genes homólogos para organismos
seleccionados.
Bases de datos de
proteínas
D E L N C B I
Secuencias de proteínas
agrupadas por identidad.
Secuencias de proteínas
agrupadas en clusters basados
en similitud.
Protein
Secuencias de proteínas del
GenBank y RefSeq
Identical Protein Groups
Protein Clusters
Estructuras biomoleculares
determinadas
experimentalmente.
Structure
Arquitecturas de dominios
conservados, HMMs y
BlastRules
Protein Family Models
Dominios conservados de
proteinas.
Conserved Domains
Bases de datos
clínicos
dbSNP: variaciones genéticas cortas.
dbVar: Estudios de variación estructural
del genoma.
ClinVar: Variaciones humanas de
significado clínico.
ClinicTrials.gov: Registro de estudios
clínicos y base de datos de resultados.
Bases de datos
de químicos
PubChem Substance: Sustancias
depositadas e información química.
PubChem Compound: Información
química con estructuras, información y
links.
PubChem BioAssay: Estudios de
bioactividad.
RefSeq database
Esta base de datos ha servido para almacenar genomas
de referencia anotados, que sean estables y validados,
además de transcritos y proteínas para organismos ya sea
virus, microbios, organelos, eucariotas....
Esto ha permitido a los investigadores enfocarse en las
secuencias representativas en contraste con la información
redundante que proporciona GenBank, y proporciona
secuencias específicas de referencia sin ambigüedad.
Los datos de RefSeq pueden encontrarse en otras bases
de datos como Nucleotide, Protein y BLAST, utilizando esa
palabra clave.
Es una base de datos pública de secuencias
nucleotídicas apoyada en información bibliográfica y
por anotación biológica.
Le asigna a cada registro un número de acceso que
puede ser utilizado en varias bases de datos. Este
permanece constante.
Esta base de datos divide las secuencias según su
origen taxonómico usado para extraer la
información.
GenBank database
¿Por qué usar cada uno?
S E G Ú N E L O R G A N I S M O Q U E S E D E S E A I N V E S T I G A R E S I M P O R T A N T E E L E G I R L A B A S E
D E D A T O S I N D I C A D A .
GenBank contiene secuencias de un amplio número de organismos. Se pueden encontrar secuencias
de cualquier organismo que esté registrado (121,461 especies)
RefSeq está limitado a organismos que tienen información suficiente disponible (aprox 504 mil
especies).
GenBank almacena secuencias redundantes (secuencias idénticas con distintos números de registro)
mientras que RefSeq no.
Se puede decir que RefSeq tiene información más estable, pero si se busca información sobre un
organismo que no sea popular o de importancia biotecnológica, es posible que GenBank sea la mejor
opción.
Literatura consultada
Coordinators, N. R. (2016). Database resources of the national
center for biotechnology information. Nucleic acids research,
44(Database issue), D7.
O'Leary, N. A., Wright, M. W., Brister, J. R., Ciufo, S., Haddad, D.,
McVeigh, R., ... & Pruitt, K. D. (2016). Reference sequence (RefSeq)
database at NCBI: current status, taxonomic expansion, and
functional annotation. Nucleic acids research, 44(D1), D733-D745.
Sayers, E. W., Cavanaugh, M., Clark, K., Ostell, J., Pruitt, K. D., &
Karsch-Mizrachi, I. (2019). GenBank. Nucleic acids research, 47(D1),
D94-D99.

Más contenido relacionado

PPTX
Camara de recuento neubauer
PDF
Extraccion de adn
PDF
Clase 04 CIENCIAS ÓMICAS: BIOINFORMÁTICA, GENÓMICA, PROTEÓMICA, TRANCRIPTÓMIC...
PPTX
Clase 4 determinacion del sexo y herencia ligada al sexo
PPT
GENETICA HUMANA
PPTX
Secuenciación de ADN
PPT
C:\Users\Departamento B\Desktop\Mutaciones CromosóMicas Daniel V Y Ana
ODT
Material genético y cromosomas. Cariotipo
Camara de recuento neubauer
Extraccion de adn
Clase 04 CIENCIAS ÓMICAS: BIOINFORMÁTICA, GENÓMICA, PROTEÓMICA, TRANCRIPTÓMIC...
Clase 4 determinacion del sexo y herencia ligada al sexo
GENETICA HUMANA
Secuenciación de ADN
C:\Users\Departamento B\Desktop\Mutaciones CromosóMicas Daniel V Y Ana
Material genético y cromosomas. Cariotipo

La actualidad más candente (20)

PPTX
Clasificación enfermedades genéticas
PDF
Protozoarios
PPTX
Diseño primers
PDF
Reporte de la Práctica de grupos sanguíneos grupo 5179
PPS
Herencia+y+analisis+de+pedigrí+2013.ppt
PPTX
Exposicion de genetica herencia ligada al sexo
PDF
Variacion en la expresion (Genetica Medica)
PDF
Genoma humano (diapositivas)
PPTX
Genes dominantes y reccesivos
PPTX
Tecnicas de Bandeo Cromosomico
PPTX
Diversidad microbiana
PPTX
Genetica microbiana I
PPTX
Bioquimica Importancia y Relacion
DOC
Examen de-biologia-molecular
PPT
PDF
PDF
Alelos multiples y herencia poligenica
ODP
Determinacion del sexo
PPSX
1 Inmunohematologia
ODT
Estudio del cariotipo humano
Clasificación enfermedades genéticas
Protozoarios
Diseño primers
Reporte de la Práctica de grupos sanguíneos grupo 5179
Herencia+y+analisis+de+pedigrí+2013.ppt
Exposicion de genetica herencia ligada al sexo
Variacion en la expresion (Genetica Medica)
Genoma humano (diapositivas)
Genes dominantes y reccesivos
Tecnicas de Bandeo Cromosomico
Diversidad microbiana
Genetica microbiana I
Bioquimica Importancia y Relacion
Examen de-biologia-molecular
Alelos multiples y herencia poligenica
Determinacion del sexo
1 Inmunohematologia
Estudio del cariotipo humano
Publicidad

Similar a Bases de datos del NCBI (20)

PDF
PDF
Libro herramientas de_internet
PDF
Practica 1 analisis de secuencias del gen16 s
PDF
Caracteristicas de las bases de datos Refseq y Genbank.pdf
PPTX
Sistemas de informacion
PDF
1_Bases de datos_biologicas_secuencias.pdf
PDF
Practica 1 analisis de secuencias del gen 16 s
PPTX
BIOINFORMATICA (2).pptx
PDF
Evaluación de Tecnologías Sanitarias. Manejo de Bases de Datos
PDF
Montaje de la estructura del ADN
PPT
Bases de datos
PPT
Bases de datos
PPT
Biobancos y bancos de cerebro congreso slap
PDF
Diccionario inglés español de bioquímica y biología
PPT
Las multiples caras de la bioinformatica
PDF
Bases de Datos NCBI
DOCX
Bases de Datos
PPTX
EL PROYECTO GENOMA HUMANO embriología(1).pptx
PPTX
Bases de datos secundarias|12345678.pptx
PPT
Introduccion3 bc
Libro herramientas de_internet
Practica 1 analisis de secuencias del gen16 s
Caracteristicas de las bases de datos Refseq y Genbank.pdf
Sistemas de informacion
1_Bases de datos_biologicas_secuencias.pdf
Practica 1 analisis de secuencias del gen 16 s
BIOINFORMATICA (2).pptx
Evaluación de Tecnologías Sanitarias. Manejo de Bases de Datos
Montaje de la estructura del ADN
Bases de datos
Bases de datos
Biobancos y bancos de cerebro congreso slap
Diccionario inglés español de bioquímica y biología
Las multiples caras de la bioinformatica
Bases de Datos NCBI
Bases de Datos
EL PROYECTO GENOMA HUMANO embriología(1).pptx
Bases de datos secundarias|12345678.pptx
Introduccion3 bc
Publicidad

Último (20)

PDF
Audicion, sonido del viaje como los sonidos viajan
PPTX
Clase de Educación sobre Salud Sexual.pptx
PDF
ATLAS DEL SITEMA NERVIOSO para el cu.pdf
PDF
Generalidades morfológicas de los Hongos
PPTX
Radiografía_de_Abdomen_Imagenología.pptx
PPTX
VENTILACIÓN MECÁNICA NO INVASIVA Y CÁNULA NASAL DE.pptx
PPTX
Resucitacion cardiopulmonar en pacientes
PDF
Presentación Propuesta de Proyecto Portfolio Scrapbook Marrón y Negro.pdf
PPTX
Aborto exposicion.pptxdsaaaaaaaaaaaaaaaaaaaaaaaaaa
PPTX
Clase 1 Física 3 introductoria para estudiantes universitarios
PPTX
Propiedades fisicoquímicas y simulaciones de dinámica molecular de disolvente...
PDF
TEJIDO CARTILAGINOSO. HISTOFISIOLOGÍA. .
PPT
SISTEMA_TEGUMENTARIO LIC VANESSA BORJA.ppt
PPTX
Intoxicación por artrópodos picadores y pulgas
PPTX
Ciencia moderna. origen y características.
PDF
Anatomía y fisiología; un estudio del cuerpo humani
PDF
Fisiología Humana I Aparato Digestivo.pdf
PPTX
El ciclo del agua en colombia y su magnitud
PDF
BIOQ1054 Introduccion a la Fisiología vegetal (1).pdf
PPTX
Formulación de Objetivos en Investigaciones Cuantitativas.pptx
Audicion, sonido del viaje como los sonidos viajan
Clase de Educación sobre Salud Sexual.pptx
ATLAS DEL SITEMA NERVIOSO para el cu.pdf
Generalidades morfológicas de los Hongos
Radiografía_de_Abdomen_Imagenología.pptx
VENTILACIÓN MECÁNICA NO INVASIVA Y CÁNULA NASAL DE.pptx
Resucitacion cardiopulmonar en pacientes
Presentación Propuesta de Proyecto Portfolio Scrapbook Marrón y Negro.pdf
Aborto exposicion.pptxdsaaaaaaaaaaaaaaaaaaaaaaaaaa
Clase 1 Física 3 introductoria para estudiantes universitarios
Propiedades fisicoquímicas y simulaciones de dinámica molecular de disolvente...
TEJIDO CARTILAGINOSO. HISTOFISIOLOGÍA. .
SISTEMA_TEGUMENTARIO LIC VANESSA BORJA.ppt
Intoxicación por artrópodos picadores y pulgas
Ciencia moderna. origen y características.
Anatomía y fisiología; un estudio del cuerpo humani
Fisiología Humana I Aparato Digestivo.pdf
El ciclo del agua en colombia y su magnitud
BIOQ1054 Introduccion a la Fisiología vegetal (1).pdf
Formulación de Objetivos en Investigaciones Cuantitativas.pptx

Bases de datos del NCBI

  • 1. Bases de datos del NCBI B I O I N F O R M Á T I C A
  • 2. NCBI NATIONAL CENTER FOR BIOTECHNOLOGY INFORMATION Fue creado en 1988 con el fin de desarrollar sistemas de información para la biología molecular. Este centro contiene 35 bases de datos que juntas mantienen 3.6 millones de registros. Cada base de datos apoya el texto utilizando la descarga en varios formatos y enlazando las bases de datos usando palabras relacionadas.
  • 3. Bases de datos sobre literatura P U B M E D C E N T R A L Artículos completos. 7325415 registros P U B M E D Referencias/resume nes científicos y médicos. 33027761 registros N L M C A T A L O G índice de colecciones de NLM 1629799 registros B O O K S H E L F Libros y reportes 892126 registros M E S H Ontología utilizada para los índices de PubMed. 348370 registros 1 2 3 4 5
  • 4. Bases de datos de genomas y su número de registros 4 D E S E P T I E M B R E D E L 2 0 2 1 La base de datos Nucleotide almacena secuencias del GenBank y RefSeq, mientras que BioSample tiene descripciones de material de origen biológico. Las funciones de estas bases de datos incluyen clasificaciones taxonómicas, información sobre ensamblaje de genomas, proyectos de secuenciación, etc. N u c l e o t i d e B i o S a m p l e S R A T a x o n o m y A s s e m b l y B i o p r o j e c t 500,000,000 400,000,000 300,000,000 200,000,000 100,000,000 0
  • 5. Bases de datos de genes D E L N C B I GEO Profiles Perfiles de expresión de genes y su abundancia molecular Gene Colecciona información sobre los loci de los genes. GEO DataSets Estudios de genónmica funcional PopSet Secuencias de estudios filogenéticos o de población. HomoloGene Colección de genes homólogos para organismos seleccionados.
  • 6. Bases de datos de proteínas D E L N C B I Secuencias de proteínas agrupadas por identidad. Secuencias de proteínas agrupadas en clusters basados en similitud. Protein Secuencias de proteínas del GenBank y RefSeq Identical Protein Groups Protein Clusters Estructuras biomoleculares determinadas experimentalmente. Structure Arquitecturas de dominios conservados, HMMs y BlastRules Protein Family Models Dominios conservados de proteinas. Conserved Domains
  • 7. Bases de datos clínicos dbSNP: variaciones genéticas cortas. dbVar: Estudios de variación estructural del genoma. ClinVar: Variaciones humanas de significado clínico. ClinicTrials.gov: Registro de estudios clínicos y base de datos de resultados. Bases de datos de químicos PubChem Substance: Sustancias depositadas e información química. PubChem Compound: Información química con estructuras, información y links. PubChem BioAssay: Estudios de bioactividad.
  • 8. RefSeq database Esta base de datos ha servido para almacenar genomas de referencia anotados, que sean estables y validados, además de transcritos y proteínas para organismos ya sea virus, microbios, organelos, eucariotas.... Esto ha permitido a los investigadores enfocarse en las secuencias representativas en contraste con la información redundante que proporciona GenBank, y proporciona secuencias específicas de referencia sin ambigüedad. Los datos de RefSeq pueden encontrarse en otras bases de datos como Nucleotide, Protein y BLAST, utilizando esa palabra clave.
  • 9. Es una base de datos pública de secuencias nucleotídicas apoyada en información bibliográfica y por anotación biológica. Le asigna a cada registro un número de acceso que puede ser utilizado en varias bases de datos. Este permanece constante. Esta base de datos divide las secuencias según su origen taxonómico usado para extraer la información. GenBank database
  • 10. ¿Por qué usar cada uno? S E G Ú N E L O R G A N I S M O Q U E S E D E S E A I N V E S T I G A R E S I M P O R T A N T E E L E G I R L A B A S E D E D A T O S I N D I C A D A . GenBank contiene secuencias de un amplio número de organismos. Se pueden encontrar secuencias de cualquier organismo que esté registrado (121,461 especies) RefSeq está limitado a organismos que tienen información suficiente disponible (aprox 504 mil especies). GenBank almacena secuencias redundantes (secuencias idénticas con distintos números de registro) mientras que RefSeq no. Se puede decir que RefSeq tiene información más estable, pero si se busca información sobre un organismo que no sea popular o de importancia biotecnológica, es posible que GenBank sea la mejor opción.
  • 11. Literatura consultada Coordinators, N. R. (2016). Database resources of the national center for biotechnology information. Nucleic acids research, 44(Database issue), D7. O'Leary, N. A., Wright, M. W., Brister, J. R., Ciufo, S., Haddad, D., McVeigh, R., ... & Pruitt, K. D. (2016). Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic acids research, 44(D1), D733-D745. Sayers, E. W., Cavanaugh, M., Clark, K., Ostell, J., Pruitt, K. D., & Karsch-Mizrachi, I. (2019). GenBank. Nucleic acids research, 47(D1), D94-D99.