SlideShare una empresa de Scribd logo
INTERNET PROFUNDA E
INVISIBLE
Internet Invisible
• En el contenido de la Web
pueden distinguirse dos
partes:
- Web Superficial
(SurfaceWeb)
- Web Profunda (DeepWeb)
La web Superficial
• Es lo que se conoce como
WWW:
- Está compuesta por un conjunto
de páginas estáticas
públicamente accesibles.
- Constituye una porción
relativamente muy pequeña de
toda la Web (un 17%
aproximadamente).
- La información que se recupera
debe ser cuidadosamente
evaluada y validada.
La Web Profunda
• Se conoce como Web
Invisible y se compone de:
- Contenidos dinámicos:
páginas dinámicas que
retornan en respuesta a una
búsqueda o accedidas sólo
por una vía.
- Contenidos no enlazados:
páginas que no tienen
vínculos entrantes desde otras
páginas.
La intenet Profunda
- Contenidos de acceso limitado:
que requieren registrarse o que
limitan el acceso a sus páginas,
prohibiendo que los buscadores
los incluyan en sus bases de datos.
- Contenidos “scripted”: páginas
que solamente son accesibles a
través de enlaces producidos por
JavaScript y Flash, las cuales
requieren un tratamiento
especial.
- Contenidos no textuales: archivos
multimedia, en otros formatos o
“usenet”
Clasificación de La Web Profunda
OPACA
PROPIETARIA
PRIVADA
REALMENTE
INVISIBLE
Web…
La Web Opaca
• Se compone de todas aquellas páginas que son
excluidas por:
- extensión de la indización: por economía, no todas
las páginas de un sitio son indizadas en los
buscadores.
- Frecuencia de la indización: los buscadores
indexan de forma periódica y la WWW cambia
diariamente.
- Número máximo de resultados visibles: se limita
a los 200 y 1000 documentos, si bien el número de
resultados es mayor.
- URL’s desconectados: los buscadores presentan
los resultados en base a la cantidad de referencias o
enlaces a los sitios, caso contrario la página no será
indizada.
La Web Privada
• Las páginas Web son excluidas
por alguna de estas causas:
- Se encuentran protegidas por
contraseñas.
- Contienen un archivo
“robots.txt” para evitar ser
indizadas.
- Contienen un campo
“noindex” para evitar que el
buscador indice la parte
correspondiente al cuerpo de
la página.
La Web Propietaria
• Incluye aquellas páginas en
las que es necesario
registrarse para tener
acceso al contenido, ya sea
de forma gratuita o
pagada. Se dice que al
menos 95% de la web
profunda contiene
información de acceso
público y gratuito.
La Web realmente invisible
• Las páginas no son indizadas por
las siguientes razones:
- Incluyen formatos como PDF,
PostScript, Flash, Shockwave,
programas ejecutables y archivos
comprimidos.
- Se generan dinámicamente, a
partir de datos que introduce el
usuario.
- Almacenan la información en
bases de datos, que no puede ser
extraída a menos que se realice
una petición específica.
¿Cómo buscar en la Web
invisible?
- Los buscadores tradicionales
han añadido funcionalidades
adicionales para la búsqueda
en la llamada Web profunda.
- También existen buscadores
especializados en ese
segmento de la Web, que no
sólo buscan en la Web
superficial, sino también en la
Web Invisible.
Forman parte de la Web profunda
- Las bibliotecas: digitales,
catálogos de bibliotecas, bases
de datos de bibliotecas, bases
de datos bibliográficas.
- Bases de datos.
- Revistas electrónicas y archivos
de documentos.
- Documentos en formatos no
indizables, (pdf, ppt, doc, mp3,
wav, avi, mpeg, etc.)
- Catálogos de editoriales,
Directorios de Publicaciones
periódicas.
Forman parte de la Web profunda
- Archivos (instituciones y
organismos de gobierno).
- Repositorios de artículos de
revistas, tesis y literatura gris.
- Directorios de bases de datos
- Guías de sitios, Revistas
electrónicas, Obras de
referencia: enciclopedias,
diccionarios, tesauros, etc.
- Foro, Blogs, Noticias (diarios).
- Sitios de remates, Paginas
blancas/amarillas, Directorios
Forman parte de la Web profunda
- Revistas electrónicas, en las
que es necesario un registro
previo y las que sólo se puede
recuperar la información
mediante búsquedas en su
base de datos.
- Organismos públicos de
gobierno, ONGs, etc., que en
sus sitios web disponen de
consultas a sus bases de
datos.
El archivo de Internet
- Asume el reto de preservar el
pasado de Internet
- La mayor parte de la
información que contiene es
estadounidense.
- Se ingresa a través del sitio:
http://www.archive.org/inde
x.php
- De sus secciones se destaca
Wayback MAchine, que
contiene miles de millones de
páginas, grabadas desde
1996

Más contenido relacionado

PPTX
Diferencias entre sitio web y portal web
PPTX
Sitios paginas web
DOCX
cuadro comparativo
DOCX
PPT
Presentacion de pagina wep
DOCX
Portales Web tarea 1
PPTX
Grupo x
Diferencias entre sitio web y portal web
Sitios paginas web
cuadro comparativo
Presentacion de pagina wep
Portales Web tarea 1
Grupo x

La actualidad más candente (17)

PPTX
Diferencia entre pagina web y sitios web
DOCX
Tema de exposición 3
PPTX
Sitios web paginas web
DOCX
1. terminologia: conceptos basicos
PPTX
Online y Wikis
PPTX
PPTX
Pagina web
PPT
tarea 5
DOC
Trabajo práctico de redes
PPTX
Steven lazo
PPTX
Pagina web
PPTX
Manulka3
PPTX
Arles
PPTX
Datos vinculados bibliotecarios la web 3.0 en las bibliotecas
PPT
Tipos de Sitios: Arquitectura
PPTX
Informatica la pagina web
PPTX
Grupo x
Diferencia entre pagina web y sitios web
Tema de exposición 3
Sitios web paginas web
1. terminologia: conceptos basicos
Online y Wikis
Pagina web
tarea 5
Trabajo práctico de redes
Steven lazo
Pagina web
Manulka3
Arles
Datos vinculados bibliotecarios la web 3.0 en las bibliotecas
Tipos de Sitios: Arquitectura
Informatica la pagina web
Grupo x
Publicidad

Similar a Intenet profunda (20)

PPT
Web Visible Invisible
PPTX
Deepweb
PPTX
ANALISIS DE INTERNET PROFUNDO E INVISIBLE
PPT
internet invisible
PPTX
ANÁLISIS RESUMIDO DE LA EDITORIAL DE TARINGA "LA INTERNET PROFUNDA O INVISIBLE"
PPTX
Web Superficial y Web Profunda
PPTX
LECTURA SOBRE LA INTERNET PROFUNDA O INVISIBLE
PPT
Web Visible Web Invisible
PPTX
Web superficial y web profunda
PDF
Clase 3 investigación en internet
PPT
Clase 2 tecno i- periodismo 2015
PDF
Web superficial y profunda
PPTX
Internet y la web superficial y profunda
PPT
Clase 3 tecno i- comunicacion 2015
PPTX
Deep Web
PPTX
DEEP WEB
PPTX
Presentación deep web
PPTX
Presentaciã³n deep web
PPTX
Presentaciã³n deep web
PPTX
Presentación deep web
Web Visible Invisible
Deepweb
ANALISIS DE INTERNET PROFUNDO E INVISIBLE
internet invisible
ANÁLISIS RESUMIDO DE LA EDITORIAL DE TARINGA "LA INTERNET PROFUNDA O INVISIBLE"
Web Superficial y Web Profunda
LECTURA SOBRE LA INTERNET PROFUNDA O INVISIBLE
Web Visible Web Invisible
Web superficial y web profunda
Clase 3 investigación en internet
Clase 2 tecno i- periodismo 2015
Web superficial y profunda
Internet y la web superficial y profunda
Clase 3 tecno i- comunicacion 2015
Deep Web
DEEP WEB
Presentación deep web
Presentaciã³n deep web
Presentaciã³n deep web
Presentación deep web
Publicidad

Más de sanderfree (7)

PPT
Proteccion del software
PPTX
Los delitos informaticos
PPT
Mas informacion y menos conocimiento
ODP
Aspectos metodologicos delitos informaticos
PPT
Delitos informaticos
PPT
Teletrabajo
PPTX
Informatica juridica 01
Proteccion del software
Los delitos informaticos
Mas informacion y menos conocimiento
Aspectos metodologicos delitos informaticos
Delitos informaticos
Teletrabajo
Informatica juridica 01

Último (15)

PPT
laser seguridad a la salud humana de piel y vision en laser clase 4
PPTX
Plantilla-Hardware-Informático-oficce.pptx
PDF
Frases de Fidel Castro. Compilación Norelys Morales Aguilera
PPTX
Evolución de la computadora ACTUALMENTE.pptx
PDF
[Ebook gratuito] Introducción a la IA Generativa, Instalación y Configuración...
PDF
CAPACITACIÓN MIPIG - MODELO INTEGRADO DE PLANEACIÓN Y GESTIÓN
PPTX
tema-2-interes-.pptx44444444444444444444
PDF
LA INTELIGENCIA ARTIFICAL SU HISTORIA Y EL FUTURO
PPTX
Guia de power bi de cero a avanzado detallado
PPTX
FUNCIONES DE CLASSROOM EN EL FUNCIONAMIENTO ESCOLAR
PDF
Mesopotamia y Egipto.pptx.pdf historia universal
PPTX
Presentación de un estudio de empresa pp
PPTX
Qué es Google Classroom Insertar SlideShare U 6.pptx
PDF
Herramientaa de google google keep, maps.pdf
PPTX
presentacion_energias_renovables_renovable_.pptx
laser seguridad a la salud humana de piel y vision en laser clase 4
Plantilla-Hardware-Informático-oficce.pptx
Frases de Fidel Castro. Compilación Norelys Morales Aguilera
Evolución de la computadora ACTUALMENTE.pptx
[Ebook gratuito] Introducción a la IA Generativa, Instalación y Configuración...
CAPACITACIÓN MIPIG - MODELO INTEGRADO DE PLANEACIÓN Y GESTIÓN
tema-2-interes-.pptx44444444444444444444
LA INTELIGENCIA ARTIFICAL SU HISTORIA Y EL FUTURO
Guia de power bi de cero a avanzado detallado
FUNCIONES DE CLASSROOM EN EL FUNCIONAMIENTO ESCOLAR
Mesopotamia y Egipto.pptx.pdf historia universal
Presentación de un estudio de empresa pp
Qué es Google Classroom Insertar SlideShare U 6.pptx
Herramientaa de google google keep, maps.pdf
presentacion_energias_renovables_renovable_.pptx

Intenet profunda

  • 2. Internet Invisible • En el contenido de la Web pueden distinguirse dos partes: - Web Superficial (SurfaceWeb) - Web Profunda (DeepWeb)
  • 3. La web Superficial • Es lo que se conoce como WWW: - Está compuesta por un conjunto de páginas estáticas públicamente accesibles. - Constituye una porción relativamente muy pequeña de toda la Web (un 17% aproximadamente). - La información que se recupera debe ser cuidadosamente evaluada y validada.
  • 4. La Web Profunda • Se conoce como Web Invisible y se compone de: - Contenidos dinámicos: páginas dinámicas que retornan en respuesta a una búsqueda o accedidas sólo por una vía. - Contenidos no enlazados: páginas que no tienen vínculos entrantes desde otras páginas.
  • 5. La intenet Profunda - Contenidos de acceso limitado: que requieren registrarse o que limitan el acceso a sus páginas, prohibiendo que los buscadores los incluyan en sus bases de datos. - Contenidos “scripted”: páginas que solamente son accesibles a través de enlaces producidos por JavaScript y Flash, las cuales requieren un tratamiento especial. - Contenidos no textuales: archivos multimedia, en otros formatos o “usenet”
  • 6. Clasificación de La Web Profunda OPACA PROPIETARIA PRIVADA REALMENTE INVISIBLE Web…
  • 7. La Web Opaca • Se compone de todas aquellas páginas que son excluidas por: - extensión de la indización: por economía, no todas las páginas de un sitio son indizadas en los buscadores. - Frecuencia de la indización: los buscadores indexan de forma periódica y la WWW cambia diariamente. - Número máximo de resultados visibles: se limita a los 200 y 1000 documentos, si bien el número de resultados es mayor. - URL’s desconectados: los buscadores presentan los resultados en base a la cantidad de referencias o enlaces a los sitios, caso contrario la página no será indizada.
  • 8. La Web Privada • Las páginas Web son excluidas por alguna de estas causas: - Se encuentran protegidas por contraseñas. - Contienen un archivo “robots.txt” para evitar ser indizadas. - Contienen un campo “noindex” para evitar que el buscador indice la parte correspondiente al cuerpo de la página.
  • 9. La Web Propietaria • Incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la web profunda contiene información de acceso público y gratuito.
  • 10. La Web realmente invisible • Las páginas no son indizadas por las siguientes razones: - Incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos. - Se generan dinámicamente, a partir de datos que introduce el usuario. - Almacenan la información en bases de datos, que no puede ser extraída a menos que se realice una petición específica.
  • 11. ¿Cómo buscar en la Web invisible? - Los buscadores tradicionales han añadido funcionalidades adicionales para la búsqueda en la llamada Web profunda. - También existen buscadores especializados en ese segmento de la Web, que no sólo buscan en la Web superficial, sino también en la Web Invisible.
  • 12. Forman parte de la Web profunda - Las bibliotecas: digitales, catálogos de bibliotecas, bases de datos de bibliotecas, bases de datos bibliográficas. - Bases de datos. - Revistas electrónicas y archivos de documentos. - Documentos en formatos no indizables, (pdf, ppt, doc, mp3, wav, avi, mpeg, etc.) - Catálogos de editoriales, Directorios de Publicaciones periódicas.
  • 13. Forman parte de la Web profunda - Archivos (instituciones y organismos de gobierno). - Repositorios de artículos de revistas, tesis y literatura gris. - Directorios de bases de datos - Guías de sitios, Revistas electrónicas, Obras de referencia: enciclopedias, diccionarios, tesauros, etc. - Foro, Blogs, Noticias (diarios). - Sitios de remates, Paginas blancas/amarillas, Directorios
  • 14. Forman parte de la Web profunda - Revistas electrónicas, en las que es necesario un registro previo y las que sólo se puede recuperar la información mediante búsquedas en su base de datos. - Organismos públicos de gobierno, ONGs, etc., que en sus sitios web disponen de consultas a sus bases de datos.
  • 15. El archivo de Internet - Asume el reto de preservar el pasado de Internet - La mayor parte de la información que contiene es estadounidense. - Se ingresa a través del sitio: http://www.archive.org/inde x.php - De sus secciones se destaca Wayback MAchine, que contiene miles de millones de páginas, grabadas desde 1996

Notas del editor

  • #5: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #6: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #7: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #8: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #9: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #10: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #11: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #12: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #13: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #14: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #15: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.
  • #16: Según estudios de BrightPlanet La información pública de la Web Profunda es actualmente alrededor de 550 veces mayor que la de laWeb Superficial. LaWeb Profunda contiene 7,500 terabytes de información comparado con 19 terabytes en laWeb Superficial. Las 60 fuentes más grandes de la Web Profunda(84 000 millones de páginas) tienen 750 Tby son 40 veces más grandes que la Web Superficial. La Web Profunda tiene el mayor crecimiento de nueva información en Internet. Más de la mitad del contenido de la Web Profunda reside en bases de datos específicas. La calidad del contenido de laWeb Profunda es considerada mucho mayor que la de la Web Superficial. •El 95% de la información de laWeb Profunda es información totalmente pública, libre de subscripciones y tarifas.