SlideShare una empresa de Scribd logo
La Web Semántica¡Colaboremos todos juntos para un ‘futuro web’ más cómodo!Javier Porras Castaño05/07/2010Máster Oficial en Tecnologías de la Información y Sistemas InformáticosSistemas Multiagente1
¿Por qué elegir este tema?.Situación y Problemas de la Web Actual.Solución: La Web Semántica.Tecnologías que le darán soporte.¿Qué se hace en la actualidad (linked data)?Proyecto para aplicarlo en mi trabajo.Agenda2
Descubrí el término de Web Semántica, por primera vez en la asignatura.“Proporciona un entorno donde los agentes de software (aplicaciones) viajarán de página en página para satisfacer las necesidades de los usuarios (petición de información) de forma automática y sin intervención de éstos”.¿Cómo se lleva a cabo?¿Por qué he elegido este tema?3
Hoy día, casi cualquier información se puede encontrar en Internet.Se ha mitificado, si no está en la red, no existe.Muy difícil medir el tamaño de la Web: entre 14 y 28 millones de libros: mucha información.Gracias a los buscadores, encontramos información.A un golpe de clic: información, compra de productos, servicios, formación, trabajo…Situación de la Web Actual4
Esta abundancia de información ocasiona problemas.La información en la Web es heterogénea.Las páginas están escritas en HTML: sólo es semánticamente entendible por humanos.Al carecer de una semántica explícita, no se pueden automatizar procesos.Situación de la Web Actual5
Los dos problemas más significativos de la Web actual son:1) La dificultad para encontrar información2) El intercambio de información entre distintos sistemas.Problemas de la Web actual6
La Web actual carece de semántica.Por tanto, no existe una infraestructura software que haga que la información pueda ser entendida por máquinas.Ejemplo: búsqueda de los bancos existentes en España: introduce banco. Responde: entidades financieras, asientos, bancos de peces…; pone de manifiesto que no entiende lo que se le pide.El usuario sabe qué tipos de bancos busca, pero no tiene forma de indicarlo de forma explícita al buscador.1) Dificultad encontrar información7
Los buscadores buscan por palabras claves (por coincidencia): un problema con las palabras polisémicas o sinónimas.Consecuencia: debemos leer muchas páginas hasta encontrar lo que buscamos: pérdida de tiempo.Si hubiese semántica, los buscadores encontraría no sólo lo que le pedimos, sino todo lo relacionado (sinónimos).El problema está en el lenguaje HTML: sólo indica como se debe mostrar la información pero no ofrece mecanismos para indicar semántica.1) Dificultad encontrar información8
En conclusión, el usuario que busca información en la Web tiene dos problemas:1)Escasa precisión de los resultados.2)Alta   sensibilidad 	al vocabulario empleado en la búsqueda.Solución: añadir metadatos: información que describe los contenidos que muestra la página.1) Dificultad encontrar información9
Ejemplo: queremos comprar una impresora a través de la Red; buscamos modelo y precio.Si cada tienda virtual, incluyese un metadato Precio por cada impresora, los navegadores tendrían más fácil su trabajo. Las páginas que tengan el modelo de impresora pero no el metadato Precio, no serían devuelta como resultado.Es imposible que todas las tiendas virtuales del mundo utilicen como metadato Precio (puede ser, Coste, Precio, Price, Prix….)Los metadatos son necesarios, pero no suficientes.1) Dificultad encontrar información10
Por tanto, para realizar búsquedas eficientes de información, se requiere:1) Incluir metadatos2) Que los metadatos sean comunes para todos los portales (ejemplo Precio). El navegador debe saber que los metadatos Precio, Coste, Valor, Price, Prix… hacen referencia al mismo metadato).1) Dificultad encontrar información11
En la Web actual no existen mecanismos para la interoperabilidad completa de distintos sistemas de informaciónDesde hace algunos años el principal reto de las empresas es el intercambio de información con otras.Las Web actúa como un medio de transporte barato, pero no proporciona ningún protocolo de intercambio.2) Intercambio de información12
En la actualidad el entendimiento entre empresas, es mediante una persona humana que interpreta los documentos de la empresa origen, con un previo acuerdo.Que una empresa haga un pedido a otra vía Web, no tiene ninguna diferencia con hacerlo de forma telefónica o fax. Al final requiere de que una persona humana lo interprete y lo lleve a cabo.Lo ideal sería: que una empresa haga de forma automática pedidos a otra empresa.Ahorro de coste, evitar errores humanos en la interpretación.2) Intercambio de información13
La Web actual presenta un problema de comunicación e interoperabilidad entre los sistemas de información de distintas empresas.Solución: Crear estructuras de información comunes a un mismo dominio, compartidos por todas.Un concepto debe ser entendido o interpretados por todas de la misma manera.Llevarlo a cabo es muy difícil: poner a todas las empresas de acuerdo es complejo.2) Intercambio de información14
La Web SemánticaPretende añadir metadatos a la Web para que las máquinas comprendan el significado de las mismas (semántica).Solución15
Para los humanos comprender un signo o una palabra no es nada extraordinario.De forma automática y sin esfuerzo.Por sí solas, las palabras son manchas negras en una pantalla o en un papel.Si toman sentido o significado es porque nuestro cerebro se lo otorga.La Web semántica no pretende que las máquinas comprendan como lo hacen los humanos, sino que sean capaces de inferir o deducir conocimiento a partir de una información.La Web Semántica16
No se debe confundir “deducir o inferir” con inteligencia.Que las máquinas sean inteligentes es algo que todavía no se puede conseguir y la Web Semántica no lo pretende.Tan sólo pretende que sea capaz de aplicar reglas lógicas sobre un dominio de conocimiento para deducir o inferir conocimiento.La Web Semántica17
Ejemplo:A una máquina se le programa la regla lógica: “Toda persona es un ser vivo”La máquina debería deducir que si Luis es una persona, también es un ser vivo.La máquina NO es inteligente, sólo aplica reglas lógicas para obtener conocimiento.No hay inteligencia: nunca sabrá que es una persona, y no podrá deducir nada que no se derive de las reglas lógicas.La Web Semántica18
Habilidad de la máquina para resolver un problema bien definido, con operaciones bien definidas sobre datos bien definidos.En lugar de pedir a las máquinas que entiendan el lenguaje humano, prefiere pedir a la gente que hagan un esfuerzo.Representar la información en algún lenguaje formal para extraer inferencia lógica.La Web Semántica19
Base de la Web Semántica1) Permite desarrollar lenguajes formales a través de los cuales podemos representar el conocimiento.2) Proporciona semántica bien definida: cada símbolo o expresión tienen significado único, sin ambigüedad ni contradicciones.3) Proporciona reglas de inferencia, para extraer el conocimiento.Lógica Descriptiva20
La Web Semántica pretende:La interpretación semántica automática de documentos:Consiste en la aplicación de reglas lógicas a unos datos representados en un lenguaje formal para extraer el conocimiento.Lógica Descriptiva21
¿Por qué DL fue escogido como la mejor opción para modelar lógica?Existen muchas formas de representar el conocimiento: redes semánticas, frames…Se elige DL porque está dotada con una semántica formal.Permite definir semántica o metainformación sobre un dominio, de una manera formal.Lógica Descriptiva22
Se adapta perfectamente al concepto de ontología.Herramienta base de la Web Semántica: define los términos y relaciones que representan un dominio o área de información.Clases, Relaciones e Instancias.Permite especificar formalmente las propiedades de los individuos del dominio y las relaciones entre conceptos:Bases de conocimiento.Lógica Descriptiva23
1) Permitirá realizar búsquedas como:“Busco todos los mecánicos que tengan su taller a menos de 1 kilómetros de la calle Cayetano Ordoñez (mi calle) y que trabajen para la compañía se Seguros Mafre”.2) Permitirá el uso de agentes personales encargados de extraer información de múltiples fuentes heterogéneas.Por ejemplo, un agente personal para que me informe de las fechas de los conciertos de Alejandro Sanz o lanzamiento de un nuevo disco.3) Ante una búsqueda devolverá como resultado todos los conceptos relacionados (ejemplos sinónimos)La Web Semántica del futuro24
La Web Semántica del futuro25
Capas de la Web Semántica26
Asegura la representación de un carácter y propone distintas maneras de codificarlo en binario.Asigna un único número a cada carácter.Contempla casi todos los idiomas.Permite la interoperabilidad entre sistemas: de cualquier dominio o contexto.Unicode: el alfabeto27
Identificadores uniformes de recursos.Permiten identificar todos los recursos de la Web Semántica.URI es más amplio y genérico que URL.PROTOCOLO: RUTA PÁGINA EN SERVIDOR ?SOLICITUD#FRAGMENTOLa principal diferencia es que las URI permiten identificar cualquier recurso dentro de la Web (formato). URI’s: las referencias28
El marcado de documentos es una forma primitiva de incluir semántica (metadatos).Etiquetas como <autor> o <precio> ayudan a que los humanos podamos intuir su significado.Para extraer la semántica del documento, hay que leer la DTD o el esquema XML; hoy día únicamente por personas humanas.Para un programa o una máquina las etiquetas carecen de significado.XML: el primer paso29
Para que las empresas intercambien información de forma automática previamente se han tenido que poner de acuerdo en utilizar los mismos DTD o esquemas XML.Por ejemplo, un sistema que acepte etiquetas <Precio>, no será capaz de interpretar y procesas etiquetas </PrecioUnidad>, aunque sean semánticamente equivalentes.Es necesario, pero no suficiente.XML: el primer paso30
Marco de descripción de recursos.Lenguaje para representar metadatos propuesto por W3C.Especificar semántica sobre los datos, utilizando XML.Permite intercambiar datos a través de diferentes aplicaciones sin que pierdan significado, lo que facilita la reutilización (linked data).RDF: El pegamento semántico31
Para definir la semántica, ¿por qué RDF y no XML?El modelo de un dominio puede representarse con varias DTD o varios esquemas XML, y una misma DTD o un esquema XML pueden corresponder a muchos modelos de sistemas de informaciónRDF: El pegamento semántico32
¿Por qué RDF y no XML?Javier compra la silla de referencia 120, en la compra identificada con elcódigo 11233
¿Por qué RDF y no XML?34
¿Por qué RDF y no XML?35
RDF es un modelo de metadatos para describir recursos.Permite:1) Describir recursos2) Intercambio de metadatos estructurados3) Reutilizar metadatos estructuradosEl W3C proponer RDF para describir recursos WebRDF: El pegamento semántico36
Para describir recursos se utiliza la tripleta: Recurso o sujeto, Propiedad o predicado y el Valor u objeto:RDF: El pegamento semántico37
El modelo de datos RDF proporciona un marco abstracto y conceptual para definir y utilizar metadatos, pero resultaría inútil sin una sintaxis concreta para crear e intercambiar metadatosSe trata de XML, y se denomina RDF/XMLRDF: El pegamento semántico38
RDF: El pegamento semántico39
El aula virtual del centro de profesorado (CEP) de Ronda (Málaga) ha sido creada por Javier Porras Castaño.RDF: El pegamento semántico40
RDF: El pegamento semántico41
RDF SchemaRDF no se asocia a ningún dominio en particular: se puede emplear en cualquier campo.	Cada persona u organización su propia terminología o vocabulario con RDFS.RDFS permite comprobar si un conjunto de tripletas (metadatos) es válido para ese esquema.42
RDF SchemaEjemplo: carece de sentido que la propiedad  “vendeAccionesEnBolsa” tenga como valor “color rojo”.RDFS especifica qué interpretación hay que dar a las sentencias de un modelo de datos RDF y dejan libre la representación sintáctica del modelo (en XML).Un esquema XML puede obligar a que las etiquetas <Producto> estén dentro de las de <Vendedor> pero carece de medios para indicar que hay una relación vende (con RDF sí).43
Un documento XML carece de semántica mientras que un documento RDF/XML sí posee.En XML la semántica aparece cuando un software procesa una etiqueta que previamente se ha acordado o definido.Sin embargo la semántica en RDFS (RDF/XML) aparece en el propio documento.RDF Schema44
RDF SchemaEn resumen, con RDFS podemos definir:1) Clases2) Jerarquía de clases3) Propiedades4) Jerarquía de propiedades5) Restricciones sobre los dominios y los rangos45
RDF SchemaGracias a RDF y RDFS, podemos codificar la semántica en un lenguaje formal que tiene como consecuencias, un conocimiento no ambigua y comprensible por máquinas.Con RDFS ya podemos decir que la Web comienza a tener semántica, por lo que se pueden automatizar tareas.46
Aplicación RDF y RDFSLa aplicación más conocida es RSS.RSS es un vocabulario RDF usado para describir información de manera que pueda ser reutilizada.Su objetivo es distribuir un conjunto de titulares de noticias, llamados canales.47
Aplicación RDF y RDFS48
RDFS tiene desventajas1) No se puede representar algunas características de propiedades: transitividad, simetría, inversa o única.2) No se puede reflejar que dos clases son disjuntas.3) No permiten reflejar restricciones de cardinalidad.4) No se pueden declarar restricciones de rango sólo para algunas clases.49
OntologíasEn RDFS no es lo bastante completo para describir los recursos de la Web con el detalle que precisan.Se requieren tecnologías de descripción del conocimiento más avanzados: ontologías.Una ontología define los términos a utilizar para describir y representar un área de conocimiento (W3C).Es una herramienta para compartir información y conocimiento, es decir, conseguir la interoperabilidad.50
Web actual51
Web Semántica (Ontología)52
Lenguaje representación de OntologíasEl W3C ha desarrollado el lenguaje de definición de ontologías OWL.Es una extensión de RDF.Usa el modelo de tripletas de RDFMayor poder expresivo.Elimina las deficiencias de RDF.53
Lenguaje representación de OntologíasOWL se ha dotado de recursos para mejorar la capacidad expresiva de RDF/RDFS.OWL tiene tres sublenguajes, con un nivel de expresividad creciente y que son los siguientes: OWL Lite, OWL DL y OWL Full.54
¿RDFS o OWL para una ontología?Hay que tener en cuenta y entender que cuánta más expresividad se desee tener en la ontología, más necesidad de cómputo es necesaria para inferir o deducir nueva información.Por tanto, RDFS permite representar ontologías sencillas y razonar de forma eficiente, mientras que OWL permite más expresividad a cambio de menor eficiencia.Por eso, si algo se puede hacer con RDFS no se usa OWL.55
Herramientas para crear ontologías1) Protégéhttp://protege.stanford.edu/2) Kaonhttp://kaon.semanticweb.org/3) ORIENThttp://www.alphaworks.ibm.com/tech/semanticstk.56
Aplicaciones de las Ontologías1) Mejorar búsqueda de información en la Web.2) Favorecer la interoperabilidad entre distintos sistemas de información.3) Útiles para organizar sistemas de información.4) Las ontologías serán recorridas por los agentes inteligentes.5) Dota de semántica la Web y por tanto se pueden automatizar procesos realizados por máquinas.57
Reflexiones sobre la Web Semántica1) El paso de la Web actual a Semántica requiere todavía un tiempo considerable.2) La creación de ontologías consensuadas dista mucho de ser una tarea rápida.3) Algunos piensan que requiere un esfuerzo inútil.En mi opinión es muy complicado que todo el mundo añada semántica a sus web.58
¿Qué se está haciendo realmente?En la actualidad, se están utilizando todos estos conceptos para dar origen a la:Web de Datos Enlazados (Linked Data)Forma de publicar y enlazar datos estructurados en la Web utilizando RDF.
Consiste en explotar la Web como un espacio global de información en el que la navegación se realiza a través de datos estructurados enlazados, en vez de realizarse a través de documentos.59
Web de Datos EnlazadosPasar de una Web basada en documentos HTML, en la que el usuario es el destinatario de la información publicada, a una Web de Datos Enlazados que están expresados en RDF, en la que los agentes software pueden explotar estos datos de forma automática, utilizando el vocabulario consensuado que ofrece la ontología del dominio sobre el que actúan.El valor y la utilidad de los datos enlazados es mayor tanto en cuanto éstos estén más interconectados con otros datos en la Web de Datos.60
¿Cómo generar Datos Enlazados?1) Identificar qué información se publicará de forma abierta como datos enlazados.2) Los datos seleccionados se abren y publican en un formato reutilizable por todos, migrando la información almacenada en bases de datos, ficheros, hojas de cálculo, etc. al lenguaje RDF.3) Los datos transformados se enlazan con otros datos ya disponibles en la Web de Datos.Fundamental para incrementar la conectividad de los datos generados, permitiendo la recuperación y la agregación de información relacionada.61
Uso de los Datos EnlazadosLa cantidad de datos enlazados publicados en la Web de Datos ha experimentado un enorme crecimiento en los últimos años.La lista de recursos ya disponibles en Linked Datacrece día a día.El mayor auge hasta ahora se ha producido en el contexto de la publicación de datos del sector público.Se está extendiendo a: medios medios de comunicación, infraestructuras y logística, el ámbito universitario y científico y el de los datos geográficos.62http://www.aelid.es/
Aplicación de lo aprendidoHe planteado al departamento de I+D+i de Unicaja, un proyecto para organizar el repositorio de documentación que tenemos en nuestro grupo de desarrollo de Cajeros, a través de la creación de una ontología.El volumen de información de este repositorio crece cada día más (nuevos fabricantes, nuevas funcionalidades…) y cada vez se hace más inmanejable y perdemos más tiempo en la búsqueda de documentación.63
¿Cómo?1) Crear la ontología con los conceptos, propiedades y relaciones específicas del dominio de documentación del que disponemos.2) Implementar en Java un programa que mantenga una asociación (a modo de tabla) entre los documentos y su conjunto de anotaciones (conjunto de conceptos de la ontología).<nombre documento, conjunto palabras clave semánticas>Por ejemplo: en la ontología del equipo de fútbol creado (Equipo.owl), imaginemos que tengo un .doc sobre la biografía de Sergio Ramos.Consiste en anotar que ese documento va sobre la instancia creada de Sergio Ramos o incluso sobre el concepto “Lateral Derecho”, con lo cual al buscar por futbolista defensas o laterales derechos, debería deducir que ese documento es importante.64

Más contenido relacionado

PDF
Web Semantica
PPTX
Como funciona la web
PPTX
Comunicación interactiva
PDF
Web Semantica
PPT
Introducción a la Web Semántica
PDF
Como funciona la web
PDF
Otro comitetecnico white_paper_daedalus_octubre_2010
PDF
Relación de una Web Semántica CIS-UNL
Web Semantica
Como funciona la web
Comunicación interactiva
Web Semantica
Introducción a la Web Semántica
Como funciona la web
Otro comitetecnico white_paper_daedalus_octubre_2010
Relación de una Web Semántica CIS-UNL

La actualidad más candente (6)

PPT
Nova Spivack Semantic Web Talk, Entendiendo la web semántica
PDF
Unidad1 espiral
PPTX
Comunicación Interactiva
PPTX
Terminos interactivos - Comunicación Interactiva
DOCX
Paquini..
PPTX
Daniela comunicacion interactiva
Nova Spivack Semantic Web Talk, Entendiendo la web semántica
Unidad1 espiral
Comunicación Interactiva
Terminos interactivos - Comunicación Interactiva
Paquini..
Daniela comunicacion interactiva
Publicidad

Destacado (6)

PPT
Keeping it Simple: The Rules of Composition
PPTX
Coil Pot | Beginning Ceramics | La Sierra University
PPTX
Living on the edge
PPTX
Photography composition presentation
PPT
Photography: 1 - Composition
PPT
The rules of composition - Photography
Keeping it Simple: The Rules of Composition
Coil Pot | Beginning Ceramics | La Sierra University
Living on the edge
Photography composition presentation
Photography: 1 - Composition
The rules of composition - Photography
Publicidad

Similar a La web semántica (20)

PDF
La Web 3.0
PPT
La Web 3.0
PPT
Wb semantica
PDF
Monografia ontologias - Primera Aproximación
PPTX
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
PPT
La Web 3
PDF
Act3 uni2
PPT
Web Semántica
PPTX
Ontología
PPTX
Web semantica, erick lopez 11005497
PDF
Web semantica amt
PPTX
Trabajo final de TICS
PPT
Actividad 1 hacia la web semántica- phecd
PDF
La Web Semántica y la Oportunidad que Representa
DOCX
Trabajo de tics
DOC
2018 informacion en internet - mio - copia
PPT
Web 2.0 Y 3.0
PPT
Web 2.0 Y 3.0
PPTX
Presentación programa informatica
PPTX
Diapositivas de sistemas
La Web 3.0
La Web 3.0
Wb semantica
Monografia ontologias - Primera Aproximación
Web Semantica. La nueva Generación de Portales. (Infotec - SemanticWebBuilder...
La Web 3
Act3 uni2
Web Semántica
Ontología
Web semantica, erick lopez 11005497
Web semantica amt
Trabajo final de TICS
Actividad 1 hacia la web semántica- phecd
La Web Semántica y la Oportunidad que Representa
Trabajo de tics
2018 informacion en internet - mio - copia
Web 2.0 Y 3.0
Web 2.0 Y 3.0
Presentación programa informatica
Diapositivas de sistemas

Último (20)

PPTX
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
PDF
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
PPTX
la-historia-de-la-medicina Edna Silva.pptx
DOCX
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
PDF
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
PPTX
Presentación de Redes de Datos modelo osi
PPTX
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
PDF
Documental Beyond the Code (Dossier Presentación - 2.0)
PPTX
Historia Inteligencia Artificial Ana Romero.pptx
DOCX
Trabajo grupal.docxjsjsjsksjsjsskksjsjsjsj
PDF
MANUAL de recursos humanos para ODOO.pdf
PPTX
Curso de generación de energía mediante sistemas solares
PDF
TRABAJO DE TECNOLOGIA.pdf...........................
PPTX
Sesion 1 de microsoft power point - Clase 1
PDF
Diapositiva proyecto de vida, materia catedra
DOCX
Guía 5. Test de orientación Vocacional 2.docx
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
DOCX
TRABAJO GRUPAL (5) (1).docxjesjssjsjjskss
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
PDF
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
ADMINISTRACIÓN DE ARCHIVOS - TICS (SENA).pdf
la-historia-de-la-medicina Edna Silva.pptx
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
Presentación de Redes de Datos modelo osi
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
Documental Beyond the Code (Dossier Presentación - 2.0)
Historia Inteligencia Artificial Ana Romero.pptx
Trabajo grupal.docxjsjsjsksjsjsskksjsjsjsj
MANUAL de recursos humanos para ODOO.pdf
Curso de generación de energía mediante sistemas solares
TRABAJO DE TECNOLOGIA.pdf...........................
Sesion 1 de microsoft power point - Clase 1
Diapositiva proyecto de vida, materia catedra
Guía 5. Test de orientación Vocacional 2.docx
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
TRABAJO GRUPAL (5) (1).docxjesjssjsjjskss
Estrategia de Apoyo de Daylin Castaño (5).pdf
CONTABILIDAD Y TRIBUTACION, EJERCICIO PRACTICO

La web semántica

  • 1. La Web Semántica¡Colaboremos todos juntos para un ‘futuro web’ más cómodo!Javier Porras Castaño05/07/2010Máster Oficial en Tecnologías de la Información y Sistemas InformáticosSistemas Multiagente1
  • 2. ¿Por qué elegir este tema?.Situación y Problemas de la Web Actual.Solución: La Web Semántica.Tecnologías que le darán soporte.¿Qué se hace en la actualidad (linked data)?Proyecto para aplicarlo en mi trabajo.Agenda2
  • 3. Descubrí el término de Web Semántica, por primera vez en la asignatura.“Proporciona un entorno donde los agentes de software (aplicaciones) viajarán de página en página para satisfacer las necesidades de los usuarios (petición de información) de forma automática y sin intervención de éstos”.¿Cómo se lleva a cabo?¿Por qué he elegido este tema?3
  • 4. Hoy día, casi cualquier información se puede encontrar en Internet.Se ha mitificado, si no está en la red, no existe.Muy difícil medir el tamaño de la Web: entre 14 y 28 millones de libros: mucha información.Gracias a los buscadores, encontramos información.A un golpe de clic: información, compra de productos, servicios, formación, trabajo…Situación de la Web Actual4
  • 5. Esta abundancia de información ocasiona problemas.La información en la Web es heterogénea.Las páginas están escritas en HTML: sólo es semánticamente entendible por humanos.Al carecer de una semántica explícita, no se pueden automatizar procesos.Situación de la Web Actual5
  • 6. Los dos problemas más significativos de la Web actual son:1) La dificultad para encontrar información2) El intercambio de información entre distintos sistemas.Problemas de la Web actual6
  • 7. La Web actual carece de semántica.Por tanto, no existe una infraestructura software que haga que la información pueda ser entendida por máquinas.Ejemplo: búsqueda de los bancos existentes en España: introduce banco. Responde: entidades financieras, asientos, bancos de peces…; pone de manifiesto que no entiende lo que se le pide.El usuario sabe qué tipos de bancos busca, pero no tiene forma de indicarlo de forma explícita al buscador.1) Dificultad encontrar información7
  • 8. Los buscadores buscan por palabras claves (por coincidencia): un problema con las palabras polisémicas o sinónimas.Consecuencia: debemos leer muchas páginas hasta encontrar lo que buscamos: pérdida de tiempo.Si hubiese semántica, los buscadores encontraría no sólo lo que le pedimos, sino todo lo relacionado (sinónimos).El problema está en el lenguaje HTML: sólo indica como se debe mostrar la información pero no ofrece mecanismos para indicar semántica.1) Dificultad encontrar información8
  • 9. En conclusión, el usuario que busca información en la Web tiene dos problemas:1)Escasa precisión de los resultados.2)Alta sensibilidad al vocabulario empleado en la búsqueda.Solución: añadir metadatos: información que describe los contenidos que muestra la página.1) Dificultad encontrar información9
  • 10. Ejemplo: queremos comprar una impresora a través de la Red; buscamos modelo y precio.Si cada tienda virtual, incluyese un metadato Precio por cada impresora, los navegadores tendrían más fácil su trabajo. Las páginas que tengan el modelo de impresora pero no el metadato Precio, no serían devuelta como resultado.Es imposible que todas las tiendas virtuales del mundo utilicen como metadato Precio (puede ser, Coste, Precio, Price, Prix….)Los metadatos son necesarios, pero no suficientes.1) Dificultad encontrar información10
  • 11. Por tanto, para realizar búsquedas eficientes de información, se requiere:1) Incluir metadatos2) Que los metadatos sean comunes para todos los portales (ejemplo Precio). El navegador debe saber que los metadatos Precio, Coste, Valor, Price, Prix… hacen referencia al mismo metadato).1) Dificultad encontrar información11
  • 12. En la Web actual no existen mecanismos para la interoperabilidad completa de distintos sistemas de informaciónDesde hace algunos años el principal reto de las empresas es el intercambio de información con otras.Las Web actúa como un medio de transporte barato, pero no proporciona ningún protocolo de intercambio.2) Intercambio de información12
  • 13. En la actualidad el entendimiento entre empresas, es mediante una persona humana que interpreta los documentos de la empresa origen, con un previo acuerdo.Que una empresa haga un pedido a otra vía Web, no tiene ninguna diferencia con hacerlo de forma telefónica o fax. Al final requiere de que una persona humana lo interprete y lo lleve a cabo.Lo ideal sería: que una empresa haga de forma automática pedidos a otra empresa.Ahorro de coste, evitar errores humanos en la interpretación.2) Intercambio de información13
  • 14. La Web actual presenta un problema de comunicación e interoperabilidad entre los sistemas de información de distintas empresas.Solución: Crear estructuras de información comunes a un mismo dominio, compartidos por todas.Un concepto debe ser entendido o interpretados por todas de la misma manera.Llevarlo a cabo es muy difícil: poner a todas las empresas de acuerdo es complejo.2) Intercambio de información14
  • 15. La Web SemánticaPretende añadir metadatos a la Web para que las máquinas comprendan el significado de las mismas (semántica).Solución15
  • 16. Para los humanos comprender un signo o una palabra no es nada extraordinario.De forma automática y sin esfuerzo.Por sí solas, las palabras son manchas negras en una pantalla o en un papel.Si toman sentido o significado es porque nuestro cerebro se lo otorga.La Web semántica no pretende que las máquinas comprendan como lo hacen los humanos, sino que sean capaces de inferir o deducir conocimiento a partir de una información.La Web Semántica16
  • 17. No se debe confundir “deducir o inferir” con inteligencia.Que las máquinas sean inteligentes es algo que todavía no se puede conseguir y la Web Semántica no lo pretende.Tan sólo pretende que sea capaz de aplicar reglas lógicas sobre un dominio de conocimiento para deducir o inferir conocimiento.La Web Semántica17
  • 18. Ejemplo:A una máquina se le programa la regla lógica: “Toda persona es un ser vivo”La máquina debería deducir que si Luis es una persona, también es un ser vivo.La máquina NO es inteligente, sólo aplica reglas lógicas para obtener conocimiento.No hay inteligencia: nunca sabrá que es una persona, y no podrá deducir nada que no se derive de las reglas lógicas.La Web Semántica18
  • 19. Habilidad de la máquina para resolver un problema bien definido, con operaciones bien definidas sobre datos bien definidos.En lugar de pedir a las máquinas que entiendan el lenguaje humano, prefiere pedir a la gente que hagan un esfuerzo.Representar la información en algún lenguaje formal para extraer inferencia lógica.La Web Semántica19
  • 20. Base de la Web Semántica1) Permite desarrollar lenguajes formales a través de los cuales podemos representar el conocimiento.2) Proporciona semántica bien definida: cada símbolo o expresión tienen significado único, sin ambigüedad ni contradicciones.3) Proporciona reglas de inferencia, para extraer el conocimiento.Lógica Descriptiva20
  • 21. La Web Semántica pretende:La interpretación semántica automática de documentos:Consiste en la aplicación de reglas lógicas a unos datos representados en un lenguaje formal para extraer el conocimiento.Lógica Descriptiva21
  • 22. ¿Por qué DL fue escogido como la mejor opción para modelar lógica?Existen muchas formas de representar el conocimiento: redes semánticas, frames…Se elige DL porque está dotada con una semántica formal.Permite definir semántica o metainformación sobre un dominio, de una manera formal.Lógica Descriptiva22
  • 23. Se adapta perfectamente al concepto de ontología.Herramienta base de la Web Semántica: define los términos y relaciones que representan un dominio o área de información.Clases, Relaciones e Instancias.Permite especificar formalmente las propiedades de los individuos del dominio y las relaciones entre conceptos:Bases de conocimiento.Lógica Descriptiva23
  • 24. 1) Permitirá realizar búsquedas como:“Busco todos los mecánicos que tengan su taller a menos de 1 kilómetros de la calle Cayetano Ordoñez (mi calle) y que trabajen para la compañía se Seguros Mafre”.2) Permitirá el uso de agentes personales encargados de extraer información de múltiples fuentes heterogéneas.Por ejemplo, un agente personal para que me informe de las fechas de los conciertos de Alejandro Sanz o lanzamiento de un nuevo disco.3) Ante una búsqueda devolverá como resultado todos los conceptos relacionados (ejemplos sinónimos)La Web Semántica del futuro24
  • 25. La Web Semántica del futuro25
  • 26. Capas de la Web Semántica26
  • 27. Asegura la representación de un carácter y propone distintas maneras de codificarlo en binario.Asigna un único número a cada carácter.Contempla casi todos los idiomas.Permite la interoperabilidad entre sistemas: de cualquier dominio o contexto.Unicode: el alfabeto27
  • 28. Identificadores uniformes de recursos.Permiten identificar todos los recursos de la Web Semántica.URI es más amplio y genérico que URL.PROTOCOLO: RUTA PÁGINA EN SERVIDOR ?SOLICITUD#FRAGMENTOLa principal diferencia es que las URI permiten identificar cualquier recurso dentro de la Web (formato). URI’s: las referencias28
  • 29. El marcado de documentos es una forma primitiva de incluir semántica (metadatos).Etiquetas como <autor> o <precio> ayudan a que los humanos podamos intuir su significado.Para extraer la semántica del documento, hay que leer la DTD o el esquema XML; hoy día únicamente por personas humanas.Para un programa o una máquina las etiquetas carecen de significado.XML: el primer paso29
  • 30. Para que las empresas intercambien información de forma automática previamente se han tenido que poner de acuerdo en utilizar los mismos DTD o esquemas XML.Por ejemplo, un sistema que acepte etiquetas <Precio>, no será capaz de interpretar y procesas etiquetas </PrecioUnidad>, aunque sean semánticamente equivalentes.Es necesario, pero no suficiente.XML: el primer paso30
  • 31. Marco de descripción de recursos.Lenguaje para representar metadatos propuesto por W3C.Especificar semántica sobre los datos, utilizando XML.Permite intercambiar datos a través de diferentes aplicaciones sin que pierdan significado, lo que facilita la reutilización (linked data).RDF: El pegamento semántico31
  • 32. Para definir la semántica, ¿por qué RDF y no XML?El modelo de un dominio puede representarse con varias DTD o varios esquemas XML, y una misma DTD o un esquema XML pueden corresponder a muchos modelos de sistemas de informaciónRDF: El pegamento semántico32
  • 33. ¿Por qué RDF y no XML?Javier compra la silla de referencia 120, en la compra identificada con elcódigo 11233
  • 34. ¿Por qué RDF y no XML?34
  • 35. ¿Por qué RDF y no XML?35
  • 36. RDF es un modelo de metadatos para describir recursos.Permite:1) Describir recursos2) Intercambio de metadatos estructurados3) Reutilizar metadatos estructuradosEl W3C proponer RDF para describir recursos WebRDF: El pegamento semántico36
  • 37. Para describir recursos se utiliza la tripleta: Recurso o sujeto, Propiedad o predicado y el Valor u objeto:RDF: El pegamento semántico37
  • 38. El modelo de datos RDF proporciona un marco abstracto y conceptual para definir y utilizar metadatos, pero resultaría inútil sin una sintaxis concreta para crear e intercambiar metadatosSe trata de XML, y se denomina RDF/XMLRDF: El pegamento semántico38
  • 39. RDF: El pegamento semántico39
  • 40. El aula virtual del centro de profesorado (CEP) de Ronda (Málaga) ha sido creada por Javier Porras Castaño.RDF: El pegamento semántico40
  • 41. RDF: El pegamento semántico41
  • 42. RDF SchemaRDF no se asocia a ningún dominio en particular: se puede emplear en cualquier campo. Cada persona u organización su propia terminología o vocabulario con RDFS.RDFS permite comprobar si un conjunto de tripletas (metadatos) es válido para ese esquema.42
  • 43. RDF SchemaEjemplo: carece de sentido que la propiedad “vendeAccionesEnBolsa” tenga como valor “color rojo”.RDFS especifica qué interpretación hay que dar a las sentencias de un modelo de datos RDF y dejan libre la representación sintáctica del modelo (en XML).Un esquema XML puede obligar a que las etiquetas <Producto> estén dentro de las de <Vendedor> pero carece de medios para indicar que hay una relación vende (con RDF sí).43
  • 44. Un documento XML carece de semántica mientras que un documento RDF/XML sí posee.En XML la semántica aparece cuando un software procesa una etiqueta que previamente se ha acordado o definido.Sin embargo la semántica en RDFS (RDF/XML) aparece en el propio documento.RDF Schema44
  • 45. RDF SchemaEn resumen, con RDFS podemos definir:1) Clases2) Jerarquía de clases3) Propiedades4) Jerarquía de propiedades5) Restricciones sobre los dominios y los rangos45
  • 46. RDF SchemaGracias a RDF y RDFS, podemos codificar la semántica en un lenguaje formal que tiene como consecuencias, un conocimiento no ambigua y comprensible por máquinas.Con RDFS ya podemos decir que la Web comienza a tener semántica, por lo que se pueden automatizar tareas.46
  • 47. Aplicación RDF y RDFSLa aplicación más conocida es RSS.RSS es un vocabulario RDF usado para describir información de manera que pueda ser reutilizada.Su objetivo es distribuir un conjunto de titulares de noticias, llamados canales.47
  • 49. RDFS tiene desventajas1) No se puede representar algunas características de propiedades: transitividad, simetría, inversa o única.2) No se puede reflejar que dos clases son disjuntas.3) No permiten reflejar restricciones de cardinalidad.4) No se pueden declarar restricciones de rango sólo para algunas clases.49
  • 50. OntologíasEn RDFS no es lo bastante completo para describir los recursos de la Web con el detalle que precisan.Se requieren tecnologías de descripción del conocimiento más avanzados: ontologías.Una ontología define los términos a utilizar para describir y representar un área de conocimiento (W3C).Es una herramienta para compartir información y conocimiento, es decir, conseguir la interoperabilidad.50
  • 53. Lenguaje representación de OntologíasEl W3C ha desarrollado el lenguaje de definición de ontologías OWL.Es una extensión de RDF.Usa el modelo de tripletas de RDFMayor poder expresivo.Elimina las deficiencias de RDF.53
  • 54. Lenguaje representación de OntologíasOWL se ha dotado de recursos para mejorar la capacidad expresiva de RDF/RDFS.OWL tiene tres sublenguajes, con un nivel de expresividad creciente y que son los siguientes: OWL Lite, OWL DL y OWL Full.54
  • 55. ¿RDFS o OWL para una ontología?Hay que tener en cuenta y entender que cuánta más expresividad se desee tener en la ontología, más necesidad de cómputo es necesaria para inferir o deducir nueva información.Por tanto, RDFS permite representar ontologías sencillas y razonar de forma eficiente, mientras que OWL permite más expresividad a cambio de menor eficiencia.Por eso, si algo se puede hacer con RDFS no se usa OWL.55
  • 56. Herramientas para crear ontologías1) Protégéhttp://protege.stanford.edu/2) Kaonhttp://kaon.semanticweb.org/3) ORIENThttp://www.alphaworks.ibm.com/tech/semanticstk.56
  • 57. Aplicaciones de las Ontologías1) Mejorar búsqueda de información en la Web.2) Favorecer la interoperabilidad entre distintos sistemas de información.3) Útiles para organizar sistemas de información.4) Las ontologías serán recorridas por los agentes inteligentes.5) Dota de semántica la Web y por tanto se pueden automatizar procesos realizados por máquinas.57
  • 58. Reflexiones sobre la Web Semántica1) El paso de la Web actual a Semántica requiere todavía un tiempo considerable.2) La creación de ontologías consensuadas dista mucho de ser una tarea rápida.3) Algunos piensan que requiere un esfuerzo inútil.En mi opinión es muy complicado que todo el mundo añada semántica a sus web.58
  • 59. ¿Qué se está haciendo realmente?En la actualidad, se están utilizando todos estos conceptos para dar origen a la:Web de Datos Enlazados (Linked Data)Forma de publicar y enlazar datos estructurados en la Web utilizando RDF.
  • 60. Consiste en explotar la Web como un espacio global de información en el que la navegación se realiza a través de datos estructurados enlazados, en vez de realizarse a través de documentos.59
  • 61. Web de Datos EnlazadosPasar de una Web basada en documentos HTML, en la que el usuario es el destinatario de la información publicada, a una Web de Datos Enlazados que están expresados en RDF, en la que los agentes software pueden explotar estos datos de forma automática, utilizando el vocabulario consensuado que ofrece la ontología del dominio sobre el que actúan.El valor y la utilidad de los datos enlazados es mayor tanto en cuanto éstos estén más interconectados con otros datos en la Web de Datos.60
  • 62. ¿Cómo generar Datos Enlazados?1) Identificar qué información se publicará de forma abierta como datos enlazados.2) Los datos seleccionados se abren y publican en un formato reutilizable por todos, migrando la información almacenada en bases de datos, ficheros, hojas de cálculo, etc. al lenguaje RDF.3) Los datos transformados se enlazan con otros datos ya disponibles en la Web de Datos.Fundamental para incrementar la conectividad de los datos generados, permitiendo la recuperación y la agregación de información relacionada.61
  • 63. Uso de los Datos EnlazadosLa cantidad de datos enlazados publicados en la Web de Datos ha experimentado un enorme crecimiento en los últimos años.La lista de recursos ya disponibles en Linked Datacrece día a día.El mayor auge hasta ahora se ha producido en el contexto de la publicación de datos del sector público.Se está extendiendo a: medios medios de comunicación, infraestructuras y logística, el ámbito universitario y científico y el de los datos geográficos.62http://www.aelid.es/
  • 64. Aplicación de lo aprendidoHe planteado al departamento de I+D+i de Unicaja, un proyecto para organizar el repositorio de documentación que tenemos en nuestro grupo de desarrollo de Cajeros, a través de la creación de una ontología.El volumen de información de este repositorio crece cada día más (nuevos fabricantes, nuevas funcionalidades…) y cada vez se hace más inmanejable y perdemos más tiempo en la búsqueda de documentación.63
  • 65. ¿Cómo?1) Crear la ontología con los conceptos, propiedades y relaciones específicas del dominio de documentación del que disponemos.2) Implementar en Java un programa que mantenga una asociación (a modo de tabla) entre los documentos y su conjunto de anotaciones (conjunto de conceptos de la ontología).<nombre documento, conjunto palabras clave semánticas>Por ejemplo: en la ontología del equipo de fútbol creado (Equipo.owl), imaginemos que tengo un .doc sobre la biografía de Sergio Ramos.Consiste en anotar que ese documento va sobre la instancia creada de Sergio Ramos o incluso sobre el concepto “Lateral Derecho”, con lo cual al buscar por futbolista defensas o laterales derechos, debería deducir que ese documento es importante.64
  • 66. Muchas gracias.Espero que les haya interesadoFin de la exposición65