SlideShare una empresa de Scribd logo
5	
  Stars	
  Web:	
  The	
  web	
  of	
  Data	
  
Temario


Temario:

1.  Web de Datos: La visión.

2.  Tecnologías de la Web de Datos: Linked Data.

3.  Herramientas.

4.  Ejemplos de uso.




             CTIC Centro Tecnológico •   www.fundacionctic.org
La visión




CTIC Centro Tecnológico •   www.fundacionctic.org
Web Semántica. 5 Stars Web

Escala de excelencia creada por el inventor de la Web, Tim
Berners-Lee para medir el nivel de publicación en las
iniciativas Open Data.

 La bonanza de los conjuntos de datos publicados
 por una administración se mide en el rango
 de calidad de sus distribuciones de datos,
 establecido por los principios de la
 Web de Datos (5 ★ Open Data)




                   CTIC Centro Tecnológico •   www.fundacionctic.org
Web Semántica. 5 Stars Web

 La “Linked Data Cloud” está formada por
 servidores que albergan miles de
 millones de datos en formatos
 semánticos.




Para seguir la evolución de la nube LD:
       •    http://www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/DataSets
       •    http://richard.cyganiak.de/2007/10/lod/
       •    http://www4.wiwiss.fu-berlin.de/lodcloud/
       •    http://www4.wiwiss.fu-berlin.de/lodcloud/state


                           CTIC Centro Tecnológico •   www.fundacionctic.org
Web Semántica. Tecnologías

Construcción de la Web de Datos: Linked Data.

•    URIs: Uso de identificadores únicos
     para la información publicada

•    RDF: Uso de un modelo de datos
     común para representar la
     información.

•    RDFS/OWL/SKOS: Empleo de
     vocabularios para establecer
     ontologías y clasificaciones.

•    SPARQL: Lenguaje de consulta
     sobre 'servidores semánticos’.

•    Otras tecnologías (Rules, lógica, …)
     para seguir construyendo ....

                       CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: modelo de datos

RDF	
  (Resource	
  Descrip.on	
  Framework)	
  es	
  un	
  framework	
  ideado	
  y	
  diseñado	
  
para	
  representar	
  información	
  sobre	
  recursos	
  en	
  un	
  espacio	
  global	
  (la	
  Web).	
  
	
  
En	
  RDF	
  todos	
  los	
  recursos	
  son	
  idenEficados	
  por	
  una	
  URI:	
  
•  IdenEficador	
  de	
  Recurso	
  Uniforme	
  
•  Ubicuidad:	
  accesible	
  desde	
  cualquier	
  punto	
  de	
  la	
  web	
  
	
  
La	
  unidad	
  básica	
  de	
  información	
  es	
  la	
  tripleta,	
  formada	
  por	
  un	
  sujeto,	
  	
  
un	
  predicado	
  y	
  un	
  objeto.	
  
	
  
	
  
	
  
	
  
	
  
El	
  modelo	
  de	
  datos	
  que	
  intrínsecamente	
  se	
  representa	
  mediante	
  RDF	
  es	
  de	
  
un	
  grafo	
  dirigido	
  (mulEgrafo	
  dirigido	
  y	
  eEquetado).	
  

                             CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: Grafo dirigido

Ejemplo	
  de	
  grafo	
  RDF:	
  datos	
  personales.	
  




  CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: Serializaciones, formatos




CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: Blank Nodes




CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: Literales tipados




CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: Especificaciones. Validación.

Especificaciones	
  oficiales	
  
	
  	
  
         •  	
  hOp://www.w3.org/standards/techs/rdf	
  
         •  	
  hOp://www.w3.org/TR/2004/REC-­‐rdf-­‐syntax-­‐grammar-­‐20040210/	
  
         •  	
  hOp://www.w3.org/TR/2004/REC-­‐rdf-­‐primer-­‐20040210/	
  
         •  	
  hOp://www.w3.org/TeamSubmission/turtle/	
  
         •  	
  hOp://www.w3.org/2001/sw/RDFCore/ntriples/	
  
	
  
	
  
	
  Herramientas	
  para	
  la	
  validación	
  y	
  la	
  transformación	
  de	
  RDF:	
  
	
  
         •  	
  hOp://www.w3.org/RDF/Validator/	
  
         •  	
  hOp://www.rdfabout.com/demo/validator/	
  
	
  
	
  

                       CTIC Centro Tecnológico •   www.fundacionctic.org
RDFS: Clases




CTIC Centro Tecnológico •   www.fundacionctic.org
RDFS: Propiedades


•  Definir una propiedad: rdf:Property



•  Establecimiento del rango de aplicación
   de una propiedad: rdfs:range



•  Establecimiento del dominio de
   aplicación de una propiedad:
   rdfs:domain



•  Especialización de las propiedades:
   rdfs:subPropertyOf




                       CTIC Centro Tecnológico •   www.fundacionctic.org
RDFS: Ejemplo




CTIC Centro Tecnológico •   www.fundacionctic.org
RDFS: Limitaciones -> OWL.

RDFS	
  Eene	
  una	
  serie	
  de	
  limitaciones	
  en	
  su	
  expresividad:	
  
	
  
•  Cardinalidad	
  de	
  la	
  propiedades:	
  una	
  persona	
  sólo	
  Eene	
  un	
  padre.	
  
•  TransiEvidad:	
  “descendiente	
  de”.	
  
•  Propiedades	
  “clave”	
  de	
  las	
  clases:	
  DNI.	
  
•  Dos	
  clases	
  diferentes	
  (URIs)	
  representan	
  la	
  misma	
  agrupación.	
  
•  Dos	
  instancias	
  diferentes	
  (URIs)	
  representan	
  el	
  mismo	
  individuo.	
  
•  Restricciones	
  en	
  la	
  cardinalidad	
  de	
  las	
  propiedades	
  dependiendo	
  de	
  la	
  
      clase	
  a	
  la	
  que	
  se	
  aplica:	
  “nº	
  de	
  jugadores”	
  (fútbol,	
  baloncesto,...)	
  
•  Relaciones	
  entre	
  clases:	
  uniones,	
  intersecciones,	
  disjunciones.	
  
	
  
Se	
  han	
  desarrollado	
  otros	
  estándares	
  como	
  DAML+OIL	
  y	
  OWL	
  basados	
  en	
  
RDF/RDFS	
  que	
  permiten	
  definir	
  de	
  forma	
  más	
  extensa	
  la	
  SemánEca	
  de	
  	
  un	
  
dominio	
  de	
  conocimiento.	
  
	
  

                             CTIC Centro Tecnológico •   www.fundacionctic.org
RDF: OWL (Web Ontology Language).
•    Estándar	
  que	
  establece	
  un	
  lenguaje	
  para	
  definir	
  ontologías	
  para	
  la	
  Web	
  SemánEca.	
  
•    No	
  está	
  ideado	
  sólo	
  para	
  su	
  uso	
  con	
  datos	
  en	
  RDF	
  (tripletas,	
  grafos).	
  
•    Tiene	
  3	
  variantes	
  o	
  sublenguajes	
  con	
  diferentes	
  grados	
  de	
  expresividad:	
  OWL	
  Lite,	
  OWL	
  DL	
  
     and	
  OWL	
  Full	
  (ordenados	
  de	
  menos	
  a	
  mayor	
  complejidad).	
  
•    Overview:	
  	
  hOp://www.w3.org/TR/2009/REC-­‐owl2-­‐overview-­‐20091027/#	
  




                                   CTIC Centro Tecnológico •          www.fundacionctic.org
Descripción de recursos. Vocabularios estándar
•    Vocabularios “estándar” internacionales:

       •    SKOS Vocabulario para describir sistemas de organización del conocimiento como diccionarios,
            taxonomías, tesauros, etc.
                                         http://www.w3.org/2004/02/skos/

       •    DCMI Metadata Terms Dublin Core es una iniciativa para la especificación de metadatos básicos
            para recursos en general.
                                      http://dublincore.org/documents/dcmi-terms/


       •    FOAF Friend Of A Friend es un vocabulario que permite describir personas y relaciones entre ellas.
                                    http://dublincore.org/documents/dcmi-terms/

       •    vCard Estándar para el modelado en RDF de información de contacto de personas u organizaciones.
                                         http://www.w3.org/TR/vcard-rdf/

       •    Geonames Ontología para describir lugares (ciudades, regiones, …).
                            http://www.geonames.org/ontology/documentation.html

       •    Basic Geo (WGS84) Vocabulario creado por el W3C para definición de elementos geoespaciales
            básicos.
                                      http://www.w3.org/2003/01/geo/

       •    RDFS, OWL Estándares del W3C para describir vocabularios y ontologías RDF.
                    http://www.w3.org/TR/rdf-schema/ http://www.w3.org/TR/owl2-overview/




                                 CTIC Centro Tecnológico •   www.fundacionctic.org
Publicación RDF. Linked Data
•  Diferentes formas de publicar RDF. Como un fichero RDF estático -> es otro
   formato estructurado más.

•  Publicación como Linked Data (LD):

    •  RDF como modelo de datos de la información. RDF/XML, Turtle, N3 …

    •  Non-Information resources vc Information Resources
      URIs de identificación vs URIs de representación. Dereferenciación.
      Uso de la negociación de contenido http para redirigir a las representaciones

        http://datos.gob.es/catalogo/catalogoNacional
        http://datos.gob.es/catalogo/catalogoNacional.rdf
        http://datos.gob.es/catalogo/catalogoNacional.html

        http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/

    •  SPARQL -> Lenguaje de consulta estándar sobre servidores de
       información semántica




                         CTIC Centro Tecnológico •   www.fundacionctic.org
Publicación RDF. Negociación de contenido


 PeEción	
  de	
  la	
  clase	
  
 “Restaurante”	
  por	
  parte	
  
 de	
  un	
  cliente	
  HTML	
  




                                                                                         !




PeEción	
  de	
  la	
  clase	
  
“Restaurante”	
  por	
  parte	
  
de	
  un	
  cliente	
  RDF	
  




                                                                                         !


                                     CTIC Centro Tecnológico •   www.fundacionctic.org
Reutilización. SPARQL
•  SPARQL Estándar para la consulta de datos en servidores semánticos. Por
   ejemplo la DBpedia.

•  SPARQL se usa en la red mediante estándares que definen el protocolo y el
   formato de resultado:
     •  Protocolo SPARQL para RDF con vínculos a HTTP y SOAP
     •  Resultados SPARQL en formato XML o JSON

•  http://www.w3.org/TR/rdf-sparql-query/

•  RDF es un modelo de datos
   de grafos dirigidos:


•  La idea fundamental de SPARQL
    •  Se define un patrón contiene símbolos sin asociar.
    •  Asociando los símbolos, se seleccionan subgrafos del grafo RDF.
    •  Al hacer esa selección la consulta devuelve los recursos con sus
        asociaciones.



                       CTIC Centro Tecnológico •   www.fundacionctic.org
Reutilización. SPARQL estructura.




CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo




CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo




CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo




CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo




CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo




Devuelve:	
  	
  [[<..49X>,33,:£,<…Palace>],	
  …	
  ,	
  [<..6682>,78,:$,	
  ]]	
  




                      CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo




Devuelve:	
  	
  [[<..49X>,33,:£,<…Palace>]	
  …]	
  




                     CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Ejemplo

Datos	
  de	
  turismo	
  del	
  Principado	
  de	
  Asturias:	
  	
  
•  IdenEficamos	
  el	
  punto	
  SPARQL	
  
•  Y	
  (si	
  aplica)	
  el	
  grafo-­‐dataset	
  de	
  los	
  datos	
  




                                        CTIC Centro Tecnológico •           www.fundacionctic.org
SPARQL. Servidores: DBpedia
•  DBpedia:

   •  Es una versión en RDF de la información de la Wikipedia.
   •  Recorre regularmente (crawling) las páginas de la wikipedia
      recogiendo información de sus tablas de datos (infoboxes) y
      jerarquías.
   •  Contiene casi 2000 millones de tripletas

   •  http://dbpedia.org/sparql

                                         Modificadores	
  de	
  la	
  solución	
  
                                              •  LIMIT	
  
                                              •  ORDER	
  BY	
  
                                              •  OFFSET	
  
                                         	
  

                  CTIC Centro Tecnológico •   www.fundacionctic.org
SPARQL. Servidores: DBpedia


Uso	
  de	
  filtros	
  en	
  las	
  consultas.	
  
	
  
•  Hallar	
  en	
  la	
  dbpedia	
  los	
  nombre	
  de	
  los	
  países	
  sin	
  costa	
  con	
  una	
  	
  
   población	
  mayor	
  de	
  15000000.	
  
	
  
	
  	
  




                                  CTIC Centro Tecnológico •     www.fundacionctic.org
Herramientas RDF
Listado de herramientas en la wiki del W3C:
                  http://www.w3.org/RDF/

   •  Entornos de programación:
       •  Java: Jena, Sesame
       •  PHP: ARC2
       •  Python: RDFLib

   •  Servidores nativos: Triple Stores (Quad Stores)
       •  Virtuoso
       •  4Store
       •  AllegroGraph

   •  Servicios web. Datos en la nube (cloud)
       •  Dydra
       •  Kasabi (Talis)
                 CTIC Centro Tecnológico •   www.fundacionctic.org
Web de Datos: Ejemplos

Google Rich Snippets: La mejora en la experiencia de
  usuario al realizar las búsquedas tiene efectos en la
  proporción de clics.




               CTIC Centro Tecnológico •   www.fundacionctic.org
Web de Datos: Ejemplos de uso




CTIC Centro Tecnológico •   www.fundacionctic.org
Web de Datos: Iniciativas, Datos Gijón




                                  hOp://www.fundacioncEc.org/odlabgijon/	
  



hOp://datos.gijon.es/	
  




                     CTIC Centro Tecnológico •   www.fundacionctic.org
Muchas	
  Gracias,	
  
Rubén	
  Marxn	
  
    hOp://www.fundacioncEc.org	
  
   hOp://datos.fundacioncEc.org	
  
       hOp://www.w3.org/eGov	
  
 ruben.marEn@fundacioncEc.org	
  
                               	
  

                                	
  
                                	
  

Más contenido relacionado

PDF
Curs 1.6. Datos enlazados (2h) OpenDataLab
PDF
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
PDF
Curs 2.5 Datos Enlazados
PDF
Curs 2.5 Dades enllaçades
PPT
Introduccion - Curso Ontologías
PPT
El tratamiento de los objetos digitales, por Patricia Juez García
PDF
02. RDF(S) SPARQL. Tecnologías Semánticas en la Web de Datos
PDF
Curs 1.6. Datos enlazados (2h) OpenDataLab
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
Curs 2.5 Datos Enlazados
Curs 2.5 Dades enllaçades
Introduccion - Curso Ontologías
El tratamiento de los objetos digitales, por Patricia Juez García
02. RDF(S) SPARQL. Tecnologías Semánticas en la Web de Datos

La actualidad más candente (20)

PPTX
Web Semantica Y las Bases de Datos
PPT
Parte 2. web semantica eva mendez - argentina - 301009
PPT
Agrovoc cswb training_1
PPTX
Universidad minuto de dios
PPTX
Linked Data y Linked Open Data en las Bibliotecas
PDF
Linked Open Data. Bibliografía básica
PPTX
Repositorios digitales
PPTX
Repositorios: definición, características y ejemplos
PPTX
PPT
Busqueda de información en Ciencias Sociales
PDF
OCLC Research Projects - San Jose Costa Rica - October 2010
PDF
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
PPT
Repositorios Digitales UNMSM
PDF
Fuentes de información en Ciencias Sociales
PDF
Bases De Datos
PPTX
Presentacion internet
PDF
Ontologia1
PPTX
Examen trimestral
PPT
Tesis digitales: Propuesta de mejora en la UNMSM
Web Semantica Y las Bases de Datos
Parte 2. web semantica eva mendez - argentina - 301009
Agrovoc cswb training_1
Universidad minuto de dios
Linked Data y Linked Open Data en las Bibliotecas
Linked Open Data. Bibliografía básica
Repositorios digitales
Repositorios: definición, características y ejemplos
Busqueda de información en Ciencias Sociales
OCLC Research Projects - San Jose Costa Rica - October 2010
El futuro de Big Data: La calidad del análisis. Modelos efectivos y casos de uso
Repositorios Digitales UNMSM
Fuentes de información en Ciencias Sociales
Bases De Datos
Presentacion internet
Ontologia1
Examen trimestral
Tesis digitales: Propuesta de mejora en la UNMSM
Publicidad

Destacado (12)

PPTX
Destaques Projeto Suba
PDF
JSON API_1110651039
PPS
100818 chia khoa niem vui
PDF
Hanh trinh-tro-thanh-nha-lanh-dao
PPTX
Estudios
PPT
Reproduccion celular
PPT
La familia de luis valencia
PPT
ARTDM 171 Week 4: Tags
POTX
Controla el estrés
PPTX
Búsqueda de información
PPTX
Riñón anatomía, histología y pad congénitos
Destaques Projeto Suba
JSON API_1110651039
100818 chia khoa niem vui
Hanh trinh-tro-thanh-nha-lanh-dao
Estudios
Reproduccion celular
La familia de luis valencia
ARTDM 171 Week 4: Tags
Controla el estrés
Búsqueda de información
Riñón anatomía, histología y pad congénitos
Publicidad

Similar a The Web of Data (20)

PPTX
Curs 1.6 Datos Enlazados
PPT
Web 3.0 y herramientas tecnologicas
PDF
Curso integración Web Semántica
PPTX
Curs 1.6. Dades Enllaçades (14/02)
PPTX
Web semantica
PPT
Websemantica
PPT
Websemantica 1218250849453303 9
PPTX
Metada librarian
PPT
Repositorios Institucionales, SWORD, DSpace y ABCD
PPT
Introduccion a OpenData
PPTX
KEY
Explotando la Web de Datos: Como crear aplicaciones usando Linked Open Data
PDF
La nuevas tendencias de comunicación con el ciudadano. Estrategia en Web: Por...
PPTX
Estándares WC3
PPT
Herramientas para linked data
PDF
Web semántica
PPT
Ontologias
PPTX
Web semantica
PDF
Datos abiertos enlazados: Experiencia en la Universidad de Chile
PDF
Red Ontologías Hércules – ROH
Curs 1.6 Datos Enlazados
Web 3.0 y herramientas tecnologicas
Curso integración Web Semántica
Curs 1.6. Dades Enllaçades (14/02)
Web semantica
Websemantica
Websemantica 1218250849453303 9
Metada librarian
Repositorios Institucionales, SWORD, DSpace y ABCD
Introduccion a OpenData
Explotando la Web de Datos: Como crear aplicaciones usando Linked Open Data
La nuevas tendencias de comunicación con el ciudadano. Estrategia en Web: Por...
Estándares WC3
Herramientas para linked data
Web semántica
Ontologias
Web semantica
Datos abiertos enlazados: Experiencia en la Universidad de Chile
Red Ontologías Hércules – ROH

Más de betabeers (20)

PPSX
IONIC, el framework para crear aplicaciones híbridas multiplataforma
PDF
Servicios de Gestión de Datos en la Nube - Jaime Balañá (NetApp)
PPTX
Blockchain: la revolución industrial de internet - Oscar Lage
PDF
Cloud Learning: la formación del siglo XXI - Mónica Mediavilla
PDF
Desarrollo web en Nodejs con Pillars por Chelo Quilón
PDF
La línea recta hacia el éxito - Jon Torrado - Betabeers Bilbao
PDF
6 errores a evitar si eres una startup móvil y quieres evolucionar tu app
PDF
Dev ops.continuous delivery - Ibon Landa (Plain Concepts)
PPTX
Introducción a scrum - Rodrigo Corral (Plain Concepts)
PPTX
Gestión de proyectos y consorcios internacionales - Iñigo Cañadas (GFI)
PPTX
Software de gestión Open Source - Odoo - Bakartxo Aristegi (Aizean)
PDF
Elemental, querido Watson - Caso de Uso
PDF
Seguridad en tu startup
PPTX
Spark Java: Aplicaciones web ligeras y rápidas con Java, por Fran Paredes.
PDF
Buenas prácticas para la optimización web
PDF
La magia de Scrum
PDF
Programador++ por @wottam
PPTX
RaspberryPi: Tu dispositivo para IoT
PDF
Introducción al Big Data - Xabier Tranche - VIII Betabeers Bilbao 27/02/2015
PDF
PAYTPV Plataforma Integral de Cobros - VIII Betabeers Bilbao 27/02/2015
IONIC, el framework para crear aplicaciones híbridas multiplataforma
Servicios de Gestión de Datos en la Nube - Jaime Balañá (NetApp)
Blockchain: la revolución industrial de internet - Oscar Lage
Cloud Learning: la formación del siglo XXI - Mónica Mediavilla
Desarrollo web en Nodejs con Pillars por Chelo Quilón
La línea recta hacia el éxito - Jon Torrado - Betabeers Bilbao
6 errores a evitar si eres una startup móvil y quieres evolucionar tu app
Dev ops.continuous delivery - Ibon Landa (Plain Concepts)
Introducción a scrum - Rodrigo Corral (Plain Concepts)
Gestión de proyectos y consorcios internacionales - Iñigo Cañadas (GFI)
Software de gestión Open Source - Odoo - Bakartxo Aristegi (Aizean)
Elemental, querido Watson - Caso de Uso
Seguridad en tu startup
Spark Java: Aplicaciones web ligeras y rápidas con Java, por Fran Paredes.
Buenas prácticas para la optimización web
La magia de Scrum
Programador++ por @wottam
RaspberryPi: Tu dispositivo para IoT
Introducción al Big Data - Xabier Tranche - VIII Betabeers Bilbao 27/02/2015
PAYTPV Plataforma Integral de Cobros - VIII Betabeers Bilbao 27/02/2015

Último (20)

PPT
El-Gobierno-Electrónico-En-El-Estado-Bolivia
PDF
Maste clas de estructura metálica y arquitectura
PPTX
la-historia-de-la-medicina Edna Silva.pptx
PDF
CyberOps Associate - Cisco Networking Academy
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PPTX
Curso de generación de energía mediante sistemas solares
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
PPTX
Propuesta BKP servidores con Acronis1.pptx
PPTX
Power Point Nicolás Carrasco (disertación Roblox).pptx
PDF
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
PDF
Estrategia de Apoyo de Daylin Castaño (5).pdf
PDF
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
PPTX
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
PDF
informe_fichas1y2_corregido.docx (2) (1).pdf
PDF
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
PDF
capacitación de aire acondicionado Bgh r 410
PPTX
El uso de las TIC en la vida cotidiana..
PPTX
Sesion 1 de microsoft power point - Clase 1
PPTX
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
El-Gobierno-Electrónico-En-El-Estado-Bolivia
Maste clas de estructura metálica y arquitectura
la-historia-de-la-medicina Edna Silva.pptx
CyberOps Associate - Cisco Networking Academy
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
Curso de generación de energía mediante sistemas solares
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
Propuesta BKP servidores con Acronis1.pptx
Power Point Nicolás Carrasco (disertación Roblox).pptx
Instrucciones simples, respuestas poderosas. La fórmula del prompt perfecto.
Estrategia de Apoyo de Daylin Castaño (5).pdf
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
Acronis Cyber Protect Cloud para Ciber Proteccion y Ciber Seguridad LATAM - A...
informe_fichas1y2_corregido.docx (2) (1).pdf
Tips de Seguridad para evitar clonar sus claves del portal bancario.pdf
capacitación de aire acondicionado Bgh r 410
El uso de las TIC en la vida cotidiana..
Sesion 1 de microsoft power point - Clase 1
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
historia_web de la creacion de un navegador_presentacion.pptx

The Web of Data

  • 1. 5  Stars  Web:  The  web  of  Data  
  • 2. Temario Temario: 1.  Web de Datos: La visión. 2.  Tecnologías de la Web de Datos: Linked Data. 3.  Herramientas. 4.  Ejemplos de uso. CTIC Centro Tecnológico • www.fundacionctic.org
  • 3. La visión CTIC Centro Tecnológico • www.fundacionctic.org
  • 4. Web Semántica. 5 Stars Web Escala de excelencia creada por el inventor de la Web, Tim Berners-Lee para medir el nivel de publicación en las iniciativas Open Data. La bonanza de los conjuntos de datos publicados por una administración se mide en el rango de calidad de sus distribuciones de datos, establecido por los principios de la Web de Datos (5 ★ Open Data) CTIC Centro Tecnológico • www.fundacionctic.org
  • 5. Web Semántica. 5 Stars Web La “Linked Data Cloud” está formada por servidores que albergan miles de millones de datos en formatos semánticos. Para seguir la evolución de la nube LD: •  http://www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/DataSets •  http://richard.cyganiak.de/2007/10/lod/ •  http://www4.wiwiss.fu-berlin.de/lodcloud/ •  http://www4.wiwiss.fu-berlin.de/lodcloud/state CTIC Centro Tecnológico • www.fundacionctic.org
  • 6. Web Semántica. Tecnologías Construcción de la Web de Datos: Linked Data. •  URIs: Uso de identificadores únicos para la información publicada •  RDF: Uso de un modelo de datos común para representar la información. •  RDFS/OWL/SKOS: Empleo de vocabularios para establecer ontologías y clasificaciones. •  SPARQL: Lenguaje de consulta sobre 'servidores semánticos’. •  Otras tecnologías (Rules, lógica, …) para seguir construyendo .... CTIC Centro Tecnológico • www.fundacionctic.org
  • 7. RDF: modelo de datos RDF  (Resource  Descrip.on  Framework)  es  un  framework  ideado  y  diseñado   para  representar  información  sobre  recursos  en  un  espacio  global  (la  Web).     En  RDF  todos  los  recursos  son  idenEficados  por  una  URI:   •  IdenEficador  de  Recurso  Uniforme   •  Ubicuidad:  accesible  desde  cualquier  punto  de  la  web     La  unidad  básica  de  información  es  la  tripleta,  formada  por  un  sujeto,     un  predicado  y  un  objeto.             El  modelo  de  datos  que  intrínsecamente  se  representa  mediante  RDF  es  de   un  grafo  dirigido  (mulEgrafo  dirigido  y  eEquetado).   CTIC Centro Tecnológico • www.fundacionctic.org
  • 8. RDF: Grafo dirigido Ejemplo  de  grafo  RDF:  datos  personales.   CTIC Centro Tecnológico • www.fundacionctic.org
  • 9. RDF: Serializaciones, formatos CTIC Centro Tecnológico • www.fundacionctic.org
  • 10. RDF: Blank Nodes CTIC Centro Tecnológico • www.fundacionctic.org
  • 11. RDF: Literales tipados CTIC Centro Tecnológico • www.fundacionctic.org
  • 12. RDF: Especificaciones. Validación. Especificaciones  oficiales       •   hOp://www.w3.org/standards/techs/rdf   •   hOp://www.w3.org/TR/2004/REC-­‐rdf-­‐syntax-­‐grammar-­‐20040210/   •   hOp://www.w3.org/TR/2004/REC-­‐rdf-­‐primer-­‐20040210/   •   hOp://www.w3.org/TeamSubmission/turtle/   •   hOp://www.w3.org/2001/sw/RDFCore/ntriples/        Herramientas  para  la  validación  y  la  transformación  de  RDF:     •   hOp://www.w3.org/RDF/Validator/   •   hOp://www.rdfabout.com/demo/validator/       CTIC Centro Tecnológico • www.fundacionctic.org
  • 13. RDFS: Clases CTIC Centro Tecnológico • www.fundacionctic.org
  • 14. RDFS: Propiedades •  Definir una propiedad: rdf:Property •  Establecimiento del rango de aplicación de una propiedad: rdfs:range •  Establecimiento del dominio de aplicación de una propiedad: rdfs:domain •  Especialización de las propiedades: rdfs:subPropertyOf CTIC Centro Tecnológico • www.fundacionctic.org
  • 15. RDFS: Ejemplo CTIC Centro Tecnológico • www.fundacionctic.org
  • 16. RDFS: Limitaciones -> OWL. RDFS  Eene  una  serie  de  limitaciones  en  su  expresividad:     •  Cardinalidad  de  la  propiedades:  una  persona  sólo  Eene  un  padre.   •  TransiEvidad:  “descendiente  de”.   •  Propiedades  “clave”  de  las  clases:  DNI.   •  Dos  clases  diferentes  (URIs)  representan  la  misma  agrupación.   •  Dos  instancias  diferentes  (URIs)  representan  el  mismo  individuo.   •  Restricciones  en  la  cardinalidad  de  las  propiedades  dependiendo  de  la   clase  a  la  que  se  aplica:  “nº  de  jugadores”  (fútbol,  baloncesto,...)   •  Relaciones  entre  clases:  uniones,  intersecciones,  disjunciones.     Se  han  desarrollado  otros  estándares  como  DAML+OIL  y  OWL  basados  en   RDF/RDFS  que  permiten  definir  de  forma  más  extensa  la  SemánEca  de    un   dominio  de  conocimiento.     CTIC Centro Tecnológico • www.fundacionctic.org
  • 17. RDF: OWL (Web Ontology Language). •  Estándar  que  establece  un  lenguaje  para  definir  ontologías  para  la  Web  SemánEca.   •  No  está  ideado  sólo  para  su  uso  con  datos  en  RDF  (tripletas,  grafos).   •  Tiene  3  variantes  o  sublenguajes  con  diferentes  grados  de  expresividad:  OWL  Lite,  OWL  DL   and  OWL  Full  (ordenados  de  menos  a  mayor  complejidad).   •  Overview:    hOp://www.w3.org/TR/2009/REC-­‐owl2-­‐overview-­‐20091027/#   CTIC Centro Tecnológico • www.fundacionctic.org
  • 18. Descripción de recursos. Vocabularios estándar •  Vocabularios “estándar” internacionales: •  SKOS Vocabulario para describir sistemas de organización del conocimiento como diccionarios, taxonomías, tesauros, etc. http://www.w3.org/2004/02/skos/ •  DCMI Metadata Terms Dublin Core es una iniciativa para la especificación de metadatos básicos para recursos en general. http://dublincore.org/documents/dcmi-terms/ •  FOAF Friend Of A Friend es un vocabulario que permite describir personas y relaciones entre ellas. http://dublincore.org/documents/dcmi-terms/ •  vCard Estándar para el modelado en RDF de información de contacto de personas u organizaciones. http://www.w3.org/TR/vcard-rdf/ •  Geonames Ontología para describir lugares (ciudades, regiones, …). http://www.geonames.org/ontology/documentation.html •  Basic Geo (WGS84) Vocabulario creado por el W3C para definición de elementos geoespaciales básicos. http://www.w3.org/2003/01/geo/ •  RDFS, OWL Estándares del W3C para describir vocabularios y ontologías RDF. http://www.w3.org/TR/rdf-schema/ http://www.w3.org/TR/owl2-overview/ CTIC Centro Tecnológico • www.fundacionctic.org
  • 19. Publicación RDF. Linked Data •  Diferentes formas de publicar RDF. Como un fichero RDF estático -> es otro formato estructurado más. •  Publicación como Linked Data (LD): •  RDF como modelo de datos de la información. RDF/XML, Turtle, N3 … •  Non-Information resources vc Information Resources URIs de identificación vs URIs de representación. Dereferenciación. Uso de la negociación de contenido http para redirigir a las representaciones http://datos.gob.es/catalogo/catalogoNacional http://datos.gob.es/catalogo/catalogoNacional.rdf http://datos.gob.es/catalogo/catalogoNacional.html http://www4.wiwiss.fu-berlin.de/bizer/pub/linkeddatatutorial/ •  SPARQL -> Lenguaje de consulta estándar sobre servidores de información semántica CTIC Centro Tecnológico • www.fundacionctic.org
  • 20. Publicación RDF. Negociación de contenido PeEción  de  la  clase   “Restaurante”  por  parte   de  un  cliente  HTML   ! PeEción  de  la  clase   “Restaurante”  por  parte   de  un  cliente  RDF   ! CTIC Centro Tecnológico • www.fundacionctic.org
  • 21. Reutilización. SPARQL •  SPARQL Estándar para la consulta de datos en servidores semánticos. Por ejemplo la DBpedia. •  SPARQL se usa en la red mediante estándares que definen el protocolo y el formato de resultado: •  Protocolo SPARQL para RDF con vínculos a HTTP y SOAP •  Resultados SPARQL en formato XML o JSON •  http://www.w3.org/TR/rdf-sparql-query/ •  RDF es un modelo de datos de grafos dirigidos: •  La idea fundamental de SPARQL •  Se define un patrón contiene símbolos sin asociar. •  Asociando los símbolos, se seleccionan subgrafos del grafo RDF. •  Al hacer esa selección la consulta devuelve los recursos con sus asociaciones. CTIC Centro Tecnológico • www.fundacionctic.org
  • 22. Reutilización. SPARQL estructura. CTIC Centro Tecnológico • www.fundacionctic.org
  • 23. SPARQL. Ejemplo CTIC Centro Tecnológico • www.fundacionctic.org
  • 24. SPARQL. Ejemplo CTIC Centro Tecnológico • www.fundacionctic.org
  • 25. SPARQL. Ejemplo CTIC Centro Tecnológico • www.fundacionctic.org
  • 26. SPARQL. Ejemplo CTIC Centro Tecnológico • www.fundacionctic.org
  • 27. SPARQL. Ejemplo Devuelve:    [[<..49X>,33,:£,<…Palace>],  …  ,  [<..6682>,78,:$,  ]]   CTIC Centro Tecnológico • www.fundacionctic.org
  • 28. SPARQL. Ejemplo Devuelve:    [[<..49X>,33,:£,<…Palace>]  …]   CTIC Centro Tecnológico • www.fundacionctic.org
  • 29. SPARQL. Ejemplo Datos  de  turismo  del  Principado  de  Asturias:     •  IdenEficamos  el  punto  SPARQL   •  Y  (si  aplica)  el  grafo-­‐dataset  de  los  datos   CTIC Centro Tecnológico • www.fundacionctic.org
  • 30. SPARQL. Servidores: DBpedia •  DBpedia: •  Es una versión en RDF de la información de la Wikipedia. •  Recorre regularmente (crawling) las páginas de la wikipedia recogiendo información de sus tablas de datos (infoboxes) y jerarquías. •  Contiene casi 2000 millones de tripletas •  http://dbpedia.org/sparql Modificadores  de  la  solución   •  LIMIT   •  ORDER  BY   •  OFFSET     CTIC Centro Tecnológico • www.fundacionctic.org
  • 31. SPARQL. Servidores: DBpedia Uso  de  filtros  en  las  consultas.     •  Hallar  en  la  dbpedia  los  nombre  de  los  países  sin  costa  con  una     población  mayor  de  15000000.         CTIC Centro Tecnológico • www.fundacionctic.org
  • 32. Herramientas RDF Listado de herramientas en la wiki del W3C: http://www.w3.org/RDF/ •  Entornos de programación: •  Java: Jena, Sesame •  PHP: ARC2 •  Python: RDFLib •  Servidores nativos: Triple Stores (Quad Stores) •  Virtuoso •  4Store •  AllegroGraph •  Servicios web. Datos en la nube (cloud) •  Dydra •  Kasabi (Talis) CTIC Centro Tecnológico • www.fundacionctic.org
  • 33. Web de Datos: Ejemplos Google Rich Snippets: La mejora en la experiencia de usuario al realizar las búsquedas tiene efectos en la proporción de clics. CTIC Centro Tecnológico • www.fundacionctic.org
  • 34. Web de Datos: Ejemplos de uso CTIC Centro Tecnológico • www.fundacionctic.org
  • 35. Web de Datos: Iniciativas, Datos Gijón hOp://www.fundacioncEc.org/odlabgijon/   hOp://datos.gijon.es/   CTIC Centro Tecnológico • www.fundacionctic.org
  • 36. Muchas  Gracias,   Rubén  Marxn   hOp://www.fundacioncEc.org   hOp://datos.fundacioncEc.org   hOp://www.w3.org/eGov   ruben.marEn@fundacioncEc.org