Metadata, standaarden, interoperabiliteit, semantisch web en linked data
1. Metadata, standaarden, interoperabiliteit, semantisch web & linked data Eric Sieverts Media, Informatie & Communicatie (Hogeschool van Amsterdam) DA31 eric sieverts, maart 2011
2. voorbeelden van standaardisatie van kenmerken in webpagina's Google recipes RDFa / e-commerce ontology eric sieverts, MIC, maart 2011
3. standaardisatie van eigenschappen/kenmerken in beschrijving van recepten met "microformats" / "rich snippets markup"
4. standaardisatie van eigenschappen/kenmerken van producten met "GR-ontologie" in "RDFa"
5.
6. voorbeelden van standaardisatie van kenmerken in kader van "linked data" NY Times "tag"-beschrijvingen Last.fm muzieksite Linked Data impliceert / vereist "interoperabiliteit" van systemen: ze moeten van elkaar begrijpen wat ze bedoelen eric sieverts, MIC, maart 2011
9. enkele van de gebruikte standaarden voor beschrijvingselementen: v: vcard mo: music ontology foaf: friend of a friend owl: web ontology language geo
10.
11.
12.
13. Tim Berners Lee: 1989: "invented" the World Wide Web 2004: proposed the "semantic web" 2006: designed "linked data" as a step towards realisation of the semantic web eric sieverts, MIC, maart 2011
14.
15. the "linked open data cloud" - september 2010 - 24 billion data online by standardisation of dataformats and metadata, computers can "understand" the meaning of these data & use them
16. dbpedia: data from Wikipedia last.fm: artists geonames: 6.2 M toponyms BBC: wildlife finder Flickr project Gutenberg IMDB music brainz rechtspraak.nl Reuters: openCalais viaf: virtual international authority file LCSH NY times
17. fragment uit het linked data VIAF-record voor Lewis Carroll viaf.org/viaf/66462036/rdf.xml
18. fragment uit het linked data VIAF-record voor Hugo Brandt Corstius viaf.org/viaf/94439179/rdf.xml
19. kernbegrippen die we tegenkwamen semantiek (= betekenis, begrijpen) interoperabiliteit (= kunnen samenwerken) metadata (= beschrijven & karakteriseren) ontologieën (= kennis organisatie systemen) semantisch web (= informatie op web begrijpen) linked data (= gegevens op web begrijpen, linken en hergebruiken) op allerlei manieren horen daar standaarden bij eric sieverts, MIC, maart 2011
20. interoperabiliteit Interoperability is the ability of two or more systems or components to exchange information and to use the information that has been exchanged Semantic Interoperability is the ability of computer systems to communicate information and have that information properly interpreted by the receiving system in the same sense as intended by the transmitting system. bron: Wikipedia Interoperabiliteit betekent in het algemeen dat systemen (of apparatuur) in staat zijn tot onderlinge uitwisseling of/en communicatie. De systemen kunnen m.a.w. ‘praten met elkaar’ en zijn in zekere zin ‘compatibel’. Om interoperabiliteit te bereiken zijn standaarden , protocollen en procedures erg belangrijk bron: http://www.cjsm.vlaanderen.be/e-cultuur/beleidskader/bouwstenen/lexicon.html eric sieverts, MIC, maart 2011
21. standaarden bij niveaus van metadata weergave van de metadata (en hun beschrijvingen/definities) standaarden: XML, (X)HTML, in database (?) beschrijving van de metadata standaarden: RDF, RDFa, microformats beschrijving van de metadatastandaard standaarden: OWL, SKOS definitie van de metadata: klassen van eigenschappen standaarden: DC, MARC21, FRBR, GR, LOM, Vcard, ... (regels voor invullen van) waarden van eigenschappen standaarden: thesauri (MeSH, AAT, ...), AACR2, RDA, ISO8601, ... eric sieverts, MIC, maart 2011
22. <persoon> <naam> <voornaam> Eric </voornaam> <voornaam> Gerard </voornaam> <achternaam> Sieverts </achternaam> </naam> <adres> <straat> <straatnaam> Marnixstraat </straatnaam> <nummer> 163 </nummer> <extra> parterre </extra> </straat> <plaats> Amsterdam </plaats> <postcode> 1015 VN </postcode> </adres> <schoenmaat> 42 </schoenmaat> <geboortedatum schema="iso8601"> 1947-02-16 </geboortedatum> <lengte maat="cm"> 174 </lengte> </persoon> weergave van metadata in XML eric sieverts, MIC, maart 2011 standaard voor weergeven van datum
26. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:vcard="http://imc.org/vCard/3.0#" xmlns:mesh="http://nlm.nih.gov/mesh/MBrowser.htm"> <rdf:Description rdf:about="http://www.xxx.nl/yyy/doc1.xml"> <dc:title>Indexing of medical articles</dc:title> <dc:creator> <rdf:Description about="http://www.yyy.nl/authors/smithj"> <vcard:FN>John Smith</vcard:FN> <vcard:EMAIL>smithj@nih.gov</vcard:EMAIL> </rdf:Description> </dc:creator> <dc:subject>indexing</dc:subject> <mesh:subject>Abstracting and Indexing as Topic</mesh:subject> <mesh:subject>International Classification of Diseases </mesh:subject> <mesh:classification>L1.453.245.100.</mesh:classification> <mesh:classification>L1.453.245.945.400.</mesh:classification> </rdf:Description> </rdf:RDF> beschrijving van metadata in RDF; weergave van RDF in XML eric sieverts, MIC, maart 2011 verwijzing naar gebruikte standaarden
28. RDF (en linked data) computerleesbare beschrijvingen van metadata bijv. met RDF (resource description framework): RDF triple stores waarbij te beschrijven ding een webadres (URI) heeft eigenschap van dat ding liefst ook een URI heeft "waarde" van die eigenschap liefst ook een URI heeft voorbeeld: boek (heeft een webadres: URI) heeft auteur (betekenis van eigenschap ergens beschreven: URI) persoon (gegevens van persoon ergens op web te vinden: URI) eric sieverts, MIC, maart 2011
29. RDF tripels subject {predicaat} object doc1 {heeft auteur} auth1 auth1 {heeft naam} john smith auth1 {heeft affiliatie} home inc. auth1 {heeft email} [email_address] grafische representatie van simpel netwerk van 4 RDF-tripels eric sieverts, MIC, maart 2011
30. dezelfde RDF-tripels in XML <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns="http://www.john.smith.net/rdfexample/" > < rdf:Description rdf:about="http://www.xxx.com/yyy/doc1.xml"> < author > < rdf:Description rdf:about="http://www.xxx.com/autId/7801"> < name > John Smith </name> < affiliation > Home Inc. </affiliation> < email > [email_address] </email> < /rdf:Description > </ author > < /rdf:Description > </rdf:RDF> namespaces URI's van beschreven resources eric sieverts, MIC, maart 2011
31. eric sieverts, MIC, maart 2011 structuur van metadatamodellen plat (bijv. Dublin Core) hiërarchie (bijv. FOAF) klassen (bijv. LOM) relationeel (bijv. FRBR) relationeel + klassen (bijv. Music Ontology) relationeel + hiërarchie (??)
33. persoon naam adres schoenmaat geboortedatum lengte voornaam tussenvoeg achternaam straat plaats postcode straatnaam nummer extra boomstructuur voor metadatadefinitie (zelfbedachte metadata-"standaard") eric sieverts, MIC, maart 2011
34. metadatadefinitie beschreven volgens DTD-standaard ten behoeve van weergave in XML eric sieverts, MIC, maart 2011
35. hiërarchie van metadata volgens FOAF-standaard in metadatabeschrijving in XML <foaf:Group> <foaf:name>ILRT staff</foaf:name> <foaf:member> <foaf:Person> <foaf:name>Martin Poulter</foaf:name> <foaf:homepage rdf:resource="http://www.ilrt.bris.ac.uk/aboutus/ staff/staffprofile/?search=plmlp"/> <foaf:workplaceHomepage rdf:resource="http://www.ilrt.bris.ac.uk/"/> </foaf:Person> </foaf:member> </foaf:Group> eric sieverts, MIC, maart 2011
36. hiërarchie van eigenschappen in metadata vcard:ADR vcard:poBox vcard:extendedAddress vcard:streetAddress vcard:locality vcard:region vcard:postalCode vcard:countryName vcard:N vcard:familyName vcard:givenName vcard:additionalName vcard:honorificPrefix vcard:honorificSuffix eric sieverts, MIC, maart 2011 of zijn dit eigenlijk klassen ?
38. FRBR (functional requirements for bibliographic records) is relationeel model (relaties tussen entiteiten) structuur van "velden" van elke entiteit kan beschreven met XSD (XML schema taal)
39. REP Patrick LeBoeuf (BNF) FRBR voorbeeld: "Boris Godunov" W study about the opera Борис Годунов FRBNW006 W Борис Годунов : opera FRBNW002 W Борис Годунов: libretto FRBNW003 W Борис Годунов: tragedy FRBNW004 W illustrations for the play Борис Годунов FRBNW005 W introduction to the play Борис Годунов FRBNW007 S ADA COM E French translation E001 E 1869 version E001 E 1872 version E002 E Rimsky-K's arrangement E003 E French transl. by O. Lanceray E002 E English translation E003 E definitive state E001 E original text E001 A 1997 recording A001 A 1997 recording A001 A 1962 recording A001 M ca. 1922 publication FRBNM010 M 1998 release FRBNM002 M 1996 re-release FRBNM003 M 1980 publication FRBNM004 M 1937 publication FRBNM005 M 1926 publication FRBNM006 M 1910 publication FRBNM007 M 1982 (Paris) publication FRBNM008 M 1927 publication FRBNM011 M 1982 (NYC) publication FRBNM009 I I001 I I001 I I001 I I001 I I001 I I001 I I001 I I002 I I001 I I001 I I001 E002 E Russian text 1872 version E001 E Russian text 1869 version COM E Russian text ed. by P. Lamm E003 E French transl. by Lily Denis E004 E French tr. by Delines and Laloy E005 COM COM E French transl. by A. Baranoff E004 E001 E Russian text SUP TRA TRA TRA TRA TRA
40. ontologieën algemene aanduiding voor "kennisorganisatiesystemen" definities en relaties van zowel "velden" als "waarden" zijn in ontologie te beschrijven hiërarchische structuur van "velden" mogelijk : (metadatastandaarden zoals Vcard, FOAF, GoodRelations, ... zijn ontologieën) hiërarchische structuur van "waarden" mogelijk (thesauri zoals MeSH, AAT, ... zijn ontologieën) (computerleesbaar) beschrijven van ontologieën OWL : "Web Ontology Language" (algemene uitgebreide standaard) SKOS : "Simple Knowledge Organisation System" (eenvoudige/beperkte standaard, vooral voor thesauri) eric sieverts, MIC, maart 2011
41. voorbeeld van hiërarchische structuur van inhoudelijke termen in MeSH-thesaurus eric sieverts, MIC, maart 2011
42. voorbeeld van hiërarchische structuur van inhoudelijke termen in AAT (Art & Architecture Thesaurus) eric sieverts, MIC, maart 2011
43. interoperabiliteit en SKOS om interoperabiliteit tussen systemen “automatisch” te kunnen laten verlopen is een standaard nodig om computerleesbaar te beschrijven: hoe een bepaald ontsluitingssysteem in elkaar zit hoe relaties tussen begrippen moeten worden geïnterpreteerd (bijv.: of iets een Broader Term, een Narrower Term of ... is ) hoe begrippen zich verhouden tot die in een ander systeem, ... SKOS is ontwikkeld om dat makkelijk en gestandaardiseerd te kunnen SKOS: Simple Knowledge Organisation System eric sieverts, MIC, maart 2011
44. grafische weergave van SKOS-representatie van thesaurustermen & relaties: netwerk van RDF-tripels Term : Economic cooperation Used For : Economic co-operation Broader terms : Economic policy Narrower terms : Economic integration, European economic cooperation, European industrial cooperation, Industrial cooperation Related terms : Interdependence Scope Note : Includes cooperative measures in banking, trade, industry etc., between and among countries.
45. SKOS representatie in RDF <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept> <skos:prefLabel>Economic cooperation</skos:prefLabel> <skos:altLabel>Economic co-operation</skos:altLabel> <skos:scopeNote>Includes cooperative measures in banking, trade, industry etc., between and among countries. </skos:scopeNote> <skos:broader> <skos:Concept> <skos:prefLabel>Economic policy</skos:prefLabel> </skos:Concept> </skos:broader> <skos:related> <skos:Concept> <skos:prefLabel>Interdependence</skos:prefLabel> </skos:Concept> </skos:related> <skos:narrower> <skos:Concept> <skos:prefLabel>Economic integration</skos:prefLabel> </skos:Concept> </skos:narrower> <!-- ...more narrower terms omitted ... --> </skos:Concept> </rdf:RDF> computerleesbare weergave
46. lagenstructuur van gebruikte standaarden ascii, utf-8, unicode, uri, .. xml rdf thesaurus technische basisstructuren weergeven van beschrijving beschrijven van metadatabeschrijving kennisorganisatiesysteem / ontologie skos beschrijven van thesaurus eric sieverts, MIC, maart 2011
47. SKOS relaties in dit voorbeeld zagen we standaard thesaurusrelaties: <skos:prefLabel> voorkeursterm voor concept <skos:altLabel> synoniemen <skos:scopeNote> omschrijving van concept <skos:broader> algemener concept <skos:narrower> specifieker concept ook beschrijving in hoeverre termen uit verschillende thesauri inhoudelijk overeenkomen (concordantie) : <skos:mappingRelation> overeenkomst met term uit ander systeem <skos:exactMatch> term heeft zelfde betekenis <skos:closeMatch> term heeft bijna zelfde betekenis <skos:broadMatch> term is ruimer <skos:narrowMatch> term is specifieker eric sieverts, MIC, maart 2011
48. AACR2 Anglo-American Cataloging Rules AAT Art & Architecture Thesaurus DC Dublin Core DTD Document Type Definition FOAF Friend-of-a friend FRBR Functional Requirements for Bibliographic Records GR Good Relations Ontology HTML HyperText Markup Language ISO International Organization for Standardization LOM Learning Object Metadata MARC Machine Readable Cataloging MeSH Medical Subject Headings MO Music Ontology OWL Web Ontology Language RDA Resource Description & Access RDF Resource Description Framework RDFa RDF in Attributes SKOS Simple Knowledge Organisation System URI Uniform Resource Identifier XML eXtensible Markup Language what this alphabet soup means