SlideShare ist ein Scribd-Unternehmen logo
Advanced Markup & Metadata
Wintersemester 2013 / 2014
15. Januar 2014 – Semantic Web I: Mikroformate

Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung
Jan G. Wieners // jan.wieners@uni-koeln.de
Sitzungsüberblick
Ausgangspunkt: Das World Wide Web (WWW)
 Einschränkungen des WWW

Semantic Web





Problemstellung, Intention, Worum geht„s?
Wissensrepräsentation
(Ontologien)
Mikroformate

Später…
 RDF
 RDF / XML
 Anwendung: FOAF
World Wide Web
World Wide Web



Internet vs. WWW
WWW: Sehr großer Ressourcenfundus:
 Dokumente bzw. Textuelle Information (HTMLDokumente, PDF, etc.)
 Bilder
 Videodateien
 …






1989 am CERN entwickelt
Intention: Austausch von Forschungsergebnissen
Konzepte: Das WWW…

 bietet Mechanismen, um auf Dokumente des Internets
zugreifen zu können  HTTP, sowie die Eindeutige
Referenzierung von Inhalten: URL
 bietet eine Syntax (HTML), um Dokumente anzuzeigen
und miteinander zu verknüpfen (Hyperlinks)
World Wide Web
Aufruf einer Website - HTTP
 Client stellt Anfrage an Server
 Server beantwortet Anfrage, d.h. liefert ein
Dokument / eine Ressource zurück


HTML definiert eine Syntax, die von Rechnern
verstanden werden kann  HTML sagt dem
Rechner, wie das Dokument angezeigt werden soll
…die Nadel im Heuhaufen…?
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
It‘s magic?
„Magic“:
 Rechtschreibfehler:
„accidentally“

vs. „acidentally“
It‘s magic?
„Magic“ II:
 Ranking: Sortierung der Treffer von hochrelevanten zu
weniger relevanten Treffern

„Magic“ III:
 Performance:
World Wide Web
„What„s wrong with the web?“ – die Grenzen des
WWW
I. „Wer ist Jan Wieners?“
 Suchanfrage: Wieners
 [Wer], [ist] weniger relevante Suchterme
„What„s wrong with the web?“ – die Grenzen des
WWW
 II. „Zeige mir Fotos von Paris“

 Suchmaschinen versuchen (mitunter), die
Bedeutung eines Bildes / das im Bild dargestellt
durch den Kontext zu erschließen:
 Dateiname
 Text, der sich in Bildnähe befindet
World Wide Web
„What„s wrong with the
web?“ – die Grenzen
des WWW
 III. „Finde Musik, die
ich mögen könnte“
 Knackpunkt:
Hintergrundwissen –
Welche Musik mag ich
derzeit?
(Musikgeschmack
verändert sich mitunter)
Den Computermechanismen
mangelt„s an Wissen!

„knowledge gap“:
 Probleme im Verständnis
natürlicher Sprache
 Interpretation des Inhaltes von
Bildern oder anderen
multimedialen Dingen
 Computer verfügt nicht über
Hintergrundwissen über das der
Benutzer / die Benutzerin verfügt
 Computer verfügt nicht über
Hintergrundwissen über die
Benutzerin / den Benutzer

Oh weh, was
meint sie / er
damit bloß???
Semantic Web
Paradigmenwechsel: von passiver Rechenleistung
zu aktiver Rechenleistung (Verständnis der Inhalte)
Das Semantic Web will Computern helfen, die
Bedeutung hinter den Webseiten zu "verstehen“
 Das derzeitige WWW dreht sich um Dokumente
 Das Semantic Web dreht sich um Dinge
(Menschen, Musik, Filme), um Konzepte

Eine Möglichkeit: Einbettung semantischer
Information in HTML-Seiten
Semantic Web
Ach so ist das gemeint!
…hätte sie / er das nicht
gleich sagen können?!?

Wissenslücke zwischen
Benutzer und Computer
mindern




Bereitstellung von
Wissen in einer Art und
Weise, in der es von
Computern verarbeitet
werden und für weiteres
Schließen verwendet
werden kann
Z.B.: Bereitstellung von
(semantischen)
Metainformationen, die
die Inhalte der Website
beschreiben
(description, keywords, et
c.)
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
Friend-of-A-Friend (FOAF)
“Home pages typically say things such as:”









"My name is..."
"I work for..."
"I'm interested in..."
"I live near..."
"My blog is..."
"I write in this weblog..."
"You can see me in this picture..."
"My Public Key is ..."

“FOAF is a way to say all those things, but so that
computers can interpret it. Computers can't understand
English yet, so we have to be a little more precise in
how we say these things. FOAF is a way of saying
these things for computers.”
Bild + Metadaten
 Schlüsselwörter
 Georeferenzierung
◦ Adresskodierung (Postanschrift)
◦ Zuweisung von Koordinaten (Geotagging)
◦ …
Semantic Web







Konzept des Semantic Web formuliert 1996 von
Tim Berners-Lee
Kerntechnologien (logikbasierte Sprachen zur
Representation von Wissen und (automatisiertem)
Schließen) entwickelt im Forschungsfeld der
Künstlichen Intelligenz.
Standards: W3C
Ursprüngliche Intention: Annotation –
Anreicherung der Inhalte im WWW durch
Metadaten
WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate
Fokussierungsweisen von KI nach Russell / Norvig
Menschliches Denken

Rationales Denken

„[Die Automatisierung von]
Aktivitäten, die wir dem
menschlichen Denken
zuordnen, Aktivitäten wie
beispielsweise
Entscheidungsfindung,
Problemlösung, Lernen..“
(Bellman, 1978)

„Die Studie mentaler
Fähigkeiten durch die
Nutzung
programmiertechnischer
Modelle.“
(Charniak und
McDermott,1985)

Menschliches Handeln

Rationales Handeln

„Das Studium des
Problems, Computer dazu
zu bringen, Dinge zu tun,
bei denen ihnen
momentan der Mensch
noch überlegen ist.“
(Rich und Knight, 1991)

„Computerintelligenz ist die
Studie des Entwurfs
intelligenter Agenten.“
(Poole et al., 1998)
Mikroformate
Mikroformate
„Designed for humans first and machines
second, microformats are a set of simple, open data
formats built upon existing and widely adopted
standards.” (http://microformats.org/)
Semantic Web
Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate):

XHTML, einfach:
<div>
<div>Max Mustermann</div>
<div>Musterfirma</div
<div>01234/56789</div>
<a
href="http://example.com/">http://example.com/</a>
</div>
Semantic Web
Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate):
XHTML, einfach:
<div>
<div>Max Mustermann</div>
<div>Musterfirma</div
<div>01234/56789</div>
<a href="http://example.com/">http://example.com/</a>
</div>
Im Mikroformat „hCard“:
<div class="vcard">
<div class="fn">Max Mustermann</div>
<div class="org">Musterfirma</div>
<div class="tel">01234/56789</div>
<a class="url" href="http://example.com/">http://example.com/</a>
</div>
Übungsaufgaben
hCard, hCalendar, XHTML Friends Network (XFN)
/

Weitere ähnliche Inhalte

PPTX
SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description F...
PPT
Web2.0 neu
PPTX
Alexander Seifert: Altersgerechtes Internet durch angepasste Webgestaltung
PPT
PresentacióNandreaykuja
PPS
are you happy? (on Spanish)
PDF
Workflow Management Software mit IBM Lotus Notes
PPS
Los 12 mas malos
PDF
02álgebra programación linealsolución blog
SoSe 2013 | IT-Zertifikat: AMM - Semantic Web und das Resource Description F...
Web2.0 neu
Alexander Seifert: Altersgerechtes Internet durch angepasste Webgestaltung
PresentacióNandreaykuja
are you happy? (on Spanish)
Workflow Management Software mit IBM Lotus Notes
Los 12 mas malos
02álgebra programación linealsolución blog

Andere mochten auch (11)

PPTX
KiteWorldWide Social Media Economy Days Munich2011
PPTX
Bit wisem 2015-wieners-sitzung-08_Hausaufgaben zu den De Morganschen Gesetzen
PDF
A-Recruiter Tage 2013: Vortrag "Berufsnah statt praxisfern" (Herr Dr. Benit)
PDF
Ley de Dependencia
PPT
Dein Schleifpapier, das unbekannte Wesen
PPS
Define 1
PDF
Kundenprofitabilität Teil-1
PPTX
Descubriendo al yeica
PDF
Mit Blogs auf dem Gebiet HR arbeiten
PDF
Social Media Im Fachverlag
PDF
AWS Produkte im Überblick
KiteWorldWide Social Media Economy Days Munich2011
Bit wisem 2015-wieners-sitzung-08_Hausaufgaben zu den De Morganschen Gesetzen
A-Recruiter Tage 2013: Vortrag "Berufsnah statt praxisfern" (Herr Dr. Benit)
Ley de Dependencia
Dein Schleifpapier, das unbekannte Wesen
Define 1
Kundenprofitabilität Teil-1
Descubriendo al yeica
Mit Blogs auf dem Gebiet HR arbeiten
Social Media Im Fachverlag
AWS Produkte im Überblick
Anzeige

Ähnlich wie WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate (20)

PPTX
BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web
PPTX
BIT SoSem 2014 | Basisinformationstechnologie II - 03: Semantic Web
PPTX
Bit sosem 2016-wieners-sitzung-08_semantic-web
ODP
1 - Einfuehrung
PDF
Web 3.0
PDF
Semantic web d
PDF
Semantisches Web
PPT
Semantic Web? Hab ich was verpasst?
PDF
Über die Rolle des Semantic Web im Zukunftsweb
PPT
Wissenstechnologie I
PDF
soziales semantisches web
PPT
Wissensrepräsentation im Social Semantic Web
PDF
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
PPT
Friend of a friend (foaf)
PDF
Die "Semantic Web Recommendations" und das Jena Framework
PDF
Überblick Semantic Web
PDF
Semantic technologies
PPT
Semantic Web als Infrastruktur fuer die Wissensgesellschaft
ODP
20091124 Koeln Warum Semantik
PDF
Fit für Web 3.0 - Semantische Technologien
BIT I SoSem 2015 | Basisinformationstechnologie II - 03_Semantic Web
BIT SoSem 2014 | Basisinformationstechnologie II - 03: Semantic Web
Bit sosem 2016-wieners-sitzung-08_semantic-web
1 - Einfuehrung
Web 3.0
Semantic web d
Semantisches Web
Semantic Web? Hab ich was verpasst?
Über die Rolle des Semantic Web im Zukunftsweb
Wissenstechnologie I
soziales semantisches web
Wissensrepräsentation im Social Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Friend of a friend (foaf)
Die "Semantic Web Recommendations" und das Jena Framework
Überblick Semantic Web
Semantic technologies
Semantic Web als Infrastruktur fuer die Wissensgesellschaft
20091124 Koeln Warum Semantik
Fit für Web 3.0 - Semantische Technologien
Anzeige

Mehr von Institute for Digital Humanities, University of Cologne (20)

PPTX
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
PPTX
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
PPTX
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
PPTX
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
PPTX
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
PPTX
Bit sosem 2016-wieners-sitzung-13_ki-in-games
PPTX
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
PPTX
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
PPTX
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
PPTX
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
PPTX
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
PPTX
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
PPTX
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
PPTX
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
PPTX
Bit sosem 2016-wieners-sitzung-03_algorithmen
PPTX
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
PPTX
Bit sosem 2016-wieners-sitzung-01_auffrischung
PPTX
Bit sosem 2016-wieners-sitzung-00_themenueberblick
PPTX
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
PPTX
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 17.04.2019 | ...
Augmented City –Street Art, Embodiment, Cultural Heritage & AR | 03.04.2019 |...
Künstliche Intelligenz und visuelle Erzählungen: Comicanalyse | 03.04.2019 | ...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Transformation mittelhochdeutscher Erfahrungswelten – vom Text zum Computerga...
Bit sosem 2016-wieners-sitzung-13_ki-in-games
Bit sosem 2016-wieners-sitzung-12_bild-iv-computer-vision
Bit sosem 2016-wieners-sitzung-11_bild-iii-filter
Bit sosem 2016-wieners-sitzung-10_bild-ii-punktoperationen
Bit sosem 2016-wieners-sitzung-09_bild-i-kompression
Bit sosem 2016-wieners-sitzung-07_rechnerkommunikation-ii
Bit sosem 2016-wieners-sitzung-06_rechnerkommunikation
Bit sosem 2016-wieners-sitzung-05_zellulaere-automaten-conway
Bit sosem 2016-wieners-sitzung-04_theoretische-informatik
Bit sosem 2016-wieners-sitzung-03_algorithmen
Bit sosem 2016-wieners-sitzung-02_datenstrukturen
Bit sosem 2016-wieners-sitzung-01_auffrischung
Bit sosem 2016-wieners-sitzung-00_themenueberblick
Bit wisem 2015-wieners-sitzung-13_Zusammenfassung II
Bit wisem 2015-wieners-sitzung-12_Zusammenfassung I

WiSe 2013 | IT-Zertifikat: AMM - Semantic Web I: Mikroformate

  • 1. Advanced Markup & Metadata Wintersemester 2013 / 2014 15. Januar 2014 – Semantic Web I: Mikroformate Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de
  • 2. Sitzungsüberblick Ausgangspunkt: Das World Wide Web (WWW)  Einschränkungen des WWW Semantic Web     Problemstellung, Intention, Worum geht„s? Wissensrepräsentation (Ontologien) Mikroformate Später…  RDF  RDF / XML  Anwendung: FOAF
  • 4. World Wide Web   Internet vs. WWW WWW: Sehr großer Ressourcenfundus:  Dokumente bzw. Textuelle Information (HTMLDokumente, PDF, etc.)  Bilder  Videodateien  …    1989 am CERN entwickelt Intention: Austausch von Forschungsergebnissen Konzepte: Das WWW…  bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können  HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL  bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks)
  • 5. World Wide Web Aufruf einer Website - HTTP  Client stellt Anfrage an Server  Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück  HTML definiert eine Syntax, die von Rechnern verstanden werden kann  HTML sagt dem Rechner, wie das Dokument angezeigt werden soll
  • 6. …die Nadel im Heuhaufen…?
  • 10. It‘s magic? „Magic“ II:  Ranking: Sortierung der Treffer von hochrelevanten zu weniger relevanten Treffern „Magic“ III:  Performance:
  • 11. World Wide Web „What„s wrong with the web?“ – die Grenzen des WWW I. „Wer ist Jan Wieners?“  Suchanfrage: Wieners  [Wer], [ist] weniger relevante Suchterme
  • 12. „What„s wrong with the web?“ – die Grenzen des WWW  II. „Zeige mir Fotos von Paris“  Suchmaschinen versuchen (mitunter), die Bedeutung eines Bildes / das im Bild dargestellt durch den Kontext zu erschließen:  Dateiname  Text, der sich in Bildnähe befindet
  • 13. World Wide Web „What„s wrong with the web?“ – die Grenzen des WWW  III. „Finde Musik, die ich mögen könnte“  Knackpunkt: Hintergrundwissen – Welche Musik mag ich derzeit? (Musikgeschmack verändert sich mitunter)
  • 14. Den Computermechanismen mangelt„s an Wissen! „knowledge gap“:  Probleme im Verständnis natürlicher Sprache  Interpretation des Inhaltes von Bildern oder anderen multimedialen Dingen  Computer verfügt nicht über Hintergrundwissen über das der Benutzer / die Benutzerin verfügt  Computer verfügt nicht über Hintergrundwissen über die Benutzerin / den Benutzer Oh weh, was meint sie / er damit bloß???
  • 15. Semantic Web Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte) Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“  Das derzeitige WWW dreht sich um Dokumente  Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten
  • 17. Ach so ist das gemeint! …hätte sie / er das nicht gleich sagen können?!? Wissenslücke zwischen Benutzer und Computer mindern   Bereitstellung von Wissen in einer Art und Weise, in der es von Computern verarbeitet werden und für weiteres Schließen verwendet werden kann Z.B.: Bereitstellung von (semantischen) Metainformationen, die die Inhalte der Website beschreiben (description, keywords, et c.)
  • 19. Friend-of-A-Friend (FOAF) “Home pages typically say things such as:”         "My name is..." "I work for..." "I'm interested in..." "I live near..." "My blog is..." "I write in this weblog..." "You can see me in this picture..." "My Public Key is ..." “FOAF is a way to say all those things, but so that computers can interpret it. Computers can't understand English yet, so we have to be a little more precise in how we say these things. FOAF is a way of saying these things for computers.”
  • 20. Bild + Metadaten  Schlüsselwörter  Georeferenzierung ◦ Adresskodierung (Postanschrift) ◦ Zuweisung von Koordinaten (Geotagging) ◦ …
  • 21. Semantic Web     Konzept des Semantic Web formuliert 1996 von Tim Berners-Lee Kerntechnologien (logikbasierte Sprachen zur Representation von Wissen und (automatisiertem) Schließen) entwickelt im Forschungsfeld der Künstlichen Intelligenz. Standards: W3C Ursprüngliche Intention: Annotation – Anreicherung der Inhalte im WWW durch Metadaten
  • 23. Fokussierungsweisen von KI nach Russell / Norvig Menschliches Denken Rationales Denken „[Die Automatisierung von] Aktivitäten, die wir dem menschlichen Denken zuordnen, Aktivitäten wie beispielsweise Entscheidungsfindung, Problemlösung, Lernen..“ (Bellman, 1978) „Die Studie mentaler Fähigkeiten durch die Nutzung programmiertechnischer Modelle.“ (Charniak und McDermott,1985) Menschliches Handeln Rationales Handeln „Das Studium des Problems, Computer dazu zu bringen, Dinge zu tun, bei denen ihnen momentan der Mensch noch überlegen ist.“ (Rich und Knight, 1991) „Computerintelligenz ist die Studie des Entwurfs intelligenter Agenten.“ (Poole et al., 1998)
  • 25. Mikroformate „Designed for humans first and machines second, microformats are a set of simple, open data formats built upon existing and widely adopted standards.” (http://microformats.org/)
  • 26. Semantic Web Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate): XHTML, einfach: <div> <div>Max Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div>
  • 27. Semantic Web Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate): XHTML, einfach: <div> <div>Max Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Im Mikroformat „hCard“: <div class="vcard"> <div class="fn">Max Mustermann</div> <div class="org">Musterfirma</div> <div class="tel">01234/56789</div> <a class="url" href="http://example.com/">http://example.com/</a> </div>
  • 29. /