SlideShare a Scribd company logo
CORSO DI STRUMENTI E APPLICAZIONI DEL WEB
2014/15
SEMANTIC SEARCH
ENGINE
The future web 3.0Prof. Roberto Polillo Bernadette
Cama
Valentina Primiceri
Davide
Queste slides fanno parte del corso “Strumenti e applicazioni del
Web”. Il sito del corso, con il materiale completo, si trova in
www.corsow.wordpress.com.
Il presente materiale è pubblicato con licenza Creative Commons
“Attribuzione - Non commerciale - Condividi allo stesso modo –
3.0” (http://creativecommons.org/licenses/by-nc-
sa/3.0/it/deed.it):
La licenza non si estende alle immagini provenienti da altre fonti
e alle screen shots, i cui diritti restano in capo ai rispettivi
proprietari, che, ove possibile, sono stati indicati. L'autore si
scusa per eventuali omissioni, e resta a disposizione per
correggerle.
• Introduzione
• Web Semantico
• Freebase
• Bing
• DeepDyve
• DuckDuckGo
• Wolfram Alpha
• Conclusioni
{
{
{
PRIMA
PARTE
TERZA
PARTE
SECONDA
PARTE
INTRODUZIONE
“il Web semantico è un’estensione del Web corrente in cui le
informazioni hanno un ben preciso significato e in cui i
computer e utenti lavorano in cooperazione.”
Fonte: Semantic Web-Scientific American, Maggio 2001
WEB SEMANTICO
Il termine Web semantico è stato proposto nel 2001 da Tim
Berners-Lee.
• trasformazione del World Wide Web in un ambiente dove i
documenti pubblicati sono associati ad informazioni e dati che
ne specificano il contesto semantico
WEB 3.0 E INTELLIGENZA SEMANTICA
• indicare quelle tecnologie in grado di trasformare informazioni
non strutturate in un insieme di informazioni strutturate che
può essere interpretato ed elaborato automaticamente sulla
base delle proprietà semantiche dei dati.
• in grado di lavorare con i "concetti": reso possibile dalla
combinazione di analisi semantica e codici di mark-up, che
riescono a tradurre in linguaggio informatico i domini della
conoscenza.
STRUTTURA WEB SEMANTICO
• dati
• metadati (informazioni sui dati)
• ontologie
METADATI
.raggiungimento dei seguenti obiettivi:
• Ricerca: individuazione dell’esistenza di un determinato documento
• Localizzazione: rintracciare dove si trova una particolare occorrenza di quel
documento
• Selezione: di un determinato documento in base a valutazioni e/o filtri
• Interoperabilità semantica: che permette la ricerca in ambiti disciplinari
diversi, grazie all’uso di descrizioni equivalenti
• Gestione risorse: gestione di raccolte di documenti tramite cataloghi e
banche dati
• Disponibilità: avere informazioni sull’effettiva disponibilità del documento.
ONTOLOGIE
“un’ontologia è una collezione di frasi che definiscono le
relazioni tra concetti e specificano le regole logiche”
Fonte: Tim Berners-Lee, 99
MOTORI DI RICERCA SEMANTICI
• l’input dell’utente è una frase o una domanda
• il motore guida l’utente direttamente verso l’informazione
ricercata
• è possibile recuperare documenti esprimendo query complesse
Search
Monkey Hakia
Hakia
Searc
Monkey
Deepdyve
Bing
Google
Squared
Wolfram
Alpha
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
Dbpedia
Freebase
Cogniti
on
TIMELINELANCIO E CHIUSURA DEI MOTORI DI RICERCA SEMANTICI PIU’
NOTI
Freebase
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Multilanguage
• Creative Commons
• Risorsa globale che permette alle persone (e alle
macchine) di accedere all'informazione più
efficacemente
«un database aperto di
conoscenza condivisa
del mondo» (Metaweb)
Global Rark
36,716
Alexa.com
Semantic Search Engine
ABOUT
• Struttura a nodi
ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
• Promozione degli utenti
ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
• Promozione degli utenti
• Argomenti tradotti in più lingue
ABOUT
• Struttura a nodi
• Circa 44 milioni di argomenti nel 2014
• Richiede registrazione solo in fase di sviluppo
• Promozione degli utenti
• Argomenti tradotti in più lingue
• Verrà ritirato entro il 30 giugno 2015
Bing
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Nato da Live Search
• Terzo motore di ricerca al mondo
• Suggerimenti e ricerche correlate
Fonti: http://www.webmaori.com/blog/bing-il-motore-di-ricerca-semantico-sfida-
Global Rank
24
Alexa.com
"But it's not
Google"
• Calcoli matematici
• Ricerche su enciclopedia
• Info mediche
• Risultati sportivi e di
borsa
• Etc..Fonti:http://www.bing.com/?setlang=it
Semantic Search Engine
Semantic Search Engine
DeepDyv
e
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Biblioteca commerciale online
• 30 milioni di articoli
• Diverse opzioni di abbonamento e noleggio
Fonti:https://www.deepdyve.com/
Global Rank
56,794
Alexa.com
Semantic Search Engine
DuckDuck
Go
2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
2014
• Migliore pertinenza di ricerca
• Non traccia gli utenti
• Filtra pagine con pubblicità eccessiva
Fonti:https://duckduckgo.com/
Global Rank
569
Alexa.com
Semantic Search Engine
• Tipo: motore di conoscenza computazionale
• Creato da: Wolfram Research
• Registrazione: Opzionale
• Lanciato: 15 maggio 2009
• Modello di business: Freemium
• Slogan: Making the World's Knowledge Computable
INTRODUZIONE
Fonte: www.alexa.com
(26.05.2015)
STATISTICHE DEL SITO
Stephan Wolfram, CEO of Wolfram
Research
«Tutto ciò che si deve essere in grado di fare
è quello di rispondere alle domande in
linguaggio naturale che la gente pone, e
rappresentarle in una forma precisa,
rendendo tutta la conoscenza computabile e
accessibile da tutti»
VIDEO INTRODUTTIVO
PRINCIPALI CARATTERISTICHE:
• In grado di interpretare query sia in linguaggio formale che in
lingua naturale;
• Attualmente incentrato sulle scienze tecniche (matematica,
fisica, chimica,…);
• E’ solo in Inglese;
• La registrazione consente personalizzazioni.
COM’E’ STRUTTURATO:
• Scritto in oltre 15 milioni di righe di codice basato sul
linguaggio di Mathematica
• 50.000 algoritmi;
• Eseguito su più di 10.000 CPU;
• l suoi database comprendono centinaia di dataset (es:
«Condizioni meteo»):
• accumulati in diversi anni;
• controllati e certificati da esperti con conoscenze pertinenti
Sistema
gestione
del profilo
personale
Scelta
colore
back-
ground
Social
Barra
delle
informazi
oni
Comand
o di
calcolo
Le ultime
news
Funzionalità
PRO
STRUTTURA PAGINA PRINCIPALE
Fonte: www.wolpramalpha.co
ESEMPIO RISULTATI 1/2
Query
Pubblicità
versione
PRO
Opzione
per
disambigua
re la query
Sommario
Pubblici
tà
interna
Fonte: www.wolpramalpha.comm
ESEMPIO RISULTATI 2/2
Fonte: www.wolpramalpha.co
Fonte: www.wolpramalpha.comm
PRINCIPALI USI: valori nutritivi
Fonte: www.wolpramalpha.com
PRINCIPALI USI: confronto
Fonte: www.wolpramalpha.co
PRINCIPALI USI: Calcolo Complesso
Fonte: www.wolpramalpha.comm
LA SUA UTILITA’: conteggio
Fonte: www.wolpramalpha.comm
PRINCIPALI USILI: Dove sono
PRINCIPALI USI: Generare Password
Fonte: www.wolpramalpha.com
SELEZIONE ARTICOLI ON-LINE 1/3
Fonte: www.bits.blogs.nytimes.com
09/03/2009
SELEZIONE ARTICOLI ON-LINE 2/3
Fonte: www.theverge.com
06/02/2012
SELEZIONE ARTICOLI ON-LINE 3/3
Fonte: www.theverge.com
30/08/2012
Semantic Search Engine
CONCLUSIONI
VANTAGGI
• Supporto come strumento educativo
• Capacità di eseguire calcoli complessi
• Creazione di widget intuitivi per il buisness
• Organizzazione della conoscenza
SVANTAGGI
• Tecnologia ancora non completamente sviluppata
• L’utente medio non lo utilizza
• Difficoltà di utilizzo
Grazie per l’attenzione
Applausi (per favore)
Lo Staff

More Related Content

PPTX
5. Introduzione al web (ii)
PPTX
9. Come trovare l'informazione (I)
PPTX
Conclusioni del corso
PPTX
7. Applicazioni Web e CMS
PPTX
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
PPT
9. Ricercare nel web (Parte I)
PPT
17.Web feed e aggregatori
PPSX
Collaborative Editing
5. Introduzione al web (ii)
9. Come trovare l'informazione (I)
Conclusioni del corso
7. Applicazioni Web e CMS
Slides delle lezioni del corso di Strumenti e applicazioni del Web per il cor...
9. Ricercare nel web (Parte I)
17.Web feed e aggregatori
Collaborative Editing

What's hot (20)

PPT
24. Conclusioni del corso (e alcune osservazioni globali)
PPTX
16. Social media
PPT
19. La presenza delle organizzazioni sul Web delle aziende (II)
PPTX
20. Social networks
PPTX
Editoria e industria dei media di fronte alla rivoluzione digitale
PPTX
18. Content sharing sites
PPTX
15. La forma breve e il microblogging
PPTX
17. Web feed e aggregatori
PPT
3. Introduzione a internet (ii)
PPT
17. Web feed e aggregatori
PPT
12. Mobile web
PPTX
6. Il browser
PPT
1. Introduzione al corso
PPT
20. Le organizzazioni sul web
PPTX
14. I blog
PPTX
19. Le organnizzazioni sul web e segg
PPT
13. Content sharing sites (i)
PPTX
Wikipedia
PPT
13. I blog
PPTX
7. Applicazioni web e CMS
24. Conclusioni del corso (e alcune osservazioni globali)
16. Social media
19. La presenza delle organizzazioni sul Web delle aziende (II)
20. Social networks
Editoria e industria dei media di fronte alla rivoluzione digitale
18. Content sharing sites
15. La forma breve e il microblogging
17. Web feed e aggregatori
3. Introduzione a internet (ii)
17. Web feed e aggregatori
12. Mobile web
6. Il browser
1. Introduzione al corso
20. Le organizzazioni sul web
14. I blog
19. Le organnizzazioni sul web e segg
13. Content sharing sites (i)
Wikipedia
13. I blog
7. Applicazioni web e CMS
Ad

Viewers also liked (14)

PPTX
Open internet
PDF
TV over the Internet: il video on-demand, Netflix e la concorrenza in Italia
PDF
Politiche di moderazione nei social network
PPTX
Web fakes
PDF
Crowdfunding
PPTX
Web reputation
PDF
Storytelling 2.0: definizione, tools, casi studio
PDF
Il marketing virale
PPTX
Sharing Economy
PPTX
Realtà Aumentata
PPTX
8. Il vostro blog
PDF
Google art project - TTC
PPTX
13. Internet business models
PPT
11. Evoluzione del Web (I)
Open internet
TV over the Internet: il video on-demand, Netflix e la concorrenza in Italia
Politiche di moderazione nei social network
Web fakes
Crowdfunding
Web reputation
Storytelling 2.0: definizione, tools, casi studio
Il marketing virale
Sharing Economy
Realtà Aumentata
8. Il vostro blog
Google art project - TTC
13. Internet business models
11. Evoluzione del Web (I)
Ad

Similar to Semantic Search Engine (20)

PPTX
9 - Ricercare nel Web
PPTX
7 - Ricercare nel web - 17/18
PPTX
Ricercare nel web
PPTX
7 - Ricercare nel web - 16/17
PPTX
10 - Ricercare nel web II
PDF
Il web intelligente
PPTX
06 - Il browser
PDF
Il "Knowledge Graph" della Pubblica Amministrazione Italiana
PDF
Framework di sviluppo web: introduzione a bootstrap e boostack
KEY
BibliotecaAccessibile
PDF
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
PDF
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
PPTX
Il nuovo catalogo della rete URBS - La migrazione akoha
PPTX
Introduzione - Web design
PPTX
Funziona! allora non toccarlo, ovvero l'analisi d'infrastruttura in esercizio.
PPTX
Pensiero Analogico e Microservizi
PDF
Seo e Web Marketing - 1 | WebMaster & WebDesigner
PDF
WordCycle short
PDF
Power BI: Introduzione ai dataflow e alla preparazione dei dati self-service
PDF
Data flow
9 - Ricercare nel Web
7 - Ricercare nel web - 17/18
Ricercare nel web
7 - Ricercare nel web - 16/17
10 - Ricercare nel web II
Il web intelligente
06 - Il browser
Il "Knowledge Graph" della Pubblica Amministrazione Italiana
Framework di sviluppo web: introduzione a bootstrap e boostack
BibliotecaAccessibile
2015-06 Roberto Boselli, Dal dato non strutturato alle ontologie
Ontologie per i linked open data / Stefano De Luca, Paola De Caro, Claudia C...
Il nuovo catalogo della rete URBS - La migrazione akoha
Introduzione - Web design
Funziona! allora non toccarlo, ovvero l'analisi d'infrastruttura in esercizio.
Pensiero Analogico e Microservizi
Seo e Web Marketing - 1 | WebMaster & WebDesigner
WordCycle short
Power BI: Introduzione ai dataflow e alla preparazione dei dati self-service
Data flow

Semantic Search Engine

  • 1. CORSO DI STRUMENTI E APPLICAZIONI DEL WEB 2014/15 SEMANTIC SEARCH ENGINE The future web 3.0Prof. Roberto Polillo Bernadette Cama Valentina Primiceri Davide
  • 2. Queste slides fanno parte del corso “Strumenti e applicazioni del Web”. Il sito del corso, con il materiale completo, si trova in www.corsow.wordpress.com. Il presente materiale è pubblicato con licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo – 3.0” (http://creativecommons.org/licenses/by-nc- sa/3.0/it/deed.it): La licenza non si estende alle immagini provenienti da altre fonti e alle screen shots, i cui diritti restano in capo ai rispettivi proprietari, che, ove possibile, sono stati indicati. L'autore si scusa per eventuali omissioni, e resta a disposizione per correggerle.
  • 3. • Introduzione • Web Semantico • Freebase • Bing • DeepDyve • DuckDuckGo • Wolfram Alpha • Conclusioni { { { PRIMA PARTE TERZA PARTE SECONDA PARTE
  • 4. INTRODUZIONE “il Web semantico è un’estensione del Web corrente in cui le informazioni hanno un ben preciso significato e in cui i computer e utenti lavorano in cooperazione.” Fonte: Semantic Web-Scientific American, Maggio 2001
  • 5. WEB SEMANTICO Il termine Web semantico è stato proposto nel 2001 da Tim Berners-Lee. • trasformazione del World Wide Web in un ambiente dove i documenti pubblicati sono associati ad informazioni e dati che ne specificano il contesto semantico
  • 6. WEB 3.0 E INTELLIGENZA SEMANTICA • indicare quelle tecnologie in grado di trasformare informazioni non strutturate in un insieme di informazioni strutturate che può essere interpretato ed elaborato automaticamente sulla base delle proprietà semantiche dei dati. • in grado di lavorare con i "concetti": reso possibile dalla combinazione di analisi semantica e codici di mark-up, che riescono a tradurre in linguaggio informatico i domini della conoscenza.
  • 7. STRUTTURA WEB SEMANTICO • dati • metadati (informazioni sui dati) • ontologie
  • 8. METADATI .raggiungimento dei seguenti obiettivi: • Ricerca: individuazione dell’esistenza di un determinato documento • Localizzazione: rintracciare dove si trova una particolare occorrenza di quel documento • Selezione: di un determinato documento in base a valutazioni e/o filtri • Interoperabilità semantica: che permette la ricerca in ambiti disciplinari diversi, grazie all’uso di descrizioni equivalenti • Gestione risorse: gestione di raccolte di documenti tramite cataloghi e banche dati • Disponibilità: avere informazioni sull’effettiva disponibilità del documento.
  • 9. ONTOLOGIE “un’ontologia è una collezione di frasi che definiscono le relazioni tra concetti e specificano le regole logiche” Fonte: Tim Berners-Lee, 99
  • 10. MOTORI DI RICERCA SEMANTICI • l’input dell’utente è una frase o una domanda • il motore guida l’utente direttamente verso l’informazione ricercata • è possibile recuperare documenti esprimendo query complesse
  • 11. Search Monkey Hakia Hakia Searc Monkey Deepdyve Bing Google Squared Wolfram Alpha 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Dbpedia Freebase Cogniti on TIMELINELANCIO E CHIUSURA DEI MOTORI DI RICERCA SEMANTICI PIU’ NOTI
  • 12. Freebase 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 • Multilanguage • Creative Commons • Risorsa globale che permette alle persone (e alle macchine) di accedere all'informazione più efficacemente «un database aperto di conoscenza condivisa del mondo» (Metaweb) Global Rark 36,716 Alexa.com
  • 15. ABOUT • Struttura a nodi • Circa 44 milioni di argomenti nel 2014
  • 16. ABOUT • Struttura a nodi • Circa 44 milioni di argomenti nel 2014 • Richiede registrazione solo in fase di sviluppo
  • 17. ABOUT • Struttura a nodi • Circa 44 milioni di argomenti nel 2014 • Richiede registrazione solo in fase di sviluppo • Promozione degli utenti
  • 18. ABOUT • Struttura a nodi • Circa 44 milioni di argomenti nel 2014 • Richiede registrazione solo in fase di sviluppo • Promozione degli utenti • Argomenti tradotti in più lingue
  • 19. ABOUT • Struttura a nodi • Circa 44 milioni di argomenti nel 2014 • Richiede registrazione solo in fase di sviluppo • Promozione degli utenti • Argomenti tradotti in più lingue • Verrà ritirato entro il 30 giugno 2015
  • 20. Bing 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 • Nato da Live Search • Terzo motore di ricerca al mondo • Suggerimenti e ricerche correlate Fonti: http://www.webmaori.com/blog/bing-il-motore-di-ricerca-semantico-sfida- Global Rank 24 Alexa.com "But it's not Google"
  • 21. • Calcoli matematici • Ricerche su enciclopedia • Info mediche • Risultati sportivi e di borsa • Etc..Fonti:http://www.bing.com/?setlang=it
  • 24. DeepDyv e 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 • Biblioteca commerciale online • 30 milioni di articoli • Diverse opzioni di abbonamento e noleggio Fonti:https://www.deepdyve.com/ Global Rank 56,794 Alexa.com
  • 26. DuckDuck Go 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 • Migliore pertinenza di ricerca • Non traccia gli utenti • Filtra pagine con pubblicità eccessiva Fonti:https://duckduckgo.com/ Global Rank 569 Alexa.com
  • 28. • Tipo: motore di conoscenza computazionale • Creato da: Wolfram Research • Registrazione: Opzionale • Lanciato: 15 maggio 2009 • Modello di business: Freemium • Slogan: Making the World's Knowledge Computable INTRODUZIONE
  • 30. Stephan Wolfram, CEO of Wolfram Research «Tutto ciò che si deve essere in grado di fare è quello di rispondere alle domande in linguaggio naturale che la gente pone, e rappresentarle in una forma precisa, rendendo tutta la conoscenza computabile e accessibile da tutti»
  • 32. PRINCIPALI CARATTERISTICHE: • In grado di interpretare query sia in linguaggio formale che in lingua naturale; • Attualmente incentrato sulle scienze tecniche (matematica, fisica, chimica,…); • E’ solo in Inglese; • La registrazione consente personalizzazioni.
  • 33. COM’E’ STRUTTURATO: • Scritto in oltre 15 milioni di righe di codice basato sul linguaggio di Mathematica • 50.000 algoritmi; • Eseguito su più di 10.000 CPU; • l suoi database comprendono centinaia di dataset (es: «Condizioni meteo»): • accumulati in diversi anni; • controllati e certificati da esperti con conoscenze pertinenti
  • 34. Sistema gestione del profilo personale Scelta colore back- ground Social Barra delle informazi oni Comand o di calcolo Le ultime news Funzionalità PRO STRUTTURA PAGINA PRINCIPALE Fonte: www.wolpramalpha.co
  • 35. ESEMPIO RISULTATI 1/2 Query Pubblicità versione PRO Opzione per disambigua re la query Sommario Pubblici tà interna Fonte: www.wolpramalpha.comm
  • 36. ESEMPIO RISULTATI 2/2 Fonte: www.wolpramalpha.co
  • 38. PRINCIPALI USI: valori nutritivi Fonte: www.wolpramalpha.com
  • 39. PRINCIPALI USI: confronto Fonte: www.wolpramalpha.co
  • 40. PRINCIPALI USI: Calcolo Complesso Fonte: www.wolpramalpha.comm
  • 41. LA SUA UTILITA’: conteggio Fonte: www.wolpramalpha.comm
  • 43. PRINCIPALI USI: Generare Password Fonte: www.wolpramalpha.com
  • 44. SELEZIONE ARTICOLI ON-LINE 1/3 Fonte: www.bits.blogs.nytimes.com 09/03/2009
  • 45. SELEZIONE ARTICOLI ON-LINE 2/3 Fonte: www.theverge.com 06/02/2012
  • 46. SELEZIONE ARTICOLI ON-LINE 3/3 Fonte: www.theverge.com 30/08/2012
  • 48. CONCLUSIONI VANTAGGI • Supporto come strumento educativo • Capacità di eseguire calcoli complessi • Creazione di widget intuitivi per il buisness • Organizzazione della conoscenza SVANTAGGI • Tecnologia ancora non completamente sviluppata • L’utente medio non lo utilizza • Difficoltà di utilizzo
  • 49. Grazie per l’attenzione Applausi (per favore) Lo Staff