SlideShare a Scribd company logo
COACH: Un workbenchper NLP, l'analisi dei testi e l'estrazione di termini COACH: unWorkbench per NLPS.LaricciaSapienzaUniversità di Roma – Digilabstefano.lariccia@uniroma1.itGiovanni Toffoli [Link srl]   				toffoli@uni.net
1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiOpen KnowledgeOpen LearningWeb Science
1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiSi descrive un work-in-progress consistente nell’adattamento, estensione e integrazione in Plone di un set di strumenti per l’elaborazione testi (NLP). Ci siamo proposti di aggregare le principali risorse disponibili per la elaborazione della lingua italiana e di renderle accessibili attraverso un CMS per consentirne una utilizzazione più estesa, cioè allargata a tutti coloro che pur interessati all’uso degli strumenti NLP non avrebbero le risorse per configurare il proprio workbenchpiù documentata, per garantire anche ad utenti “sporadici” una utilizzazione rapida ed efficace più flessibile d) più adatta  all’insegnamento e alla creazione di ambienti di didattica (non esclusivamente  Abbiamo scelto il linguaggio Python, il toolkit NLTK e l’ambiente CMS Plone. ABSTRACT1.1
1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiL'attività descritta intende anche essere un elemento di aggregazione per iniziative su cui richiedere un contributo di finanziamento pubblico, nell'ambito di programmi di ricerca nazionali ed europei, e di collaborazioni con enti che diffondono la cultura italiana nel mondo.Una domanda di finanziamento europeo COACH sarà presentata a luglio 2010 ABSTRACT1.1
1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiCon COACH, un set di strumenti accessibili  trough-the-web, un workbench, per l’analisi dei testi e l’estrazione di termini da corpus linguistici pre-esistenti in italiano, inglese e spagnolo intendiamo presentare un “manifesto” per la costituzione di una comunità di ricerca attorno ad uno strumento, un workbench appunto, che ci consenta di aggregare le migliori risorse disponibili attorno ad alcune linee guida della ricerca in area umanistica. 1.2
1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiIl presente lavoro  è  proposto come un work-in-progress, consistente nell'adattamento, nell'estensione e nell'integrazione attorno all’ambiente  Plone di strumenti per l'elaborazione di testi (NLP), per  il tagging, il crunching e sullo sfondo l’inferenza semantica a partire corporapre-elaboraticontro cui confrontare testi singoli, e raccolte ulteriori di testi. Il focus del lavoro sarà per ora limitato (per quanto riguarda la sperimentazione iniziale) sulla lingua italiana. 1.3
1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.4Il primo obbiettivo è infatti quello di disporre anche per l'italiano di una suite di tool che consentano di effettuare una migliore indicizzazione full-text dei documenti e di estrarre da essi i "termini" rappresentativi candidati ad essere usati per il "tagging" dei contenuti stessi (nel contesto di blog, digitallibrary, ecc.). In seguito vorremmo supportare costruzione semi-automatica di glossari e ontologie, web mining, ecc. Il secondo obbiettivo è quello di far tesoro delle risorse generate – in maniera più o meno  consapevole nel workbench comune – dalle attività autonome di ciascuno degli stakeholders, da ciascuno dei membri della comunità di utenti.
1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  Il terzo obbiettivo è quello di costituire corpus specializzati nell’esame di testi non contemporanei, introducendo variabili e modelli che consentano l’identificazione su una scala diacronica dei testi sottoposti a indagine.
1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  I principali componenti che intendiamo integrare in Plone sono:- NLTK (NaturalLanguageToolKit), una libreria Python e un insieme di risorse linguistiche, soprattutto corpora, risultato della più interessante iniziativa open-source nel campo della linguistica computazionale; si tratta di divulgazione ad alto livello- un paio di risorse linguistiche di libero dominio e di ottima qualità disponibili per l'italiano: costituiscono un'eccezione in un panorama desolante, tenuto conto anche degli ingenti finanziamenti pubblici italiani ed europei che sono stati dedicati a questo settore nel periodo 1990-2010. 
1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  A parte PERL, che è un linguaggio di scripting specialistico e dalla sintassi criptica, crediamo che Python sia il linguaggio di programmazione general-purpose che meglio supporta la sperimentazione nel campo dell'analisi dei testi.
1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  Plone di per sé non aggiunge un contributo essenziale, maun sito Plone potrà beneficiare del package in corso di sviluppola piattaforma Zope/Plone è comunque un'ottima base di partenza per qualsiasi applicazione che deve essere accessibile su web; e le funzionalità di content management  e di user management di Plone faciliteranno la gestione di risorse linguistiche personalizzate (es: basi di documenti e file di parametri) nell'ottica di installazioni che forniscano un servizio aperto.
2COACH: Obbiettivi funzionaliCOACH, ambientecollaborativodi NLP2.3 Nell’implementare COACH, l’ambiente collaborativo d di NLP, abbiamo definito alcuni obbiettivi funzionaliche ci sembrano abbastanza innovativi e che allo stesso tempo costituiscono un primo step realistico per “innestare” COACH nell’utilizzazione pratica di un numero consistente di apprendisti e di ricercatori. Gli obbiettivi elencati in ordine non gerarchico di importanza, sono in prima approssimazione i seguenti:
2COACH: Obbiettivi funzionaliWordPress, Joomla, Drupal and Plone2.4 Effetto Wikinomics: Integrare tramite un CMS  – a partire dal progetto NLTK – la capacità di feedback intelligente sugli algoritmi di apprendimento basati sul confronto con un corpus standard - ad una comunità di studenti in linguistica computazionale, in modo da usufruire del supporto di un numero di operatori umani superiore di 1 o più ordini di grandezza rispetto agli attuali ristretti gruppi di ricerca (da 100 a 10.000, da 100 a 100.000) 
2COACH: Obbiettivi funzionali2.5 Rendere accessibile a linguisti, filologi, studiosi del testo, storici della lingua italiana e storici uno strumento che sia in grado di fornire un servizio valutabile per un ampio numero di ricercatori, rendendo così appetibile il suo utilizzo e creando in questo modo un feedback positivo sia per il perfezionamento di un corpus e delle regole di campionamento del corpus, sia per il perfezionamento degli algoritmi di analisi ed estrazione termini
2COACH: Obbiettivi funzionaliWordPress, Joomla, Drupal and Plone2.6Mettere a test la necessità di potenza di calcolo, sperimentando diverse soluzioni per rendere disponibili potenze di elaborazione crescenti on-demand, rendendo possibile la profilazione, la rendicontazione ed il pagamento del computingpower richiesto da ciascuna ricerca..
2COACH: Obbiettivi funzionaliWordPress, Joomla, Drupal and Plone2.7Identificazione di uno standard identificativo unico per i termini di una lingua (sull’esempio del DOI? Dei riferimenti bibliografici? Etc.) che renda possibile la referenziazione dinamica, basata su una autorità formale, di un termine, di un concetto, di un significato in uno spazio linguistico definito da una sorgente – autoritativa (Webservices DNS?); provvedere ad un meccanismo di classificazione diacronica di tale lista 
2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8abbiamo individuato obbiettivi applicativi che ci sembravano sufficientemente realistici (ciò che linguisti e filologi si attendono da uno strumento reale ed esistente) e allo stesso tempo potenzialmente innovativi. Gli obbiettivi elencati in ordine non gerarchico di importanza, sono in prima approssimazione i seguenti:
2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Essere in grado di identificare le probabilità di occorrenza e co-occorrenza di termini dati in un contesto specifico dato, a fronte di analoghi valori generali dell’Italiano (classificazione degli ambiti della langue); significa avere meccanismi automatici di pre-identificazione di un numero limitato di contesti linguistici; crono-localizzazione
2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Mettere un ampio numero di utenti proattivi in grado di sperimentare algoritmi per l’associazione di stili autorali con testi dall’autore non identificato e di fornire feedback per il perfezionamento degli algoritmi stessi; ipso-identificazione
2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Mettere un ampio numero di utenti proattivi in grado di sperimentare algoritmi per l’associazione di stili regionali e di altre comunità locali e di fornire feedback per il perfezionamento degli algoritmi stessi;  geo –localizzazione
2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Preparare la piattaforma collettiva per il successivo ampliamento funzionale che estenda le funzionalità di analisi al dominio della semantica e delle ontologie, mediante la predisposizione di un impianto architetturale software APERTO, MODULARE, DOCUMENTATO e facilmente documentabile attraverso l’attività dello stesso utente.
2CMS come aggregatori di modelli per la Web ScienceCasi d’ uso concreti nel progetto “Il linguaggio delle emozioni”2.9 Come primo caso d’uso, all'interno del progetto PRIN “Il Linguaggio delle emozioni” ci proponiamo di costituire un ambiente di “sperimentazione linguistica” (LinguisticWorkbench) con il quale mettere alla prova i seguenti procedimenti e i seguenti framework di riferimento per una analisi semantica di corpora letterari:
2CMS come aggregatori di modelli per la Web Scienceindividuazione dei radicali caratterizzanti di uso più frequente del corpus SapienzaEmozionidescrizione del loro inserimento all'interno dell'ontologia Wordnet per creare una topografia specifica, verificarne il coinvolgimento di altri campi, e la discendenza relativa (facendo emergere proprietà specifiche come funzioni metaforiche e alti usi)fare emergere dal contrasto tra corpus testuale (corpus oggetto di indagine)  e corpus di riferimento le proprietà specifiche di ciascun dominio indagabile (autore, epoca, lingue, genere, linee stilistiche, “scuole”, etc.esser pronti a individuare tramite il feedback  tra corpus di riferimento e corpus di studio nuove strategie di studio e nuovi possibili dominiCasi d’ uso concreti nel progetto “Il linguaggio delle emozioni”2.1
3COACH: casi d’usoPossibili casi d’ uso di COACH in altri ambiti di ricerca3.1 Dato un dominio o una sottorete, si chiede al software di analizzare le pagine pubblicate sotto le URI appartenenti al dominio specificato estraendone sintagmi, termini e coppie di termini statisticamente rilevanti;Il “corpus delle emozioni” un’ analisi attraverso NLTK su un corpus preparato per il gruppo di lavoro Un corpus delle leggi costituzionali di alcuni paesi europei  
3COACH: RiferimentiRiferimenti bibliografici3.2 Pecheux, M. 1982, Language, Semantics, and Ideology, {PalgraveMacmillan}.Pecheux, M.  AutomaticDiscourseAnalysis (Utrecht Studies in Language and Communication, No 5), RodopiBvEditions. Fuksas, A. 2002, Etimologia e geografia nella lirica dei trovatori, Roma. .
3COACH: RiferimentiRiferimenti elettronici (DOI)3.2  Nicola Simonetti, Filosofia della mente e neuroscienze: il caso dei neuroni specchio, giovedì, novembre 19, 2009, Relazione SFI, Novara, 28.10.2009 .
8Web Semantico e “intelligence” per le comunità della scienza
8COACH: un worbench collaborativo per  NLP
9Riferimenti Books and papers9.11. Sherman, Chris.Partner & Executive Editor. London : Search Engine Land, 2008. paper.2. Berners-Lee, T., et al.A framework for Web Science. s.l. : NOW, 2006. 1-933019-33-6.3. Towards a Semantic Web. Lariccia, S. Toffoli, G. Ferrara : s.n., 2004.4. Simon, Herbert A.The Science of artificial. Cambridge : The MIT Press, 1996. 0262691914. 
Sapienza UniversityThe University of Rome "La Sapienza“ was founded on April 20th, 1303 through an edict ("Bolla") by Pope Boniface the VIIIth.
According to the Academic Ranking of World Universities published by the Institute of Higher Education of Shanghai Jiao Tong University,
Sapienza University of Rome ranks among top 30 european universities and as one of the best Italian Universities, together with the Universities of Milan, Pisa and Bologna...Institutional mappingSapienza UniversityThe University of Rome "La Sapienza" has a very specific birth certificate since it was founded on April 20th, 1303 through an edict ("Bolla") by Pope Boniface the VIIIth. LIDS Laboratory forInformaticsDidacticsand Science.DigilabCentreDigilabisstartingnowas a Centrefor New MediaDigilabCentreSapienza2: Research on new methods of Web-learning, especially for HumanitiesDigilabisconstituted in April 2009 with 4 tasks:1: digitalizationofbooksownedbySapienzaand Padua UniversityBooksDitalizationWeb-learningSAP: Contonous LearningMedia for Science4: advanced services of communication  for  research and science3: Service of certification and Continous Learning for the national Administration
Summary?Do You Have Any Questions???

More Related Content

PDF
COACH - Un workbench per l'analisi dei testi e l'estrazione di termini
PDF
Seminario Daniela Ghironi, 25-10-2012
PDF
Manual para crear un video
PDF
Poster mobile200 fastweb maggio 2013
PDF
S. maria
PDF
Etwining europeanqualitylabel projet "Enseigner le français et l'italien ave...
PPT
4.2 Design Di Sistema Per Equitá E Coesione Sociale Vezzoli 09 10
COACH - Un workbench per l'analisi dei testi e l'estrazione di termini
Seminario Daniela Ghironi, 25-10-2012
Manual para crear un video
Poster mobile200 fastweb maggio 2013
S. maria
Etwining europeanqualitylabel projet "Enseigner le français et l'italien ave...
4.2 Design Di Sistema Per Equitá E Coesione Sociale Vezzoli 09 10

Similar to Plone4 ur coach un nlp framework per plone may 20 2010 1 (15)

ODP
201304011 comphumanities 2013
PDF
Dialogare con le macchine in linguaggio naturale... Finalmente! Ma ci voleva ...
PPT
"Colorless green ideas sleep furiously."
PDF
Il Web Del Futuro Visioni E Idee Sul Web Semantico
PPTX
201203021 comphumanities 2012
PPTX
Do IAs Dream of Electric Sheeps? Un'immersione nemmeno troppo noiosa nella IA...
PDF
Text_to_text__Come_ragionare_con_le_AI_-_Human_Singularity.pdf
PDF
Un componente NER Multi-language per il TermExtractor
PPTX
Intelligenza artificiale nel mondo front-end - CodeGen2021
PPT
Digilab march 20100315 progetti comphumanities lariccia
PDF
Natural Language Processing
PPTX
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
PDF
Intelligenza Artificiale e Chatbot: Limiti Attuali e Sviluppi Futuri
PDF
Microsoft Fabric and Open AI - Caso d'uso reale
PPTX
Cognitive Services & LUIS
201304011 comphumanities 2013
Dialogare con le macchine in linguaggio naturale... Finalmente! Ma ci voleva ...
"Colorless green ideas sleep furiously."
Il Web Del Futuro Visioni E Idee Sul Web Semantico
201203021 comphumanities 2012
Do IAs Dream of Electric Sheeps? Un'immersione nemmeno troppo noiosa nella IA...
Text_to_text__Come_ragionare_con_le_AI_-_Human_Singularity.pdf
Un componente NER Multi-language per il TermExtractor
Intelligenza artificiale nel mondo front-end - CodeGen2021
Digilab march 20100315 progetti comphumanities lariccia
Natural Language Processing
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
Intelligenza Artificiale e Chatbot: Limiti Attuali e Sviluppi Futuri
Microsoft Fabric and Open AI - Caso d'uso reale
Cognitive Services & LUIS
Ad

More from Stefano Lariccia (20)

PDF
Reportàge on Kaliningrad LEMONDE.3PAG.pdf
PPTX
Application frame methods and techniques in HighEd courses and self-paced lea...
PPTX
Application frame methods and techniques to include advanced digital technolo...
PPTX
01 - Genius Loci Tusciae 1 Lariccia.pptx
PPTX
Presentazione Oleg 06.07.2023.pptx
PPTX
ASviS Capranica ppt Genius loci 6 7 23.pptx
PPTX
05 - Genius Loci Conference La Trinità - DeGasperi 20230706_slide.pptx
PPTX
Perche visitare essaouira (1)
PDF
Statisticatoday turismo and Covid-19
PDF
271 288 paper_04_pages_from_205_332_tourism_2010_03e_crop
PDF
Ercis wp 18new (1)
PDF
2009 educational data mining 8 43-2-pb
PDF
Assessment of micro events sustainability-09-00343
PDF
Wef hghi outbreak readiness_business_impact
PDF
692981 indovino marco
PDF
European green-deal-communication en
PDF
19 12 17_laurea_dd_l
PDF
Data from past pilots part 2 learning analytics
PPTX
William demby, a novelist across atlantic
PDF
Spotlight
Reportàge on Kaliningrad LEMONDE.3PAG.pdf
Application frame methods and techniques in HighEd courses and self-paced lea...
Application frame methods and techniques to include advanced digital technolo...
01 - Genius Loci Tusciae 1 Lariccia.pptx
Presentazione Oleg 06.07.2023.pptx
ASviS Capranica ppt Genius loci 6 7 23.pptx
05 - Genius Loci Conference La Trinità - DeGasperi 20230706_slide.pptx
Perche visitare essaouira (1)
Statisticatoday turismo and Covid-19
271 288 paper_04_pages_from_205_332_tourism_2010_03e_crop
Ercis wp 18new (1)
2009 educational data mining 8 43-2-pb
Assessment of micro events sustainability-09-00343
Wef hghi outbreak readiness_business_impact
692981 indovino marco
European green-deal-communication en
19 12 17_laurea_dd_l
Data from past pilots part 2 learning analytics
William demby, a novelist across atlantic
Spotlight
Ad

Plone4 ur coach un nlp framework per plone may 20 2010 1

  • 1. COACH: Un workbenchper NLP, l'analisi dei testi e l'estrazione di termini COACH: unWorkbench per NLPS.LaricciaSapienzaUniversità di Roma – Digilabstefano.lariccia@uniroma1.itGiovanni Toffoli [Link srl] toffoli@uni.net
  • 2. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiOpen KnowledgeOpen LearningWeb Science
  • 3. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiSi descrive un work-in-progress consistente nell’adattamento, estensione e integrazione in Plone di un set di strumenti per l’elaborazione testi (NLP). Ci siamo proposti di aggregare le principali risorse disponibili per la elaborazione della lingua italiana e di renderle accessibili attraverso un CMS per consentirne una utilizzazione più estesa, cioè allargata a tutti coloro che pur interessati all’uso degli strumenti NLP non avrebbero le risorse per configurare il proprio workbenchpiù documentata, per garantire anche ad utenti “sporadici” una utilizzazione rapida ed efficace più flessibile d) più adatta all’insegnamento e alla creazione di ambienti di didattica (non esclusivamente Abbiamo scelto il linguaggio Python, il toolkit NLTK e l’ambiente CMS Plone. ABSTRACT1.1
  • 4. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiL'attività descritta intende anche essere un elemento di aggregazione per iniziative su cui richiedere un contributo di finanziamento pubblico, nell'ambito di programmi di ricerca nazionali ed europei, e di collaborazioni con enti che diffondono la cultura italiana nel mondo.Una domanda di finanziamento europeo COACH sarà presentata a luglio 2010 ABSTRACT1.1
  • 5. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiCon COACH, un set di strumenti accessibili trough-the-web, un workbench, per l’analisi dei testi e l’estrazione di termini da corpus linguistici pre-esistenti in italiano, inglese e spagnolo intendiamo presentare un “manifesto” per la costituzione di una comunità di ricerca attorno ad uno strumento, un workbench appunto, che ci consenta di aggregare le migliori risorse disponibili attorno ad alcune linee guida della ricerca in area umanistica. 1.2
  • 6. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di terminiIl presente lavoro è proposto come un work-in-progress, consistente nell'adattamento, nell'estensione e nell'integrazione attorno all’ambiente Plone di strumenti per l'elaborazione di testi (NLP), per il tagging, il crunching e sullo sfondo l’inferenza semantica a partire corporapre-elaboraticontro cui confrontare testi singoli, e raccolte ulteriori di testi. Il focus del lavoro sarà per ora limitato (per quanto riguarda la sperimentazione iniziale) sulla lingua italiana. 1.3
  • 7. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.4Il primo obbiettivo è infatti quello di disporre anche per l'italiano di una suite di tool che consentano di effettuare una migliore indicizzazione full-text dei documenti e di estrarre da essi i "termini" rappresentativi candidati ad essere usati per il "tagging" dei contenuti stessi (nel contesto di blog, digitallibrary, ecc.). In seguito vorremmo supportare costruzione semi-automatica di glossari e ontologie, web mining, ecc. Il secondo obbiettivo è quello di far tesoro delle risorse generate – in maniera più o meno consapevole nel workbench comune – dalle attività autonome di ciascuno degli stakeholders, da ciascuno dei membri della comunità di utenti.
  • 8. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  Il terzo obbiettivo è quello di costituire corpus specializzati nell’esame di testi non contemporanei, introducendo variabili e modelli che consentano l’identificazione su una scala diacronica dei testi sottoposti a indagine.
  • 9. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  I principali componenti che intendiamo integrare in Plone sono:- NLTK (NaturalLanguageToolKit), una libreria Python e un insieme di risorse linguistiche, soprattutto corpora, risultato della più interessante iniziativa open-source nel campo della linguistica computazionale; si tratta di divulgazione ad alto livello- un paio di risorse linguistiche di libero dominio e di ottima qualità disponibili per l'italiano: costituiscono un'eccezione in un panorama desolante, tenuto conto anche degli ingenti finanziamenti pubblici italiani ed europei che sono stati dedicati a questo settore nel periodo 1990-2010. 
  • 10. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  A parte PERL, che è un linguaggio di scripting specialistico e dalla sintassi criptica, crediamo che Python sia il linguaggio di programmazione general-purpose che meglio supporta la sperimentazione nel campo dell'analisi dei testi.
  • 11. 1COACH: Un workbench per l'analisi dei testi e l'estrazione di termini 1.5  Plone di per sé non aggiunge un contributo essenziale, maun sito Plone potrà beneficiare del package in corso di sviluppola piattaforma Zope/Plone è comunque un'ottima base di partenza per qualsiasi applicazione che deve essere accessibile su web; e le funzionalità di content management e di user management di Plone faciliteranno la gestione di risorse linguistiche personalizzate (es: basi di documenti e file di parametri) nell'ottica di installazioni che forniscano un servizio aperto.
  • 12. 2COACH: Obbiettivi funzionaliCOACH, ambientecollaborativodi NLP2.3 Nell’implementare COACH, l’ambiente collaborativo d di NLP, abbiamo definito alcuni obbiettivi funzionaliche ci sembrano abbastanza innovativi e che allo stesso tempo costituiscono un primo step realistico per “innestare” COACH nell’utilizzazione pratica di un numero consistente di apprendisti e di ricercatori. Gli obbiettivi elencati in ordine non gerarchico di importanza, sono in prima approssimazione i seguenti:
  • 13. 2COACH: Obbiettivi funzionaliWordPress, Joomla, Drupal and Plone2.4 Effetto Wikinomics: Integrare tramite un CMS – a partire dal progetto NLTK – la capacità di feedback intelligente sugli algoritmi di apprendimento basati sul confronto con un corpus standard - ad una comunità di studenti in linguistica computazionale, in modo da usufruire del supporto di un numero di operatori umani superiore di 1 o più ordini di grandezza rispetto agli attuali ristretti gruppi di ricerca (da 100 a 10.000, da 100 a 100.000) 
  • 14. 2COACH: Obbiettivi funzionali2.5 Rendere accessibile a linguisti, filologi, studiosi del testo, storici della lingua italiana e storici uno strumento che sia in grado di fornire un servizio valutabile per un ampio numero di ricercatori, rendendo così appetibile il suo utilizzo e creando in questo modo un feedback positivo sia per il perfezionamento di un corpus e delle regole di campionamento del corpus, sia per il perfezionamento degli algoritmi di analisi ed estrazione termini
  • 15. 2COACH: Obbiettivi funzionaliWordPress, Joomla, Drupal and Plone2.6Mettere a test la necessità di potenza di calcolo, sperimentando diverse soluzioni per rendere disponibili potenze di elaborazione crescenti on-demand, rendendo possibile la profilazione, la rendicontazione ed il pagamento del computingpower richiesto da ciascuna ricerca..
  • 16. 2COACH: Obbiettivi funzionaliWordPress, Joomla, Drupal and Plone2.7Identificazione di uno standard identificativo unico per i termini di una lingua (sull’esempio del DOI? Dei riferimenti bibliografici? Etc.) che renda possibile la referenziazione dinamica, basata su una autorità formale, di un termine, di un concetto, di un significato in uno spazio linguistico definito da una sorgente – autoritativa (Webservices DNS?); provvedere ad un meccanismo di classificazione diacronica di tale lista 
  • 17. 2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8abbiamo individuato obbiettivi applicativi che ci sembravano sufficientemente realistici (ciò che linguisti e filologi si attendono da uno strumento reale ed esistente) e allo stesso tempo potenzialmente innovativi. Gli obbiettivi elencati in ordine non gerarchico di importanza, sono in prima approssimazione i seguenti:
  • 18. 2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Essere in grado di identificare le probabilità di occorrenza e co-occorrenza di termini dati in un contesto specifico dato, a fronte di analoghi valori generali dell’Italiano (classificazione degli ambiti della langue); significa avere meccanismi automatici di pre-identificazione di un numero limitato di contesti linguistici; crono-localizzazione
  • 19. 2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Mettere un ampio numero di utenti proattivi in grado di sperimentare algoritmi per l’associazione di stili autorali con testi dall’autore non identificato e di fornire feedback per il perfezionamento degli algoritmi stessi; ipso-identificazione
  • 20. 2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Mettere un ampio numero di utenti proattivi in grado di sperimentare algoritmi per l’associazione di stili regionali e di altre comunità locali e di fornire feedback per il perfezionamento degli algoritmi stessi; geo –localizzazione
  • 21. 2COACH: un Workbenchcoopearativo per NLPObbiettivi applicativi innovativi di COACH all’interno del progetto Sapienza Emozioni2.8Preparare la piattaforma collettiva per il successivo ampliamento funzionale che estenda le funzionalità di analisi al dominio della semantica e delle ontologie, mediante la predisposizione di un impianto architetturale software APERTO, MODULARE, DOCUMENTATO e facilmente documentabile attraverso l’attività dello stesso utente.
  • 22. 2CMS come aggregatori di modelli per la Web ScienceCasi d’ uso concreti nel progetto “Il linguaggio delle emozioni”2.9 Come primo caso d’uso, all'interno del progetto PRIN “Il Linguaggio delle emozioni” ci proponiamo di costituire un ambiente di “sperimentazione linguistica” (LinguisticWorkbench) con il quale mettere alla prova i seguenti procedimenti e i seguenti framework di riferimento per una analisi semantica di corpora letterari:
  • 23. 2CMS come aggregatori di modelli per la Web Scienceindividuazione dei radicali caratterizzanti di uso più frequente del corpus SapienzaEmozionidescrizione del loro inserimento all'interno dell'ontologia Wordnet per creare una topografia specifica, verificarne il coinvolgimento di altri campi, e la discendenza relativa (facendo emergere proprietà specifiche come funzioni metaforiche e alti usi)fare emergere dal contrasto tra corpus testuale (corpus oggetto di indagine) e corpus di riferimento le proprietà specifiche di ciascun dominio indagabile (autore, epoca, lingue, genere, linee stilistiche, “scuole”, etc.esser pronti a individuare tramite il feedback tra corpus di riferimento e corpus di studio nuove strategie di studio e nuovi possibili dominiCasi d’ uso concreti nel progetto “Il linguaggio delle emozioni”2.1
  • 24. 3COACH: casi d’usoPossibili casi d’ uso di COACH in altri ambiti di ricerca3.1 Dato un dominio o una sottorete, si chiede al software di analizzare le pagine pubblicate sotto le URI appartenenti al dominio specificato estraendone sintagmi, termini e coppie di termini statisticamente rilevanti;Il “corpus delle emozioni” un’ analisi attraverso NLTK su un corpus preparato per il gruppo di lavoro Un corpus delle leggi costituzionali di alcuni paesi europei  
  • 25. 3COACH: RiferimentiRiferimenti bibliografici3.2 Pecheux, M. 1982, Language, Semantics, and Ideology, {PalgraveMacmillan}.Pecheux, M. AutomaticDiscourseAnalysis (Utrecht Studies in Language and Communication, No 5), RodopiBvEditions. Fuksas, A. 2002, Etimologia e geografia nella lirica dei trovatori, Roma. .
  • 26. 3COACH: RiferimentiRiferimenti elettronici (DOI)3.2  Nicola Simonetti, Filosofia della mente e neuroscienze: il caso dei neuroni specchio, giovedì, novembre 19, 2009, Relazione SFI, Novara, 28.10.2009 .
  • 27. 8Web Semantico e “intelligence” per le comunità della scienza
  • 28. 8COACH: un worbench collaborativo per NLP
  • 29. 9Riferimenti Books and papers9.11. Sherman, Chris.Partner & Executive Editor. London : Search Engine Land, 2008. paper.2. Berners-Lee, T., et al.A framework for Web Science. s.l. : NOW, 2006. 1-933019-33-6.3. Towards a Semantic Web. Lariccia, S. Toffoli, G. Ferrara : s.n., 2004.4. Simon, Herbert A.The Science of artificial. Cambridge : The MIT Press, 1996. 0262691914. 
  • 30. Sapienza UniversityThe University of Rome "La Sapienza“ was founded on April 20th, 1303 through an edict ("Bolla") by Pope Boniface the VIIIth.
  • 31. According to the Academic Ranking of World Universities published by the Institute of Higher Education of Shanghai Jiao Tong University,
  • 32. Sapienza University of Rome ranks among top 30 european universities and as one of the best Italian Universities, together with the Universities of Milan, Pisa and Bologna...Institutional mappingSapienza UniversityThe University of Rome "La Sapienza" has a very specific birth certificate since it was founded on April 20th, 1303 through an edict ("Bolla") by Pope Boniface the VIIIth. LIDS Laboratory forInformaticsDidacticsand Science.DigilabCentreDigilabisstartingnowas a Centrefor New MediaDigilabCentreSapienza2: Research on new methods of Web-learning, especially for HumanitiesDigilabisconstituted in April 2009 with 4 tasks:1: digitalizationofbooksownedbySapienzaand Padua UniversityBooksDitalizationWeb-learningSAP: Contonous LearningMedia for Science4: advanced services of communication for research and science3: Service of certification and Continous Learning for the national Administration
  • 33. Summary?Do You Have Any Questions???