Recommended Leidy carvajal actividad 1.2 mapa c
Peep Laja, CEO, ConversionXL - How to Turn Data into Insights & Customers
Урок - 9, 27 февраля, 2016
Sexy HTML with Twitter Bootstrap
Putting Together the Pieces of a Successful Student Orientation
Hatada_Sebastian _softwarelibre
NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Babak Rasolzadeh: The importance of entities
Szövegbányászat a gyakorlatban
Balogh Kitti: Szövegbányászat
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Érzelmek hálójában – hálózat- és tartalomelemzés
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Mókus (Koncsik Anita, Varjú Zoltán)
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
More Related Content Leidy carvajal actividad 1.2 mapa c
Peep Laja, CEO, ConversionXL - How to Turn Data into Insights & Customers
Урок - 9, 27 февраля, 2016
Sexy HTML with Twitter Bootstrap
Viewers also liked (6)
Putting Together the Pieces of a Successful Student Orientation
Hatada_Sebastian _softwarelibre
More from Zoltan Varju (20) NLP meetup 2016.10.05 - Bódogh Attila: xdroid
NLP meetup 2016.10.05 - Szabó Martina Katalin: Precognox
NLP meetup 2016.10.05 - Szekeres Péter: Neticle
Balogh Kitti - Varjú Zoltán: Magyar nyelvű tartalmak elemzése
Babak Rasolzadeh: The importance of entities
Szövegbányászat a gyakorlatban
Balogh Kitti: Szövegbányászat
Balogh Kitti - Szűcs Krisztina - Varjú Zoltán: TechTea: Szövegvizualizációk a...
Balogh Kitti - Szűcs Krisztina: Képes beszéd
Balogh Kitti: Politika a sorok között - Politikai témájú szövegelemzések
Érzelmek hálójában – hálózat- és tartalomelemzés
Szabó - Varjú: Automatikus értékelés- és érzelemelemzés magyar nyelvű szöveg...
Mókus (Koncsik Anita, Varjú Zoltán)
Születésház - Adatozz okosan hackathon (Schmidt Erika, Balogh Kitti, Hudy Rób...
Danics Szabina Lívia: A magyar és az orosz melléknévi igenevek a megfelelteté...
Rasztik Zita: A стартовать jövevényszó fejlődési útja
Kontextus és a hivatkozások ereje
MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoport 2. Bemutatkozás
• Pázmány Péter Katolikus Egyetem Információs
Technológiai és Bionikai Kar
• Nyelvtechnológiai Labor:
– PPKE ITK Nyelvtechnológiai Csoport
– MTA-PPKE Magyar
Nyelvtechnológiai Kutatócsoport
• Vezető: Prószéky Gábor
• 9 doktorandusz (Endrédy István, Indig Balázs, Laki László, Ligeti-
Nagy Noémi, Novák Attila, Orosz György, Siklósi Borbála, Simonyi
András, Yang Zijian Győző), 2 posztdok (Sass Bálint, Miháltz
Márton)
• Oktatás: nyelvtechnológia szakirány, mérnökinformatikus
BSc és MSc; PhD képzés
3. Kutatási területek
• Morfológiai elemzés és egyértelműsítés
• Szintaktikai és szemantikai elemzés
• Orvosi szövegek feldolgozása
• Helyesírási hibák automatikus javítása
• Statisztikai gépi fordítás és alkalmazásai
5. Információkinyerés klinikai
szövegekből
• Kezelőlapok, zárójelentések stb.
– strukturálatlanság, rövidítések, helyesírási hibák,
elírások, latin-magyar keveredés, szaknyelv stb.
• Feldolgozás: domain-adaptáció
– Szegmentálás, tokenizálás: szabályok, gépi tanulás
– Helyesírási hibák automatikus javítása: javaslat-
generálás + SMT rendszer
– Rövidítésfelismerés és –feloldás: szabályok, lexikon
• Információkinyerés
– Ontológiaépítés, adatbányászat, döntéstámogatás stb.
6. Magyar nyelvi elemző (2012-2016)
• Mély nyelvi elemzés, teljes szintaxis, szemantika
– Pszicholingvisztikai indíttatás: emberi feldolgozás!
– Performancia alapú, “rosszulformáltság” is OK
– Szigorúan balról jobbra elemzés
– Párhuzamos szintek (vs. kaszkád modell)
– Mondathatárokon átívelő diskurzusegységek
– Gráfreprezentáció: szintaktikai és szemantikai szerepek
• Erőforrások
– Korpuszépítés: 1G szó, magyar web, folyamatos update
– Igeivonzatkeret-adatbázis (MetaMorpho): 18K ige, 33K keret
– Magyar WordNet: 42K synset, összekapcsolás vonzatkeretekkel
• Példaalkalmazás: üzleti rövidhírek elemzése
– Automatikus “szövegértés”: ki, mit, hol, mikor?
7. Morfológiai elemzés, egyértelműsítés
• PurePos
– Statisztikai egyértelműsítő (PoS-tagger)
• TnT implementáció (HMM)
• Tanítás: Szeged Korpusz
– Humor morfológiai elemző, szótövesítő
– Guesser
• Java, Python API
• Nyílt forrású (LGPL)
https://github.com/ppke-nlpg