Processamento de Linguagem Natural
Primeiro Encontro em Computa¸c˜ao Semˆantica - Tutoriais
Danilo S. Carvalho
Hugo C. C. Carneiro
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
O que ´e
Ramo de estudo resultante da uni˜ao de esfor¸cos entre a
Ciˆencia da Computa¸c˜ao, Ciˆencia da Informa¸c˜ao e Lingu´ıstica.
Compreende a an´alise, manipula¸c˜ao e gera¸c˜ao da linguagem
humana atrav´es de computador.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
N´ıveis da an´alise: A informa¸c˜ao desejada
A informa¸c˜ao contida no texto pode ser analisada de mais de
um ponto de vista.
Do que fala?
Quem fala?
Como fala?
Podemos descobrir o assunto de um texto olhando apenas
para uma senten¸ca?
Podemos descobrir o autor de um texto observando todas as
suas palavras?
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
N´ıveis da an´alise: Discurso X palavra
A sequˆencia de senten¸cas ou de documentos inteiros pode ser
t˜ao importante quanto as sequˆencias de palavras que os
formam.
Da palavra ao discurso, h´a informa¸c˜ao ´util a ser obtida.
Entretanto, as t´ecnicas tendem a ser diferentes para cada
n´ıvel.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
N´ıveis da an´alise: Unidade de significado
´E aquilo ao qual podemos atribuir um significado. Exemplos:
A opini˜ao de uma carta sobre a pol´ıtica econˆomica atual
(discurso).
Uso de voz passiva para amenizar um fato contundente
(senten¸ca).
Nome (palavra).
A escolha da unidade de significado depende da informa¸c˜ao
desejada.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Aplica¸c˜oes do Processamento de Linguagem Natural
Corre¸c˜ao de texto (ortografia, gram´atica)
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Aplica¸c˜oes do Processamento de Linguagem Natural
Classifica¸c˜ao de textos
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Aplica¸c˜oes do Processamento de Linguagem Natural
Extra¸c˜ao de informa¸c˜oes
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Aplica¸c˜oes do Processamento de Linguagem Natural
Outros
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Modelos para a linguagem
Representa¸c˜ao da l´ıngua humana para o computador deve ao
mesmo tempo manter a expressividade e flexibilidade, mas
proporcionando a consistˆencia matem´atica necess´aria para
aplica¸c˜ao de algoritmos diversos.
Essa ´e uma tarefa dif´ıcil, para a qual existem muitas respostas
poss´ıveis, mas nenhuma definitiva.
Modelos computacionais para a l´ıngua podem ser classificados
em dois tipos principais:
Estat´ısticos
N˜ao estat´ısticos
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Modelos estat´ısticos
n-gramas: Cada sequˆencia de n termos possui uma
probabilidade de ocorrer. Logo pode-se prever o pr´oximo
termo de uma sequˆencia conhecendo os anteriores.
Posicionais: Cada termo (ou sequˆencia) possui uma
probabilidade de ocorrer dado sua posi¸c˜ao relativa aos outros
termos.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Modelos n˜ao estat´ısticos
Simb´olico: Cada termo (ou
sequˆencia) ´e associado a um s´ımbolo,
cujas intera¸c˜oes s˜ao definidas por
regras.
Vetorial: Cada termo, sequˆencia ou
documento ´e associado a uma
coordenada de um espa¸co
multidimensional. Por exemplo, um
documento pode ser representado por
um vetor, onde as coordenadas s˜ao
preenchidas com as frequˆencias
relativas de ocorrˆencia dos termos.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
Listas de palavras
Stopwords
Palavras muito comuns
Pouca relevˆancia
e, mas, como, n˜ao, tudo, cada, pode, deve, ´e, h´a, um, a, o
Mais stopwords dependendo do contexto
computador, m´aquina, c´odigo
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
Dicion´arios
Conjunto de palavras e suas defini¸c˜oes
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
´Indices
Referˆencias para simplifica¸c˜ao na busca por conte´udos
Sum´arios, ´ındices remissivos, palavras-chave
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
Tesauros
Listagem de palavras agrupadas de acordo com similaridade
sinˆonimos, antˆonimos
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
Wordnet
Banco de dados l´exicos
Termos agrupados em synsets
hipern´ımia (gato → felino)
hipon´ımia (felino → le˜ao)
coordena¸c˜ao (gato ↔ le˜ao)
meron´ımia (casa → porta)
holon´ımia (porta → casa)
tropon´ımia (dialogar → falar)
implica¸c˜ao (roncar → dormir)
partic´ıpios (cansado → cansar)
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
Corpora
Conjuntos grandes e estruturados de textos
anotados / n˜ao anotados
textuais / orais
corpora paralelos
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Recursos
Treebanks
Corpora com anota¸c˜oes sint´aticas e/ou semˆanticas
Mais conhecido/utilizado → Penn Treebank
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Tokeniza¸c˜ao
Detec¸c˜ao de termos
Palavras com muitos termos
Donaudampfschifffahrtsgesellschaftskapit¨an
Donau dampf schiff fahrts gesellschafts kapit¨an
Termos que possuem pontua¸c˜ao em sua composi¸c˜ao
siglas, quantias etc
Scriptio continua
Foto por Vincent Ramos, sob licen¸ca da GNU Free Documentation License.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Stemming
Qual radical de uma palavra?
Como extrair sua informa¸c˜ao relevante?
menino / menina
cantar / canta / canto
felizmente / felicidade / feliz
inconstitucionalissimamente / constitucional / constitui¸c˜ao
Um stemming mal feito pode prejudicar a extra¸c˜ao de
informa¸c˜oes relevantes
idade / ir / i ?
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
POS-tagging
Classifica¸c˜ao gramatical
As palavras mais comuns podem ter diversas classes
a, o, se, que, como
Classifica¸c˜ao depende do contexto
Como devo proceder?
Ele ´e alto como um poste.
Como arroz todo dia.
Palavras novas surgem o tempo todo
linguagem t´ecnica, jarg˜oes, neologismos, g´ırias
classes abertas (substantivos, adjetivos, adv´erbios e verbos)
classes fechadas (preposi¸c˜oes, conjun¸c˜oes, pronomes etc)
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Segmenta¸c˜ao de senten¸cas
Detec¸c˜ao de limites entre senten¸cas
Ponto (.) e uso de letras mai´usculas ajudam a descobrir o
limite de uma senten¸ca, contudo:
Senten¸cas com termos que possuem pontua¸c˜ao: Fechei um
acordo com o Sr. Silva.
Senten¸cas aninhadas: ”Nos encontramos amanh˜a.”, disseram
ao se despedir.
Textos mal pontuados
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
An´alise sint´atica
Superficial (Chunking)
Identifica¸c˜ao de constituintes
Sintagmas
Nominais
Verbais
Preposicionais
...
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
An´alise sint´atica
Profunda
Identifica¸c˜ao de toda deriva¸c˜ao sint´atica at´e o n´ıvel de classes
gramaticais
Determina¸c˜ao de n´ucleos e adjuntos dos sintagmas
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Entidades nomeadas
Nomes, datas, quantias etc
Entidades nomeadas podem ser compostas por muitos termos
P˜ao de A¸c´ucar
Rep´ublica Federativa do Brasil
Pode conter pontua¸c˜ao
1,99%
23:59:00
D. Pedro I
Pode conter numerais e letras ao mesmo tempo
C3PO
W3C
Algumas entidades nomeadas, `a primeira vista, podem parecer
n˜ao concordar com os termos adjacentes
As mil e uma noites ´e um livro muito conhecido.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Resolu¸c˜ao de co-referˆencias
An´aforas
Jo˜ao cuida muito bem de seu c˜ao. Este, por sua vez, tamb´em
o adora.
A bab´a cuida do bebˆe doente. Ela est´a muito preocupada,
pois ele n˜ao para de chorar.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Significado: Modelos Semˆanticos
S˜ao os modelos lingu´ısticos usados quando a informa¸c˜ao
desejada ´e o significado dos termos do texto.
Sequˆencias, s´ımbolos, regras, posi¸c˜oes ou vetores destinam-se
a elucidar o sentido do texto em vez da estrutura.
Podem conter um aspecto adicional: rela¸c˜oes semˆanticas.
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Significado: Rela¸c˜oes semˆanticas
Expressam as intera¸c˜oes existentes entre o significado de duas
ou mais palavras os express˜oes.
Permitem aproximar textos estruturalmente diferentes, mas
pr´oximos em significado.
Exemplo:
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural
Processamento de Linguagem Natural
Primeiro Encontro em Computa¸c˜ao Semˆantica - Tutoriais
Danilo S. Carvalho
Hugo C. C. Carneiro
Danilo S. Carvalho Hugo C. C. Carneiro
Processamento de Linguagem Natural

Mais conteúdo relacionado

PDF
Mini-curso Processamento de linguagens naturais: pondo em prática
ODP
Processamento Automático da Língua Portuguesa - Campus Party Br 6
PDF
Processamento Automático da Língua Portuguesa: DevInSampa 2011
PDF
Sistemas de Processamento de Linguagem Natural na Prática
PDF
PORT4NOOJ - Até onde se pode ir? Anabela Barreiro & Cristina Mota
DOC
Ingles instrumental
PDF
Atividade podcast cl_ef_em_estrangeirismos
PDF
Ed#3 novo acordo ortographico
Mini-curso Processamento de linguagens naturais: pondo em prática
Processamento Automático da Língua Portuguesa - Campus Party Br 6
Processamento Automático da Língua Portuguesa: DevInSampa 2011
Sistemas de Processamento de Linguagem Natural na Prática
PORT4NOOJ - Até onde se pode ir? Anabela Barreiro & Cristina Mota
Ingles instrumental
Atividade podcast cl_ef_em_estrangeirismos
Ed#3 novo acordo ortographico

Mais procurados (20)

PPT
Processamento da linguagem escrita
PPTX
Inglês instrumental apresentação
PDF
Prova concurso ufpe - programador de computador
 
PDF
02 linguagens e gramaticas
PDF
3º ANO - ENSINO FUNDAMENTAL - EDUCAÇÃO ESPECIAL
PPT
O uso da Internet no ensino de ingles instrumental
PDF
Extracção de Recursos para Tradução Automática
PPT
Aula 2
PDF
08 linguagens recursivamente enumeraveis e sensiveis ao contexto
DOC
Breve história da língua portuguesa
PDF
04 propriedades das linguagens regulares
PDF
06 linguagens livres do contexto
PDF
09 hierarquia de classes e linguagens e conclusoes
PDF
Linguagem de programação
PDF
01 introducao e conceitos basicos
PDF
Apostila de ingles_informatica_pronatec
PDF
Aula 1 - Apresentação da disciplina e metodologia de trabalho. aspectos teori...
PPT
Prosodia en la clase
PPT
Analise textual online
PDF
Pet português instrumental e e geraldino r cunha
Processamento da linguagem escrita
Inglês instrumental apresentação
Prova concurso ufpe - programador de computador
 
02 linguagens e gramaticas
3º ANO - ENSINO FUNDAMENTAL - EDUCAÇÃO ESPECIAL
O uso da Internet no ensino de ingles instrumental
Extracção de Recursos para Tradução Automática
Aula 2
08 linguagens recursivamente enumeraveis e sensiveis ao contexto
Breve história da língua portuguesa
04 propriedades das linguagens regulares
06 linguagens livres do contexto
09 hierarquia de classes e linguagens e conclusoes
Linguagem de programação
01 introducao e conceitos basicos
Apostila de ingles_informatica_pronatec
Aula 1 - Apresentação da disciplina e metodologia de trabalho. aspectos teori...
Prosodia en la clase
Analise textual online
Pet português instrumental e e geraldino r cunha
Anúncio

Destaque (10)

PDF
Processamento de Linguagem Natural
DOCX
Aplicação de técnicas de processamento de linguagem natural para ferramenta P...
PDF
Falando com a máquina: Desenvolvimento de assistentes pessoais virtuais
PDF
Processamento de Linguagem natural com PHP
PDF
Adaptando, Aprendendo e Integrando Modelos Semânticos.
PPT
Processamento da linguagem no c+ërebro
 
PDF
Modelo de Dados: Entendendo e “re-”construindo...
PPTX
Big Data, JVM e Redes Sociais
PDF
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
PPTX
Função de Linguagem
Processamento de Linguagem Natural
Aplicação de técnicas de processamento de linguagem natural para ferramenta P...
Falando com a máquina: Desenvolvimento de assistentes pessoais virtuais
Processamento de Linguagem natural com PHP
Adaptando, Aprendendo e Integrando Modelos Semânticos.
Processamento da linguagem no c+ërebro
 
Modelo de Dados: Entendendo e “re-”construindo...
Big Data, JVM e Redes Sociais
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Função de Linguagem
Anúncio

Último (12)

PPTX
Proposta de Implementação de uma Rede de Computador Cabeada.pptx
PDF
Jira Software projetos completos com scrum
PDF
Manejo integrado de pragas na cultura do algodão
PPT
Conceitos básicos de Redes Neurais Artificiais
PDF
eBook - GUIA DE CONSULTA RAPIDA EM ROTEADORES E SWITCHES CISCO - VOL I.pdf
PDF
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
PPTX
Viasol Energia Solar -Soluções para geração e economia de energia
PPTX
Analise Estatica de Compiladores para criar uma nova LP
PPTX
Utilizando code blockes por andre backes
PDF
Processos no SAP Extended Warehouse Management, EWM100 Col26
PPTX
Aula 9 - Funções em Python (Introdução à Ciência da Computação)
PPTX
Tipos de servidor em redes de computador.pptx
Proposta de Implementação de uma Rede de Computador Cabeada.pptx
Jira Software projetos completos com scrum
Manejo integrado de pragas na cultura do algodão
Conceitos básicos de Redes Neurais Artificiais
eBook - GUIA DE CONSULTA RAPIDA EM ROTEADORES E SWITCHES CISCO - VOL I.pdf
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
Viasol Energia Solar -Soluções para geração e economia de energia
Analise Estatica de Compiladores para criar uma nova LP
Utilizando code blockes por andre backes
Processos no SAP Extended Warehouse Management, EWM100 Col26
Aula 9 - Funções em Python (Introdução à Ciência da Computação)
Tipos de servidor em redes de computador.pptx

Tutorial em Processamento de Linguagem Natural

  • 1. Processamento de Linguagem Natural Primeiro Encontro em Computa¸c˜ao Semˆantica - Tutoriais Danilo S. Carvalho Hugo C. C. Carneiro Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 2. O que ´e Ramo de estudo resultante da uni˜ao de esfor¸cos entre a Ciˆencia da Computa¸c˜ao, Ciˆencia da Informa¸c˜ao e Lingu´ıstica. Compreende a an´alise, manipula¸c˜ao e gera¸c˜ao da linguagem humana atrav´es de computador. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 3. N´ıveis da an´alise: A informa¸c˜ao desejada A informa¸c˜ao contida no texto pode ser analisada de mais de um ponto de vista. Do que fala? Quem fala? Como fala? Podemos descobrir o assunto de um texto olhando apenas para uma senten¸ca? Podemos descobrir o autor de um texto observando todas as suas palavras? Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 4. N´ıveis da an´alise: Discurso X palavra A sequˆencia de senten¸cas ou de documentos inteiros pode ser t˜ao importante quanto as sequˆencias de palavras que os formam. Da palavra ao discurso, h´a informa¸c˜ao ´util a ser obtida. Entretanto, as t´ecnicas tendem a ser diferentes para cada n´ıvel. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 5. N´ıveis da an´alise: Unidade de significado ´E aquilo ao qual podemos atribuir um significado. Exemplos: A opini˜ao de uma carta sobre a pol´ıtica econˆomica atual (discurso). Uso de voz passiva para amenizar um fato contundente (senten¸ca). Nome (palavra). A escolha da unidade de significado depende da informa¸c˜ao desejada. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 6. Aplica¸c˜oes do Processamento de Linguagem Natural Corre¸c˜ao de texto (ortografia, gram´atica) Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 7. Aplica¸c˜oes do Processamento de Linguagem Natural Classifica¸c˜ao de textos Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 8. Aplica¸c˜oes do Processamento de Linguagem Natural Extra¸c˜ao de informa¸c˜oes Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 9. Aplica¸c˜oes do Processamento de Linguagem Natural Outros Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 10. Modelos para a linguagem Representa¸c˜ao da l´ıngua humana para o computador deve ao mesmo tempo manter a expressividade e flexibilidade, mas proporcionando a consistˆencia matem´atica necess´aria para aplica¸c˜ao de algoritmos diversos. Essa ´e uma tarefa dif´ıcil, para a qual existem muitas respostas poss´ıveis, mas nenhuma definitiva. Modelos computacionais para a l´ıngua podem ser classificados em dois tipos principais: Estat´ısticos N˜ao estat´ısticos Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 11. Modelos estat´ısticos n-gramas: Cada sequˆencia de n termos possui uma probabilidade de ocorrer. Logo pode-se prever o pr´oximo termo de uma sequˆencia conhecendo os anteriores. Posicionais: Cada termo (ou sequˆencia) possui uma probabilidade de ocorrer dado sua posi¸c˜ao relativa aos outros termos. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 12. Modelos n˜ao estat´ısticos Simb´olico: Cada termo (ou sequˆencia) ´e associado a um s´ımbolo, cujas intera¸c˜oes s˜ao definidas por regras. Vetorial: Cada termo, sequˆencia ou documento ´e associado a uma coordenada de um espa¸co multidimensional. Por exemplo, um documento pode ser representado por um vetor, onde as coordenadas s˜ao preenchidas com as frequˆencias relativas de ocorrˆencia dos termos. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 13. Recursos Listas de palavras Stopwords Palavras muito comuns Pouca relevˆancia e, mas, como, n˜ao, tudo, cada, pode, deve, ´e, h´a, um, a, o Mais stopwords dependendo do contexto computador, m´aquina, c´odigo Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 14. Recursos Dicion´arios Conjunto de palavras e suas defini¸c˜oes Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 15. Recursos ´Indices Referˆencias para simplifica¸c˜ao na busca por conte´udos Sum´arios, ´ındices remissivos, palavras-chave Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 16. Recursos Tesauros Listagem de palavras agrupadas de acordo com similaridade sinˆonimos, antˆonimos Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 17. Recursos Wordnet Banco de dados l´exicos Termos agrupados em synsets hipern´ımia (gato → felino) hipon´ımia (felino → le˜ao) coordena¸c˜ao (gato ↔ le˜ao) meron´ımia (casa → porta) holon´ımia (porta → casa) tropon´ımia (dialogar → falar) implica¸c˜ao (roncar → dormir) partic´ıpios (cansado → cansar) Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 18. Recursos Corpora Conjuntos grandes e estruturados de textos anotados / n˜ao anotados textuais / orais corpora paralelos Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 19. Recursos Treebanks Corpora com anota¸c˜oes sint´aticas e/ou semˆanticas Mais conhecido/utilizado → Penn Treebank Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 20. Tokeniza¸c˜ao Detec¸c˜ao de termos Palavras com muitos termos Donaudampfschifffahrtsgesellschaftskapit¨an Donau dampf schiff fahrts gesellschafts kapit¨an Termos que possuem pontua¸c˜ao em sua composi¸c˜ao siglas, quantias etc Scriptio continua Foto por Vincent Ramos, sob licen¸ca da GNU Free Documentation License. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 21. Stemming Qual radical de uma palavra? Como extrair sua informa¸c˜ao relevante? menino / menina cantar / canta / canto felizmente / felicidade / feliz inconstitucionalissimamente / constitucional / constitui¸c˜ao Um stemming mal feito pode prejudicar a extra¸c˜ao de informa¸c˜oes relevantes idade / ir / i ? Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 22. POS-tagging Classifica¸c˜ao gramatical As palavras mais comuns podem ter diversas classes a, o, se, que, como Classifica¸c˜ao depende do contexto Como devo proceder? Ele ´e alto como um poste. Como arroz todo dia. Palavras novas surgem o tempo todo linguagem t´ecnica, jarg˜oes, neologismos, g´ırias classes abertas (substantivos, adjetivos, adv´erbios e verbos) classes fechadas (preposi¸c˜oes, conjun¸c˜oes, pronomes etc) Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 23. Segmenta¸c˜ao de senten¸cas Detec¸c˜ao de limites entre senten¸cas Ponto (.) e uso de letras mai´usculas ajudam a descobrir o limite de uma senten¸ca, contudo: Senten¸cas com termos que possuem pontua¸c˜ao: Fechei um acordo com o Sr. Silva. Senten¸cas aninhadas: ”Nos encontramos amanh˜a.”, disseram ao se despedir. Textos mal pontuados Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 24. An´alise sint´atica Superficial (Chunking) Identifica¸c˜ao de constituintes Sintagmas Nominais Verbais Preposicionais ... Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 25. An´alise sint´atica Profunda Identifica¸c˜ao de toda deriva¸c˜ao sint´atica at´e o n´ıvel de classes gramaticais Determina¸c˜ao de n´ucleos e adjuntos dos sintagmas Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 26. Entidades nomeadas Nomes, datas, quantias etc Entidades nomeadas podem ser compostas por muitos termos P˜ao de A¸c´ucar Rep´ublica Federativa do Brasil Pode conter pontua¸c˜ao 1,99% 23:59:00 D. Pedro I Pode conter numerais e letras ao mesmo tempo C3PO W3C Algumas entidades nomeadas, `a primeira vista, podem parecer n˜ao concordar com os termos adjacentes As mil e uma noites ´e um livro muito conhecido. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 27. Resolu¸c˜ao de co-referˆencias An´aforas Jo˜ao cuida muito bem de seu c˜ao. Este, por sua vez, tamb´em o adora. A bab´a cuida do bebˆe doente. Ela est´a muito preocupada, pois ele n˜ao para de chorar. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 28. Significado: Modelos Semˆanticos S˜ao os modelos lingu´ısticos usados quando a informa¸c˜ao desejada ´e o significado dos termos do texto. Sequˆencias, s´ımbolos, regras, posi¸c˜oes ou vetores destinam-se a elucidar o sentido do texto em vez da estrutura. Podem conter um aspecto adicional: rela¸c˜oes semˆanticas. Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 29. Significado: Rela¸c˜oes semˆanticas Expressam as intera¸c˜oes existentes entre o significado de duas ou mais palavras os express˜oes. Permitem aproximar textos estruturalmente diferentes, mas pr´oximos em significado. Exemplo: Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural
  • 30. Processamento de Linguagem Natural Primeiro Encontro em Computa¸c˜ao Semˆantica - Tutoriais Danilo S. Carvalho Hugo C. C. Carneiro Danilo S. Carvalho Hugo C. C. Carneiro Processamento de Linguagem Natural