beta
                      CoGrOO 4.0
                                                                 26 de julho de 2012
FISL 13
13º Fórum Internacional de Software Livre – A tecnologia que liberta

                                      Arthur Branco Costa
                                             William Colen




                                      cogroo.org                                       1
O que é o CoGrOO?


   CoGrOO é um corretor gramatical para
português do Brasil, que pode ser usado nas
    principais suítes livres de escritório.




                   cogroo.org                 2
●   Usuário entra um texto
●   O verificador executa
    uma análise
    gramatical e busca
    padrões de erros na
    estrutura gerada
●   O verificador sugere correções para o texto.




                             cogroo.org            3
Integração BrOffice.org




           cogroo.org     4
Integração BrOffice.org




           cogroo.org     5
Integração BrOffice.org




           cogroo.org     6
Como funciona?
●   Processamento de Linguagem Natural probabilística +
    sistema de regras:
    ●   Aprendizado de máquina usando corpus na fase de análise
    ●   Regras de erros são aplicados nas estruturas resultantes




                                    cogroo.org                     7
Como funciona?




   http://ccsl.ime.usp.br/cogroo/comunidade/grammar
      cogroo.org                                      8
Como funciona?




   http://ccsl.ime.usp.br/cogroo/comunidade/grammar
      cogroo.org                                      9
Analisador de Textos
●   Delimitador de sentenças e tokens
●   Etiquetador morfológico
●   Identificador de sintagmas
●   Identificador de sujeitos
●   Etc...




                                cogroo.org   10
Como funciona?




      http://ccsl.ime.usp.br/cogroo/comunidade/rules
     cogroo.org                                    11
As versões do CoGrOO
●   CoGrOO 1.0 – 2005 (Poli-USP, FINEP)
    ●   Perl – n-gramas
    ●   Primeiro corretor gramatical integrado ao OO (no mundo!)
    ●   Regras XML
●   CoGrOO 2.0 – 2007 (Poli-USP, TCC)
    ●   Primeira versão usando Java + OpenNLP
●   CoGrOO 3.0 – 2009 (órfão, depois CCSL)
    ●   Primeira versão totalmente integrada ao OO (instalador OXT, cobrinha
        azul – OO 3.0)
    ●   CoGrOO Comunidade




                                    cogroo.org                                 12
CoGrOO 4.0 (2012)
●   Nova licença: Apache 2.0 (antes era LGPL)
    ●   Compatível tanto com o LibreOffice quanto com o Apache
        OpenOffice
    ●   Menores restrições de uso




                              cogroo.org                         13
Novidades
●   Núcleo reescrito do zero!
    ●   Desde 2009 → colaboração com o Apache OpenNLP
         –   Grande parte do código de avaliação e treinamento foi transferido
             para o Apache OpenNLP
    ●   Benefícios:
         –   Maior qualidade na implementação (mais olhos)
         –   Menor quantidade de linhas de código para manutenção
         –   Maior proporção do código trata apenas de correção gramatical


                                             Apache




                                     cogroo.org                                  14
Novidades
●   Regras plugáveis: checkers
    ●   3 tipos
         –   XML: arquivo de configuração
         –   Regras em Java
              ● Tipadas (deprecated)
              ● Livres


         –   Regras de regência (em implementação, participação de alunas da
             UFMG)




                                    cogroo.org                                 15
Novidades
●   Novos recursos linguísticos (meu mestrado)
    ●   Modelos linguíticos treinados com um novo corpus
    ●   Novo dicionário (Jspell.br)
    Ganho nas análises gramaticais!




                                cogroo.org                 16
Novidades
●   Repositório central Maven (quanto tivermos
    release)
●   Nova API
    ●   Muito mais modular
    ●   Pronta para novos idiomas!
    ●   http://ccsl.ime.usp.br/redmine/projects/cogroo/wiki/API_CoGrOO_4x




                                   cogroo.org                               17
API




cogroo.org   18
API




cogroo.org   19
API




cogroo.org   20
E está pronto para usar!!




          cogroo.org        21
Código no GitHub




      cogroo.org   22
Código no GitHub




      cogroo.org   23
Código no GitHub




      cogroo.org   24
Obrigado pela oportunidade e pela atenção!


               http://cogroo.org
             http://ccsl.ime.usp.br




                     cogroo.org              25

Mais conteúdo relacionado

PPTX
Automação de Aplicativos: Scripting com Python
PPSX
Conhecendo o Django
KEY
Introdução ao Python & Web Services
PDF
TDD - Workshop Pyladies SP
PDF
Canivete suíço do Python
PDF
Canivete python
PDF
Postgresql +python
ODP
Python para Programadores
Automação de Aplicativos: Scripting com Python
Conhecendo o Django
Introdução ao Python & Web Services
TDD - Workshop Pyladies SP
Canivete suíço do Python
Canivete python
Postgresql +python
Python para Programadores

Mais procurados (20)

ODP
ZIP
Python e Django na Globo.com
PDF
Trabalhando com Logs no PostgreSQL
PDF
Como tornar-se um programador Python melhor
PDF
Escalando apps com React e Type Script e SOLID
ODP
Calourada2010
PDF
Engenharia rever sa mentebinaria
PDF
Tutorial Django + Python
PDF
Logging e depuração enterprise-level com Log4perl
PDF
Hack Thursday - NodeJS
PDF
Por que PostgreSQL?
PDF
Trabalhando com Logs no PostgreSQL
DOCX
Python, CPython, Pythonico, Cython
PDF
Introdução a linguagem Python
PDF
Globo.com - Porque amamos open-source?
PPT
Introdução à linguagem python
PDF
A importância dos padrões na comunidade PHP
PPTX
PHPSP TestFest 2010
PPT
Python para programadores Ruby
ODP
Desmistificando web2py - #TDC2011
Python e Django na Globo.com
Trabalhando com Logs no PostgreSQL
Como tornar-se um programador Python melhor
Escalando apps com React e Type Script e SOLID
Calourada2010
Engenharia rever sa mentebinaria
Tutorial Django + Python
Logging e depuração enterprise-level com Log4perl
Hack Thursday - NodeJS
Por que PostgreSQL?
Trabalhando com Logs no PostgreSQL
Python, CPython, Pythonico, Cython
Introdução a linguagem Python
Globo.com - Porque amamos open-source?
Introdução à linguagem python
A importância dos padrões na comunidade PHP
PHPSP TestFest 2010
Python para programadores Ruby
Desmistificando web2py - #TDC2011
Anúncio

Semelhante a CoGrOO 4.0 no FISL 13 (20)

PDF
O corretor gramatical CoGrOO - IX Evidosol
PDF
Desenvolvimento de aplicações embarcadas utilizando Python
ODP
Cogroo Google Oss Jam Sao Paulo V01
PDF
Python e Golang - Parte 1
PDF
Introdução à Programação Python e Tk
PDF
Cogroo Comunidade no FISL XI
PDF
PHP Turbinado com CodeIgniter - Conisli 2011
DOCX
A lógica do Python e seus termos
PDF
Dez dicas para_acompanhamento_de_bugs
PDF
PDF
BeavOps : Como o Python ajudou a integrar o mundo DevOps
PDF
Revista Programar 01
PPT
PPT
PostgreSQL
PDF
Desenvolvimento web com python e django
PPT
TDC2018SP | Trilha Kotlin - Kodando com Kotlin aplicacoes front-end.
PPTX
TDC2016POA | Trilha .NET - O que esperar do C# 7
PDF
Dicas para sua carreira de Desenvolvedor PHP
PDF
Curso de Groovy
O corretor gramatical CoGrOO - IX Evidosol
Desenvolvimento de aplicações embarcadas utilizando Python
Cogroo Google Oss Jam Sao Paulo V01
Python e Golang - Parte 1
Introdução à Programação Python e Tk
Cogroo Comunidade no FISL XI
PHP Turbinado com CodeIgniter - Conisli 2011
A lógica do Python e seus termos
Dez dicas para_acompanhamento_de_bugs
BeavOps : Como o Python ajudou a integrar o mundo DevOps
Revista Programar 01
PostgreSQL
Desenvolvimento web com python e django
TDC2018SP | Trilha Kotlin - Kodando com Kotlin aplicacoes front-end.
TDC2016POA | Trilha .NET - O que esperar do C# 7
Dicas para sua carreira de Desenvolvedor PHP
Curso de Groovy
Anúncio

Mais de William Colen (8)

PDF
Sistemas de Processamento de Linguagem Natural na Prática
PDF
Falando com a máquina: Desenvolvimento de assistentes pessoais virtuais
ODP
Processamento Automático da Língua Portuguesa - Campus Party Br 6
PDF
Programabilida de BrOffice.org - Fisl 11
ODP
Criando extensões para o BrOffice (Serpro 2010)
PDF
Tutorial: Criando extensões para o OpenOffice
PDF
Mini-curso Processamento de linguagens naturais: pondo em prática
PDF
Processamento Automático da Língua Portuguesa: DevInSampa 2011
Sistemas de Processamento de Linguagem Natural na Prática
Falando com a máquina: Desenvolvimento de assistentes pessoais virtuais
Processamento Automático da Língua Portuguesa - Campus Party Br 6
Programabilida de BrOffice.org - Fisl 11
Criando extensões para o BrOffice (Serpro 2010)
Tutorial: Criando extensões para o OpenOffice
Mini-curso Processamento de linguagens naturais: pondo em prática
Processamento Automático da Língua Portuguesa: DevInSampa 2011

CoGrOO 4.0 no FISL 13

  • 1. beta CoGrOO 4.0 26 de julho de 2012 FISL 13 13º Fórum Internacional de Software Livre – A tecnologia que liberta Arthur Branco Costa William Colen cogroo.org 1
  • 2. O que é o CoGrOO? CoGrOO é um corretor gramatical para português do Brasil, que pode ser usado nas principais suítes livres de escritório. cogroo.org 2
  • 3. Usuário entra um texto ● O verificador executa uma análise gramatical e busca padrões de erros na estrutura gerada ● O verificador sugere correções para o texto. cogroo.org 3
  • 7. Como funciona? ● Processamento de Linguagem Natural probabilística + sistema de regras: ● Aprendizado de máquina usando corpus na fase de análise ● Regras de erros são aplicados nas estruturas resultantes cogroo.org 7
  • 8. Como funciona? http://ccsl.ime.usp.br/cogroo/comunidade/grammar cogroo.org 8
  • 9. Como funciona? http://ccsl.ime.usp.br/cogroo/comunidade/grammar cogroo.org 9
  • 10. Analisador de Textos ● Delimitador de sentenças e tokens ● Etiquetador morfológico ● Identificador de sintagmas ● Identificador de sujeitos ● Etc... cogroo.org 10
  • 11. Como funciona? http://ccsl.ime.usp.br/cogroo/comunidade/rules cogroo.org 11
  • 12. As versões do CoGrOO ● CoGrOO 1.0 – 2005 (Poli-USP, FINEP) ● Perl – n-gramas ● Primeiro corretor gramatical integrado ao OO (no mundo!) ● Regras XML ● CoGrOO 2.0 – 2007 (Poli-USP, TCC) ● Primeira versão usando Java + OpenNLP ● CoGrOO 3.0 – 2009 (órfão, depois CCSL) ● Primeira versão totalmente integrada ao OO (instalador OXT, cobrinha azul – OO 3.0) ● CoGrOO Comunidade cogroo.org 12
  • 13. CoGrOO 4.0 (2012) ● Nova licença: Apache 2.0 (antes era LGPL) ● Compatível tanto com o LibreOffice quanto com o Apache OpenOffice ● Menores restrições de uso cogroo.org 13
  • 14. Novidades ● Núcleo reescrito do zero! ● Desde 2009 → colaboração com o Apache OpenNLP – Grande parte do código de avaliação e treinamento foi transferido para o Apache OpenNLP ● Benefícios: – Maior qualidade na implementação (mais olhos) – Menor quantidade de linhas de código para manutenção – Maior proporção do código trata apenas de correção gramatical Apache cogroo.org 14
  • 15. Novidades ● Regras plugáveis: checkers ● 3 tipos – XML: arquivo de configuração – Regras em Java ● Tipadas (deprecated) ● Livres – Regras de regência (em implementação, participação de alunas da UFMG) cogroo.org 15
  • 16. Novidades ● Novos recursos linguísticos (meu mestrado) ● Modelos linguíticos treinados com um novo corpus ● Novo dicionário (Jspell.br) Ganho nas análises gramaticais! cogroo.org 16
  • 17. Novidades ● Repositório central Maven (quanto tivermos release) ● Nova API ● Muito mais modular ● Pronta para novos idiomas! ● http://ccsl.ime.usp.br/redmine/projects/cogroo/wiki/API_CoGrOO_4x cogroo.org 17
  • 21. E está pronto para usar!! cogroo.org 21
  • 22. Código no GitHub cogroo.org 22
  • 23. Código no GitHub cogroo.org 23
  • 24. Código no GitHub cogroo.org 24
  • 25. Obrigado pela oportunidade e pela atenção! http://cogroo.org http://ccsl.ime.usp.br cogroo.org 25