SlideShare uma empresa Scribd logo
Bancos de Dados NoSQL – Uma nova
abordagem para a utilização de algoritmos
        de Mineração de Dados

                     J. Gabriel Lima
                jgabriel.ufpa@gmail.com

         LINC - Laboratório de Inteligência Artificial
2




    •   Introdução
    •   Grande Vantagem
    •   Um pouco sobre bancos RELACIONAIS
    •   Limitações de Bancos de Dados relacionais
    •   NoSQL: Uma grande mudança de perspectiva
    •   NoSQL: Prós e Contras
    •   Caso de Uso o/ o/ o/
    •   Expectativas e Trabalhos Futuros




    Agenda
3




    •   Introdução
    •   Grande Vantagem
    •   Um pouco sobre bancos RELACIONAIS
    •   Limitações de Bancos de Dados relacionais
    •   NoSQL: Uma grande mudança de perspectiva
    •   NoSQL: Prós e Contras
    •   Caso de Uso o/ o/ o/
    •   Expectativas e Trabalhos Futuros




    Agenda
4


      Introdução
    • Organizações que coletam grandes quantidades de dados não
      estruturados estão usando cada vez mais bases de dados não
      relacionais, agora frequentemente chamados bancos de
      dados NoSQL (NOT ONLY SQL).

    • Existem várias abordagens conceituais para bases de dados
      NoSQL, mas oque todos tem em comum é que são bases Não
      Relacionais
5




    • Ao contrário de bancos de dados relacionais, eles lidam
      com dados não estruturados, tais como arquivos de texto,
      e-mail, multimídia e mídias sociais de forma eficiente.




    Grande Vantagem
6




    • Segundo Neal Leavitt, presidente da Leavitt Communications:

    “Bases de dados NoSQL permitem uma melhor performance, o que é
    particularmente importante para aplicações com grandes quantidades de
    dados”
7

    • Edgar Codd, um ex-IBM, foi o responsável pela criação do modelo
     de banco de dados relacional em 1970.

     • Um banco de dados relacional é um conjunto de tabelas contendo os
       dados em “categorias” pré-definidas.
       • Cada tabela contém uma ou mais categorias de dados organizadas em
         colunas. Cada linha contém uma instância única de dados para as categorias
         definidas pelas colunas.

     • Bancos de dados relacionais funcionam melhor com dados estruturados,
       tais como um conjunto de números de vendas, que prontamente se
       encaixa em tabelas organizadas.

     • E se eu precisar trabalhar com textos e imagens?!

     Um pouco sobre bancos RELACIONAIS
8




    • Uma grande característica dos bancos de dados relacionais é a
     garantia de integridade dos dados.




    Vantagens de utilizar bancos de dados relacionais
9




    • A estrutura de dados relacional em um banco de dados é pré-
      definido pelo “layout” das tabelas e os nomes fixos e tipos das
      colunas.

    • Escalabilidade.
    • Complexidade
    • SQL


    LIMITAÇÕES DE BANCOS DE DADOS
    REL ACIONAIS
10




     • Surgimento oficial do conceito NoSQL que foi definida em 1998
      e reintroduzido em 2007

     • Em resposta à crescente consciência das limitações de bancos de
       dados relacionais, empresas estão são cada vez mais utilizando a
      proposta NoSQL.




     NoSQL : Uma grande mudança de perspectiva
11




     • Um dos momentos-chave desta mudança ocorreu em 2007, quando
       a Amazon publicou um artigo que introduziu o seu sistema
       distribuído NoSQL chamado de Dynamo, para uso interno.

     • A Amazon foi uma das primeiras grandes empresas para armazenar
       seus dados corporativos em um banco de dados não-relacional.




     NoSQL : Uma grande mudança de perspectiva
12
     • Existem 3 tipos mais populares de banco de dados NoSQL:

     • Key-Value Store:
      • Como está explícito no próprio nome, consiste em um sistema de
        armazenamento <chave,valor> em que as chaves são indexadas para
        futura recuperação.

      • Ex. SimpleDB da Amazon é um WebService que fornece uma base de dados
        central com funções de indexação de informação e consulta em nuvem.


     • Column-oriented databases:
      • Bancos de dados orientados à colunas contêm colunas de dados
        extensíveis ao contrário dos bancos relacionais

      • Ex. O Facebook criou o Cassandra, banco de dados de alto desempenho
        para atender a demanda dos usuários d sua rede social.
13



     • Document-based stores:

       • Estes bancos de dados armazenam e organizam dados como coleções
         de documentos ao invés de tabelas estruturadas.

       • Com estas bases de dados, os usuários podem adicionar qualquer
         número de campos de qualquer comprimento em um documento.

       • A 10Gen suporta comercialmente e patrocina o desenvolvimento
         do MongoDB, um banco de dados baseado em documento construído
         para escalabilidade e facilidade de uso.

         • Ex. Migração dos dados da base de segurança pública do
     Estado do Pará foi feita em 63 segundos...
14



     NoSQL baseado em Grafos
     • A vantagem de utilização do modelo baseado em grafos
       fica bastante clara quando consultas complexas são
       exigidas pelo usuário.

     • Comparado ao modelo relacional, que para estas
       situações pode ser muito custoso, o modelo orientado
       a grafos tem um ganho de performance, permitindo
       um melhor desempenho das aplicações.
15




     NoSQL: Prós e Contras
16

     • Bancos de dados NoSQL processam dados mais rápido do
       que bancos relacionais.

     • Não seguem o ACID (atomicidade, consistência, isolamento,
       durabilidade).

     • Os desenvolvedores geralmente não têm ACID em Bancos de
       dados NoSQL, o     que     aumenta      consideravelmente  o
       desempenho das aplicações, mas isso pode causar problemas
       quando usado para aplicações que requerem grande precisão.

     • Bancos de dados NoSQL também são muitas vezes mais rápido
       porque os seus modelos de dados são mais simples

        Vantagens...
17




     • Caso o desenvolvedor precise realizar transações eu exijam ACID,
       ele pode implementar essas rotinas em NoSQL.

     • Existem projetos (Google... ‘sempre é né?!’) que garantem
       características ACID para alguns sistemas NoSQL.




         Vantagens...
18




     • Vai depender muito de quem está desenvolvendo....




        Desvantagens....
19




     Quem usa?!
20




     AOL (America Online)
      • A empresa usa utiliza os bancos de dados: Hadoop e CouchDB, para
        executar suas operações de segmentação de anúncios.

      • Os anúncios são escolhidos baseados nas informações que a AOL tem
        sobre o usuário, juntamente com palpites sobre que anúncios seriam mais
        interessantes para o usuário.

     O processo deve ser executado dentro de cerca de 40   milissegundos.


          Caso de Uso...
21




     AOL (America Online)
      • A base de dados é volumosa
       • Os logs são mantidos em todas as ações dos usuários em cada servidor
       • Eles devem ser analisados e reagrupados para construir um perfil de cada
                                    ​
         usuário.
       • Os corretores de anúncios também definem um conjunto complexo de regras
         de quanto eles vão pagar por uma impressão de anúncio, ou quais os anúncios
         devem ser mostrados para cada usuários.




         Caso de Uso...
22


     AOL (America Online)

     • Esta atividade gera de 4 a 5 terabytes de dados por dia, gerando
       600 petabytes de dados operacionais por mês.
     • O sistema mantém mais de 650 bilhões de chaves, incluindo um para
       cada usuário, bem como chaves para lidar com outros aspectos de
       dados também.
     • O sistema deve reagir a 600.000 eventos por segundo.
     • Os logos do servidor e as fontes externas alimentam a base de dados

     Petabyte (PB) 1 024 TB / 1 048 576 GB / 1 073 741 824 MB / 1 099 511 627 776 kB / 1 125 899 906 842
     624 (250) Bytes



            Caso de Uso...
23




     • UM NOVO CENÁRIO...
     UMA NOVA PERSPECTIVA
24


     • Integrante do portfólio de produtos Big Data (bancos de dados
       com um tamanho excepcional) da Oracle.

     • Gerenciar com facilidade imensos volumes de dados com
       esquemas dinâmicos, como dados de logs da web, de sensores e
       medidores inteligentes, coletados para personalização e mantidos
       pelas redes sociais.

     • Altamente disponível e escalável, além de facilitar o
       armazenamento eficiente de dados em um formato simples e
       flexível
25

     • Com a expertise da Oracle na gestão de dados empresariais e o
       apoio de suporte líder do setor, o Oracle NoSQL Database é
       também mais fácil de instalar, configurar e gerenciar do que
       várias soluções da concorrência.

     • Oracle Big Data Appliance, uma plataforma otimizada para
       executar o Oracle NoSQL Database e outros produtos de Big Data
       da Oracle

               O Oracle Big Data Appliance será lançado no

          primeiro trimestre de
                  2012
26




     O que nós temos à ver com isso?!
27
28




     • Técnicas de DataMining são “essencialmente”
       ‘VELHAS’...
      • PENSAM DE FORMA ESTRUTURADA...
      • Ex...
29




     Considerações finais e Trabalhos
     Futuros...
Bancos de Dados NoSQL – Uma nova
abordagem para a utilização de algoritmos
        de Mineração de Dados

                     J. Gabriel Lima
                jgabriel.ufpa@gmail.com

         LINC - Laboratório de Inteligência Artificial

Mais conteúdo relacionado

PPT
Mini curso banco de dados comercial publicar
PDF
Banco de dados
PDF
O NoSQL e o Relacional: Uma Análise
PPTX
Banco de Dados Não Relacionais vs Banco de Dados Relacionais
DOCX
Modelos de Banco de dados e SGBDS
PPTX
Big Data, NoSQL e In Memory Databases
PPT
Dawarehouse e OLAP
PDF
Pg20235 rf20222vp20208
Mini curso banco de dados comercial publicar
Banco de dados
O NoSQL e o Relacional: Uma Análise
Banco de Dados Não Relacionais vs Banco de Dados Relacionais
Modelos de Banco de dados e SGBDS
Big Data, NoSQL e In Memory Databases
Dawarehouse e OLAP
Pg20235 rf20222vp20208

Mais procurados (20)

PDF
Oracle EXPLICAÇÕES EM PDF
DOCX
C # banco de dados
PDF
1.Introdução Banco de Dados
PDF
Introducao aos Bancos de Dados Não-relacionais
PPTX
Introdução ao banco de dados
ODT
Nosql
PDF
Arquitetura e sgbd de um banco de dados
PPTX
Aula tecnologia da informacao 6 banco de dados
DOCX
Criação de uma base de dados para gestão de uma biblioteca
PDF
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
PDF
Introdução a Banco de Dados (Parte 1)
PPTX
Meetup - Data Lake
PPTX
Banco de dados
PDF
BANCO DE DADOS RELACIONAIS
PPTX
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
PPTX
Aula 3 banco de dados
PDF
Aula1-Conceitos de SGBD
PDF
Aula banco de dados
PDF
PPT
Aula 2 - Introdução a Banco de Dados
Oracle EXPLICAÇÕES EM PDF
C # banco de dados
1.Introdução Banco de Dados
Introducao aos Bancos de Dados Não-relacionais
Introdução ao banco de dados
Nosql
Arquitetura e sgbd de um banco de dados
Aula tecnologia da informacao 6 banco de dados
Criação de uma base de dados para gestão de uma biblioteca
Apresentação Modelo de Gestão de dados para sistemas Colaborativos
Introdução a Banco de Dados (Parte 1)
Meetup - Data Lake
Banco de dados
BANCO DE DADOS RELACIONAIS
2019-2 - BD I - Aula 01 C - Introdução a Banco de Dados
Aula 3 banco de dados
Aula1-Conceitos de SGBD
Aula banco de dados
Aula 2 - Introdução a Banco de Dados
Anúncio

Destaque (12)

PPTX
[MinhaVida TechDay] NEO4J
PDF
Aplicações não convencionais de grafos
PDF
Com vocês, Django!
PPTX
NOSQL uma breve introdução
PPT
Introdução a nosql - II SACIC
PDF
Python e bancos NoSQL
PPTX
E agora: que tipo de Banco de Dados devo usar?
PDF
Web Semântica e bancos de dados NoSQL
ODP
Grafos - Uma abordagem divertida - Latinoware 2014
PDF
Bancos de dados NoSQL
PPS
NoSQL - Soluções alternativas para bancos de dados
PDF
Desmistificando NoSQL e Novas Tecnologias de Bancos de Dados
[MinhaVida TechDay] NEO4J
Aplicações não convencionais de grafos
Com vocês, Django!
NOSQL uma breve introdução
Introdução a nosql - II SACIC
Python e bancos NoSQL
E agora: que tipo de Banco de Dados devo usar?
Web Semântica e bancos de dados NoSQL
Grafos - Uma abordagem divertida - Latinoware 2014
Bancos de dados NoSQL
NoSQL - Soluções alternativas para bancos de dados
Desmistificando NoSQL e Novas Tecnologias de Bancos de Dados
Anúncio

Semelhante a Bancos de dados no sql – uma nova abordagem (20)

PDF
Artigo Nosql
PPS
Apresentação
PPTX
Introdução ao NoSQL
PDF
NoSQL Familia de Colunas Monografia
PDF
Pesquisa sobre no sql
PDF
Material Seminário NoSQL
PDF
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
PDF
Cobo, Cristiane Brandão. Especialização Banco de Dados
PDF
Versc3a3o final1
PPT
Bancos de dados NoSQL (Not only sql)
PDF
Algumas das principais características do NoSQL
PDF
No sql o_que_e_isso.key
PPT
NoSQL & SQL
PDF
Desenvolvendo com NOSQL ­ Cassandra em Java: Parte 1 ­ Conceito NOSQL
PDF
Bancos de dados nosql (not only sql)
PPT
Bancos de dados NoSQL - Redis e MongoDB
PDF
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
PDF
No sql no desenvolvimento de aplicações web colaborativas
PPT
I nd t_bigdata(1)
PPTX
Big Data e NoSQL
Artigo Nosql
Apresentação
Introdução ao NoSQL
NoSQL Familia de Colunas Monografia
Pesquisa sobre no sql
Material Seminário NoSQL
NoSQL x SQL: Bancos de Dados em Nuvens Computacionais
Cobo, Cristiane Brandão. Especialização Banco de Dados
Versc3a3o final1
Bancos de dados NoSQL (Not only sql)
Algumas das principais características do NoSQL
No sql o_que_e_isso.key
NoSQL & SQL
Desenvolvendo com NOSQL ­ Cassandra em Java: Parte 1 ­ Conceito NOSQL
Bancos de dados nosql (not only sql)
Bancos de dados NoSQL - Redis e MongoDB
Banco de Dados NoSQL - Disciplina: Sistemas Distribuídos
No sql no desenvolvimento de aplicações web colaborativas
I nd t_bigdata(1)
Big Data e NoSQL

Mais de João Gabriel Lima (20)

PDF
Cooking with data
PDF
Deep marketing - Indoor Customer Segmentation
PDF
Aplicações de Alto Desempenho com JHipster Full Stack
PDF
Realidade aumentada com react native e ARKit
PDF
PDF
Big data e Inteligência Artificial
PDF
Mineração de Dados no Weka - Regressão Linear
PDF
Segurança na Internet - Estudos de caso
PDF
Segurança na Internet - Google Hacking
PDF
Segurança na Internet - Conceitos fundamentais
PDF
Web Machine Learning
PDF
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
PDF
Mineração de dados com RapidMiner + WEKA - Clusterização
PDF
Mineração de dados na prática com RapidMiner e Weka
PDF
Visualizacao de dados - Come to the dark side
PDF
REST x SOAP : Qual abordagem escolher?
PDF
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
PDF
E-trânsito cidadão - IPVA em suas mãos
PPTX
[Estácio - IESAM] Automatizando Tarefas com Gulp.js
PDF
Hackeando a Internet das Coisas com Javascript
Cooking with data
Deep marketing - Indoor Customer Segmentation
Aplicações de Alto Desempenho com JHipster Full Stack
Realidade aumentada com react native e ARKit
Big data e Inteligência Artificial
Mineração de Dados no Weka - Regressão Linear
Segurança na Internet - Estudos de caso
Segurança na Internet - Google Hacking
Segurança na Internet - Conceitos fundamentais
Web Machine Learning
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de dados com RapidMiner + WEKA - Clusterização
Mineração de dados na prática com RapidMiner e Weka
Visualizacao de dados - Come to the dark side
REST x SOAP : Qual abordagem escolher?
Game of data - Predição e Análise da série Game Of Thrones a partir do uso de...
E-trânsito cidadão - IPVA em suas mãos
[Estácio - IESAM] Automatizando Tarefas com Gulp.js
Hackeando a Internet das Coisas com Javascript

Último (11)

PPTX
Tipos de servidor em redes de computador.pptx
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PDF
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
PDF
Jira Software projetos completos com scrum
PPT
Conceitos básicos de Redes Neurais Artificiais
PPTX
Eng. Software - pontos essenciais para o início
PPTX
Proposta de Implementação de uma Rede de Computador Cabeada.pptx
PPTX
Utilizando code blockes por andre backes
PDF
eBook - GUIA DE CONSULTA RAPIDA EM ROTEADORES E SWITCHES CISCO - VOL I.pdf
PPTX
Viasol Energia Solar -Soluções para geração e economia de energia
PDF
Manejo integrado de pragas na cultura do algodão
Tipos de servidor em redes de computador.pptx
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
Jira Software projetos completos com scrum
Conceitos básicos de Redes Neurais Artificiais
Eng. Software - pontos essenciais para o início
Proposta de Implementação de uma Rede de Computador Cabeada.pptx
Utilizando code blockes por andre backes
eBook - GUIA DE CONSULTA RAPIDA EM ROTEADORES E SWITCHES CISCO - VOL I.pdf
Viasol Energia Solar -Soluções para geração e economia de energia
Manejo integrado de pragas na cultura do algodão

Bancos de dados no sql – uma nova abordagem

  • 1. Bancos de Dados NoSQL – Uma nova abordagem para a utilização de algoritmos de Mineração de Dados J. Gabriel Lima jgabriel.ufpa@gmail.com LINC - Laboratório de Inteligência Artificial
  • 2. 2 • Introdução • Grande Vantagem • Um pouco sobre bancos RELACIONAIS • Limitações de Bancos de Dados relacionais • NoSQL: Uma grande mudança de perspectiva • NoSQL: Prós e Contras • Caso de Uso o/ o/ o/ • Expectativas e Trabalhos Futuros Agenda
  • 3. 3 • Introdução • Grande Vantagem • Um pouco sobre bancos RELACIONAIS • Limitações de Bancos de Dados relacionais • NoSQL: Uma grande mudança de perspectiva • NoSQL: Prós e Contras • Caso de Uso o/ o/ o/ • Expectativas e Trabalhos Futuros Agenda
  • 4. 4 Introdução • Organizações que coletam grandes quantidades de dados não estruturados estão usando cada vez mais bases de dados não relacionais, agora frequentemente chamados bancos de dados NoSQL (NOT ONLY SQL). • Existem várias abordagens conceituais para bases de dados NoSQL, mas oque todos tem em comum é que são bases Não Relacionais
  • 5. 5 • Ao contrário de bancos de dados relacionais, eles lidam com dados não estruturados, tais como arquivos de texto, e-mail, multimídia e mídias sociais de forma eficiente. Grande Vantagem
  • 6. 6 • Segundo Neal Leavitt, presidente da Leavitt Communications: “Bases de dados NoSQL permitem uma melhor performance, o que é particularmente importante para aplicações com grandes quantidades de dados”
  • 7. 7 • Edgar Codd, um ex-IBM, foi o responsável pela criação do modelo de banco de dados relacional em 1970. • Um banco de dados relacional é um conjunto de tabelas contendo os dados em “categorias” pré-definidas. • Cada tabela contém uma ou mais categorias de dados organizadas em colunas. Cada linha contém uma instância única de dados para as categorias definidas pelas colunas. • Bancos de dados relacionais funcionam melhor com dados estruturados, tais como um conjunto de números de vendas, que prontamente se encaixa em tabelas organizadas. • E se eu precisar trabalhar com textos e imagens?! Um pouco sobre bancos RELACIONAIS
  • 8. 8 • Uma grande característica dos bancos de dados relacionais é a garantia de integridade dos dados. Vantagens de utilizar bancos de dados relacionais
  • 9. 9 • A estrutura de dados relacional em um banco de dados é pré- definido pelo “layout” das tabelas e os nomes fixos e tipos das colunas. • Escalabilidade. • Complexidade • SQL LIMITAÇÕES DE BANCOS DE DADOS REL ACIONAIS
  • 10. 10 • Surgimento oficial do conceito NoSQL que foi definida em 1998 e reintroduzido em 2007 • Em resposta à crescente consciência das limitações de bancos de dados relacionais, empresas estão são cada vez mais utilizando a proposta NoSQL. NoSQL : Uma grande mudança de perspectiva
  • 11. 11 • Um dos momentos-chave desta mudança ocorreu em 2007, quando a Amazon publicou um artigo que introduziu o seu sistema distribuído NoSQL chamado de Dynamo, para uso interno. • A Amazon foi uma das primeiras grandes empresas para armazenar seus dados corporativos em um banco de dados não-relacional. NoSQL : Uma grande mudança de perspectiva
  • 12. 12 • Existem 3 tipos mais populares de banco de dados NoSQL: • Key-Value Store: • Como está explícito no próprio nome, consiste em um sistema de armazenamento <chave,valor> em que as chaves são indexadas para futura recuperação. • Ex. SimpleDB da Amazon é um WebService que fornece uma base de dados central com funções de indexação de informação e consulta em nuvem. • Column-oriented databases: • Bancos de dados orientados à colunas contêm colunas de dados extensíveis ao contrário dos bancos relacionais • Ex. O Facebook criou o Cassandra, banco de dados de alto desempenho para atender a demanda dos usuários d sua rede social.
  • 13. 13 • Document-based stores: • Estes bancos de dados armazenam e organizam dados como coleções de documentos ao invés de tabelas estruturadas. • Com estas bases de dados, os usuários podem adicionar qualquer número de campos de qualquer comprimento em um documento. • A 10Gen suporta comercialmente e patrocina o desenvolvimento do MongoDB, um banco de dados baseado em documento construído para escalabilidade e facilidade de uso. • Ex. Migração dos dados da base de segurança pública do Estado do Pará foi feita em 63 segundos...
  • 14. 14 NoSQL baseado em Grafos • A vantagem de utilização do modelo baseado em grafos fica bastante clara quando consultas complexas são exigidas pelo usuário. • Comparado ao modelo relacional, que para estas situações pode ser muito custoso, o modelo orientado a grafos tem um ganho de performance, permitindo um melhor desempenho das aplicações.
  • 15. 15 NoSQL: Prós e Contras
  • 16. 16 • Bancos de dados NoSQL processam dados mais rápido do que bancos relacionais. • Não seguem o ACID (atomicidade, consistência, isolamento, durabilidade). • Os desenvolvedores geralmente não têm ACID em Bancos de dados NoSQL, o que aumenta consideravelmente o desempenho das aplicações, mas isso pode causar problemas quando usado para aplicações que requerem grande precisão. • Bancos de dados NoSQL também são muitas vezes mais rápido porque os seus modelos de dados são mais simples Vantagens...
  • 17. 17 • Caso o desenvolvedor precise realizar transações eu exijam ACID, ele pode implementar essas rotinas em NoSQL. • Existem projetos (Google... ‘sempre é né?!’) que garantem características ACID para alguns sistemas NoSQL. Vantagens...
  • 18. 18 • Vai depender muito de quem está desenvolvendo.... Desvantagens....
  • 19. 19 Quem usa?!
  • 20. 20 AOL (America Online) • A empresa usa utiliza os bancos de dados: Hadoop e CouchDB, para executar suas operações de segmentação de anúncios. • Os anúncios são escolhidos baseados nas informações que a AOL tem sobre o usuário, juntamente com palpites sobre que anúncios seriam mais interessantes para o usuário. O processo deve ser executado dentro de cerca de 40 milissegundos. Caso de Uso...
  • 21. 21 AOL (America Online) • A base de dados é volumosa • Os logs são mantidos em todas as ações dos usuários em cada servidor • Eles devem ser analisados e reagrupados para construir um perfil de cada ​ usuário. • Os corretores de anúncios também definem um conjunto complexo de regras de quanto eles vão pagar por uma impressão de anúncio, ou quais os anúncios devem ser mostrados para cada usuários. Caso de Uso...
  • 22. 22 AOL (America Online) • Esta atividade gera de 4 a 5 terabytes de dados por dia, gerando 600 petabytes de dados operacionais por mês. • O sistema mantém mais de 650 bilhões de chaves, incluindo um para cada usuário, bem como chaves para lidar com outros aspectos de dados também. • O sistema deve reagir a 600.000 eventos por segundo. • Os logos do servidor e as fontes externas alimentam a base de dados Petabyte (PB) 1 024 TB / 1 048 576 GB / 1 073 741 824 MB / 1 099 511 627 776 kB / 1 125 899 906 842 624 (250) Bytes Caso de Uso...
  • 23. 23 • UM NOVO CENÁRIO... UMA NOVA PERSPECTIVA
  • 24. 24 • Integrante do portfólio de produtos Big Data (bancos de dados com um tamanho excepcional) da Oracle. • Gerenciar com facilidade imensos volumes de dados com esquemas dinâmicos, como dados de logs da web, de sensores e medidores inteligentes, coletados para personalização e mantidos pelas redes sociais. • Altamente disponível e escalável, além de facilitar o armazenamento eficiente de dados em um formato simples e flexível
  • 25. 25 • Com a expertise da Oracle na gestão de dados empresariais e o apoio de suporte líder do setor, o Oracle NoSQL Database é também mais fácil de instalar, configurar e gerenciar do que várias soluções da concorrência. • Oracle Big Data Appliance, uma plataforma otimizada para executar o Oracle NoSQL Database e outros produtos de Big Data da Oracle O Oracle Big Data Appliance será lançado no primeiro trimestre de 2012
  • 26. 26 O que nós temos à ver com isso?!
  • 27. 27
  • 28. 28 • Técnicas de DataMining são “essencialmente” ‘VELHAS’... • PENSAM DE FORMA ESTRUTURADA... • Ex...
  • 29. 29 Considerações finais e Trabalhos Futuros...
  • 30. Bancos de Dados NoSQL – Uma nova abordagem para a utilização de algoritmos de Mineração de Dados J. Gabriel Lima jgabriel.ufpa@gmail.com LINC - Laboratório de Inteligência Artificial