SlideShare uma empresa Scribd logo
Guide bra
INFORMAÇÕES                      LEGAIS

Copyright © 2002 ScanSoft, Inc. Todos os direitos reservados.
O software descrito neste livro é fornecido sob licença e pode ser usado ou copiado somente
de acordo com os termos desta licença.

INFORMAÇÃO         IMPORTANTE

A ScanSoft, Inc. fornece esta publicação assim "como está", sem garantias de nenhum tipo,
explícitas ou implícitas, incluindo, dentre outras, garantias implícitas de capacidade de
comercialização ou de adequação a um determinado propósito. Alguns estados ou jurisdições
não permitem isenção de responsabilidade de garantias implícitas ou explícitas em certas
transações, neste caso, esta declaração pode não se aplicar a você. A ScanSoft reserva-se o
direito de revisar e fazer alterações no conteúdo desta publicação, de tempos em tempos, sem
haver obrigação de sua parte de avisar qualquer pessoa sobre tal revisão ou alterações.

MARCAS      REGISTRADAS E CRÉDITOS

ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page e DirectOCR
são marcas registradas ou marcas comerciais da ScanSoft, Inc., nos Estados Unidos e/ou em
outros países.
Todos os demais nomes de empresas ou nomes de produtos referidos no presente documento
podem ser marcas comerciais de seus respectivos proprietários.

ScanSoft, Inc.
9 Centennial Drive
Peabody, MA 01960
EUA

ScanSoft Bélgica BVBA
Guldensporenpark 32
BE-9820 Merelbeke
Bélgica


Número do referencia 58-281201-08A
S   U M Á R I O



    BEM-VINDO                                                    7
          Como usar este manual                                 8
          Obtenção de Ajuda on-line                             9
                  Ajuda HTML on-line                            9
                  Ajuda sensível ao contexto                    9
                  Notas técnicas                               10
                  Glossário                                    10
                  OmniPage SE                                  10

1   INSTALAÇÃO E CONFIGURAÇÃO                                  11
          Requisitos do sistema                                12
          Instalação do OmniPage SE                            13
          Configuração do scanner com OmniPage SE              14
          Como iniciar o programa                              16
          Registro do software                                 17
          Novos recursos no OmniPage Pro 12                    17
          OmniPage SE e OmniPage Pro 12                        19

2   INTRODUÇÃO                                                 21
          O que é reconhecimento óptico de caracteres          22
                  Recursos de OCR do OmniPage SE               22
                  Documentos no OmniPage SE                    23
                  Etapas básicas de processamento              23
          O ambiente do OmniPage                               24
                  A barra de menus                             25



                                     OmniPage SE Manual do usuário   iii
As Barras de ferramentas                    25
                                O Painel de imagem                          26
                                O Editor de texto                           26
                                A caixa de ferramentas do OmniPage          27
                        Gerenciamento de documentos                         28
                                Miniaturas                                  28
                                Gerenciador de documentos                   29
                                Personalizar colunas do Gerenciador
                                    de documentos                           30
                                Exclusão de páginas de um documento         30
                                Impressão de um documento                   31
                                Fechar um documento                         31
                        Documentos do OmniPage                              31
                                Por que salvar em OPD                       32
                                Como salvar como OPD                        32
                        Configurações                                       33

               3   PROCESSAMENTO DE DOCUMENTOS                              35
                        Guia de início rápido                               36
                                Carregamento e reconhecimento de amostras
                                    de arquivos de imagem                   36
                                Digitalização e reconhecimento de uma
                                    única página                            36
                        Visão geral do processamento                        38
                        Processamento automático                            40
                                Interromper e reiniciar o processamento
                                    automático                              41
                        Processamento manual                                42
                        Processamento combinado                             43
                        Processamento com o Assistente de OCR               45
                        Processamento a partir de outros aplicativos        46
                                Como configurar o Direct OCR                46


iv   Sumário
Como usar o Direct OCR                        47
                  Como usar o OmniPage SE com o PaperPort       48
          Processamento de documentos com Programar OCR         49
          Definição da origem das imagens de página             50
                  Entrada de arquivos de imagem                 50
                  Entrada do scanner                            51
                  Digitalização com um ADF                      52
                  Digitalização sem um ADF                      53
          Descrição do layout de documento                      53
          Zonas e planos de fundo                               54
                  Zoneamento automático                         55
                  Zoneamento manual                             56
                  Tipos de zona e propriedades                  57
                  Trabalho com zonas                            59
          Grades de tabela na imagem                            61
          Uso de gabaritos de zonas                             63

4   CORREÇÃO E EDIÇÃO                                           65
          Exibição e visualizações do editor                    66
          Correção de resultados de OCR                         67
          Verificação de texto                                  68
          Dicionários do usuário                                70
          Treinamento                                           71
                  Treinamento manual                            72
                  IntelliTrain                                  72
                  Arquivos de treinamento                       73
          Edição de texto e de imagem                           75
          Edição em tempo real                                  77
          Leitura de texto em voz alta                          78




                                      OmniPage SE Manual do usuário   v
5   GRAVAÇÃO E EXPORTAÇÃO                                         81
                         Gravação de imagens originais                           82
                         Gravação dos resultados de reconhecimento               83
                                 Salvar um documento enquanto você trabalha 84
                                 Selecionar um nível de formatação               85
                                 Selecionar opções avançadas de salvamento       86
                                 Salvar como PDF                                 88
                         Copiar páginas para a Área de transferência             88
                         Enviar páginas via correio                              89

               6   INFORMAÇÕES TÉCNICAS                                          91
                         Solução de problemas                                    92
                                 Soluções para tentar primeiro                   92
                                 Teste do OmniPage SE                            93
                                 Aumentar recursos de memória                    94
                                 Aumentar espaço em disco                        94
                                 O texto não é reconhecido corretamente          95
                                 Problemas com reconhecimento de fax             96
                                 Problemas de desempenho ou de sistema
                                     durante o OCR                               96
                         Suporte a ODMA                                          97
                         Recursos avançados em Programar OCR                     97
                         Tipos de arquivo compatíveis                            98
                                 Tipos de arquivo para abrir e salvar imagens    98
                                 Tipos de arquivo para salvar resultados
                                    de reconhecimento                            99
                         Desinstalação do software                              100




vi   Sumário
Bem-vindo
Seja bem-vindo ao OmniPage® SE e obrigado por usar nosso software! A
documentação a seguir é fornecida para ajudá-lo a se familiarizar com o
programa e dar-lhe uma visão geral do mesmo.
Este manual do usuário
Este manual lhe ensina como utilizar o OmniPage SE (Special Edition). Ele
inclui instruções de instalação e configuração, uma descrição dos comandos e
áreas de trabalho do programa, instruções orientadas por tarefas, formas de
personalizar e controlar o processamento e informações técnicas. Este manual é
apresentado em formato PDF, permitindo que você use hyperlinks em
referências cruzadas e outras ferramentas de navegação em seu visualizador PDF.
Ajuda on-line
A ajuda on-line do OmniPage SE contém informações sobre recursos,
configurações e procedimentos. Ela é fornecida como ajuda HTML e foi
projetada para que as informações sejam obtidas de forma rápida e fácil. A ampla
ajuda sensível ao contexto visa fornecer a assistência exata que você precisa para
continuar a trabalhar sem perda de tempo. Consulte “Obtenção de Ajuda on-
line” na página 9.
Arquivo leiame
O arquivo leiame contém informações de última hora sobre o software. Leia-o
antes de usar o OmniPage SE. Para abrir este arquivo HTML, escolha Leiame
no programa de instalação do OmniPage SE ou, mais tarde, no menu Ajuda.
Digitalização e outras informações
O site da ScanSoft na Web no endereço www.scansoft.com fornece informações
atuais sobre o programa. O manual do scanner contém informações atualizadas
sobre scanners compatíveis e questões relacionadas. A ScanSoft testa os 25
modelos de scanner mais utilizados. Acesse o site da ScanSoft na Web a partir do
programa de instalação do OmniPage SE ou, mais tarde, a partir do menu
Ajuda.



                                      OmniPage SE Manual do usuário              7
Como usar este manual
                Este manual foi escrito partindo-se do pressuposto que você sabe como trabalhar
                no ambiente Microsoft Windows. Consulte a documentação do Windows se
                você tiver dúvidas sobre como usar caixas de diálogo, comandos de menu, barras
                de rolagem, funcionalidades de arrastar e soltar, menus de atalho etc.
                Partimos também do princípio que você está familiarizado com o scanner e seu
                software de suporte e que o scanner está instalado e funciona corretamente antes
                da configuração para o OmniPage SE. Consulte a documentação do scanner se
                necessário.
                As seguintes convenções são usadas neste manual:

                 Negrito         Introduz termos novos e apresenta sub-cabeçalhos.
                 Itálico         Usado no nome dos tópicos do sistema de ajuda on-line.
                                 Apresenta textos mais longos das opções em caixas de diálogo.
                 Sem serifa      Apresenta nomes de arquivos: sample.tif

                                 Uma nota apresenta um item de informação adicional.

                                 Uma dica apresenta idéias de uso dos recursos do programa
                                 para realizar tarefas específicas.
                                 Este manual e utilizando o ícone SE para indicar as diferenças
                                 entre os Edição Especial do OmniPage e OmniPage Pro 12.
                                 Consulte “OmniPage SE” na página 10.




8   Bem-vindo
Obtenção de Ajuda on-line
Além de usar este manual, você pode usar a Ajuda on-line do OmniPage SE para
aprender sobre recursos, configurações e procedimentos. A ajuda on-line fica
disponível após a instalação do OmniPage SE.


Ajuda HTML on-line
Abra a Ajuda on-line do OmniPage SE no nível superior escolhendo os tópicos
de Ajuda do OmniPage SE na parte superior do menu Ajuda. Isto permite que
você veja os tópicos organizados em um Índice analítico, procure por uma lista
alfabética de palavras-chave ou faça buscas de texto completo através dos tópicos.
Os outros itens no menu Ajuda fornecem acesso a tópicos úteis ou páginas na
Web.
Pressione F1 conforme você estiver trabalhando no programa para ver um tópico
de ajuda on-line relacionado à área da tela, caixa de diálogo ou mensagem de
advertência atual.


Ajuda sensível ao contexto
Você pode obter informações concisas no local, que aparecem em uma janela
instantânea, sobre um item particular do menu, botão de ferramentas, área da
tela ou caixa de diálogo do OmniPage SE da seguinte forma:
Clique no botão Ajuda na barra de ferramentas Padrão para obter o ícone de
ajuda. Com este ícone, clique em qualquer item na área de trabalho fora de uma
caixa de diálogo ou de uma mensagem de advertência.
Pressione Shift + F1 para obter o mesmo ícone de ajuda. Use Shift + F1 para
obter ajuda sensível ao contexto sobre itens do menu de atalho.
Clique no botão de ponto de interrogação no lado superior direito de uma caixa
de diálogo e, em seguida, clique no item na caixa de diálogo para ver a janela
instantânea.
Algumas caixas de diálogo ou mensagens de advertência possuem seu próprio
botão de Ajuda ou um texto de ajuda. Clique no botão ou texto para obter
informações sobre a caixa de mensagem ou de diálogo.
Clique em qualquer lugar para remover uma janela de Ajuda instantânea sensível
ao contexto.




                                      OmniPage SE Manual do usuário              9
Notas técnicas
                 O site da ScanSoft na Web em www.scansoft.com contém notas técnicas sobre
                 questões relatadas freqüentemente, referentes ao uso do OmniPage. As páginas
                 da Web também podem oferecer assistência sobre o processo de instalação e
                 solução de problemas.


                 Glossário
                 Este manual não inclui um glossário. A Ajuda on-line possui um glossário
                 amplo, com seu próprio índice alfabético e um índice analítico. Consulte-o se
                 quiser encontrar o significado de um termo usado neste manual ou no
                 programa.


                 OmniPage SE
                 O produto que você tem é uma edição especial do software OmniPage Pro®,
                 mundialmente conhecido. Esta edição foi desenvolvida para ser distribuída
                 por um grupo seleto de fabricantes de scanners e contém um subconjunto de
                 recursos do produto OmniPage Pro 12. Este manual e a Ajuda on-line
                 descrevem os recursos do produto completo, utilizando o ícone SE para
                 indicar as diferenças entre os dois produtos.
                 Caso constate que outros recursos do produto profissional podem ser
                 vantajosos para você, use as ferramentas on-line para fazer a atualização da
                 Edição Especial 2.0 para o OmniPage Pro 12.
                 Consulte “OmniPage SE e OmniPage Pro 12” na página 19.




10   Bem-vindo
Capítulo 1

             Instalação e
             configuração
             Este capítulo fornece informações sobre como instalar e iniciar o OmniPage SE.
             Ele apresenta os seguintes tópicos:

                 x   Requisitos do sistema

                 x   Instalação do OmniPage SE

                 x   Configuração do scanner com OmniPage SE

                 x   Como iniciar o programa

                 x   Registro do software

                 x   Novos recursos no OmniPage Pro 12

                 x   OmniPage SE e OmniPage Pro 12




                                                 OmniPage SE Manual do usuário          11
Requisitos do sistema
                           Você precisa dos seguintes requisitos mínimos de sistema para instalar e executar
                           o OmniPage SE 2.0:
                                 x   Um computador com processador Pentium ou superior

                                 x   Microsoft Windows 98 (da segunda edição em diante), Windows Me,
                                     Windows NT 4.0 (com pelo menos o Service Pack 6), Windows 2000
                                     ou Windows XP

                                 x   64 MB de memória (RAM), 128 MB recomendado

                                 x   90 MB disponível em disco rígido para os arquivos do aplicativo além
                                     de espaço de trabalho de 5 MB durante a instalação

                                 x   5 MB para o Microsoft Installer (MSI) caso ele não esteja presente
                                     (Este módulo está presente como parte do sistema operacional no
                                     Windows Me, Windows 2000 e Windows XP)

                                 x   Monitor SVGA com 256 cores, mas preferencialmente cor de 16 bits
                                     (chamada High Color no Windows 2000 e Medium Color no XP) e
                                     resolução de 800 x 600 pixels

                                 x   Dispositivo indicador compatível com Windows

                                 x   Unidade de CD-ROM para instalação

                                 x   Um scanner compatível, com seu próprio software do driver do scanner
                                     se você pretende digitalizar documentos. Consulte o Guia do scanner
                                     no site da ScanSoft na Web (www.scansoft.com) para obter uma lista
                                     de scanners compatíveis.


                                     O desempenho e a velocidade serão melhorados se o processador, a memória e o
                                     espaço em disco disponível do seu computador excederem os requisitos mínimos.




12   Instalação e configuração
Capítulo 1



   Instalação do OmniPage SE
   O programa de instalação do OmniPage SE o conduz pela instalação com
   instruções em todas as telas.
   Antes de instalar o OmniPage SE:

       x    Feche todos os outros aplicativos, especialmente programas antivírus.

       x   Faça o login em seu computador com privilégios de administrador se
           estiver instalando no Windows NT, 2000 ou XP.

       x   Se você tiver o software OCR do ScanSoft anterior em seu sistema, o
           programa de instalação solicitará sua permissão para desinstalá-lo
           primeiro.

w Para instalar o OmniPage SE:

   1. Coloque o CD-ROM do OmniPage SE na unidade de CD-ROM. O
      programa de instalação deve iniciar automaticamente. Se ele não iniciar,
      localize a unidade de CD-ROM no Windows Explorer e clique duas vezes
      no programa Autorun.exe no nível superior do CD-ROM.
   2. Escolha um idioma para usar durante a instalação. O idioma será usado pelo
      sistema de conversão de texto em fala e como o idioma de interface do
      programa. O idioma de interface do programa é usado para exibições como
      itens de menu, caixas de diálogo, mensagens de advertência etc. Você pode
      alterar o idioma de interface posteriormente a partir do OmniPage SE, mas
      a sua escolha no momento de instalação determina qual sistema de
      conversão de texto em fala será instalado no programa. As referências ao
      recurso Texto para fala não se aplicam ao OmniPage SE.
   3. Siga as instruções em cada tela para instalar o software. Todos os arquivos
      necessários para digitalização são copiados automaticamente durante a
      instalação.

            Algumas vezes a desinstalação e reinstalação do OmniPage SE resolverá o
            problema. Consulte “Desinstalação do software” na página 100.
            No OmniPage Pro 12, o recurso Texto para fala está disponível para os idiomas
            inglês (britânico e dos Estados Unidos), francês, alemão, italiano, português ou
            espanhol. O recurso não está disponível no OmniPage SE. Consulte “Leitura de
            texto em voz alta” na página 78.




                                                   Instalação do OmniPage SE               13
Configuração do scanner com OmniPage SE
                           Todos os arquivos necessários para configuração e suporte do scanner são
                           copiados automaticamente durante a instalação do programa. Antes de usar o
                           OmniPage SE para digitalização, o scanner deve ser instalado com seu próprio
                           software do driver do scanner e testado quanto ao seu funcionamento correto. O
                           software do driver do scanner não acompanha o OmniPage SE.
                           A instalação do scanner e a sua configuração são feitas pelo Assistente do
                           scanner. Você pode iniciar este processo sozinho, como descrito abaixo. Caso
                           contrário, o Assistente do scanner aparece quando você tenta realizar a
                           digitalização pela primeira vez.
                           Siga estas etapas para usar o Assistente do scanner para configurar o scanner com
                           o OmniPage SE:

                                 x   Escolha IniciarProgramasScanSoft OmniPage SE 2.0 Assistente
                                     do scanner

                                     ou clique no botão Configuração no painel Scanner da caixa de diálogo
                                     Opções.

                                     ou escolha uma configuração de digitalização na lista suspensa Obter
                                     página na caixa de ferramentas do OmniPage e clique no botão Obter
                                     página.

                                   O Assistente de configuração do scanner é iniciado. O primeiro painel
                                   aparece apenas na primeira configuração quando chamado de dentro
                                   do OmniPage SE.
                                 x Escolha ‘Selecione scanner ou câmera digital’ e clique em Avançar.
                                   Você verá uma lista com todos os drivers de scanner TWAIN
                                   detectados, na qual estará selecionado o scanner padrão do sistema.
                                 x Clique uma vez para selecionar o driver do scanner que deseja usar.
                                   Clique em ‘Outros drivers...’ se você precisar procurar um driver.
                                   Selecione ‘Configurar definições avançadas’ para abrir um outro painel
                                   caso deseje que a própria interface do scanner seja ocultada durante a
                                   digitalização ou para modificar o método de transferência de imagem.
                                   Clique em Avançar.
                                 x Escolha Sim para testar a configuração do scanner e, em seguida, clique
                                   em Avançar. O assistente testará agora a conexão do computador com o
                                   scanner. Ao término, clique em Avançar.




14   Instalação e configuração
Capítulo 1


    x   Coloque uma página de teste no scanner. O assistente agora está
        preparado para fazer uma digitalização básica usando o software do
        fabricante do scanner. Clique em Avançar. A interface de usuário
        original do scanner aparecerá.
    x   Clique em Digitalizar para iniciar a digitalização do teste.
    x   Se necessário, clique em Imagem invertida... ou Faltando imagem... e
        faça as seleções apropriadas.
    x   Depois que a imagem aparecer corretamente na janela, clique em
        Avançar.
    x   Selecione o item que descreve mais adequadamente o scanner e, em
        seguida, clique em Avançar.
    x   Clique em Avançar para ir para o tamanho da página.
    x   Os tamanhos de página que o Assistente do scanner acredita que são
        compatíveis com seu scanner são listados na janela. Para fazer alterações
        nos tamanhos da página, clique em Avançado, faça as alterações e clique
        em Avançar.
    x   Coloque uma página com texto mas sem imagens no scanner. Clique
        em Avançar para começar a digitalizar no modo preto e branco.
    x   Se necessário, clique em Imagem invertida... ou Faltando imagem... e
        faça as seleções apropriadas.
    x   Depois que a imagem aparecer corretamente na janela, clique em
        Avançar.
    x   Se você tiver um scanner colorido, coloque uma fotografia ou uma
        página colorida com uma imagem colorida no scanner. Clique em
        Avançar para começar a digitalizar no modo colorido. Se necessário,
        clique em Imagem invertida... ou Faltando imagem... e faça as seleções
        apropriadas. Depois que a imagem aparecer corretamente na janela,
        clique em Avançar. Se o scanner não puder digitalizar em cores, pule
        esta etapa.
    x   Coloque uma fotografia ou uma página com uma imagem no scanner.
        Clique em Avançar para começar a digitalizar no modo de tons de
        cinza. Se necessário, clique em Imagem invertida... ou Faltando
        imagem... e faça as seleções apropriadas. Depois que a imagem aparecer
        corretamente na janela, clique em Avançar.
    x   Você configurou o scanner com êxito para trabalhar com o OmniPage
        SE! Clique em Concluir.
Para alterar as configurações do scanner posteriormente ou para configurar um
scanner de modo diferente, abra novamente o Assistente de configuração do
scanner no menu Iniciar do Windows ou no painel Scanner da caixa de diálogo
Opções. Para testar e consertar um scanner que não está funcionando
adequadamente, abra o Assistente de configuração do scanner no menu Iniciar



                          Configuração do scanner com OmniPage SE             15
do Windows e selecione ‘Testar o scanner ou câmera digital’ no primeiro painel
                           e então execute o procedimento descrito acima.




                           Como iniciar o programa
                           Para iniciar o OmniPage SE, siga um dos procedimentos abaixo:
                               x Clique em Iniciar na barra de tarefas do Windows e escolha
                                    ProgramasScanSoft OmniPage SE 2.0OmniPage SE 2.0.

                                 x   Clique duas vezes no ícone do OmniPage SE na pasta de instalação do
                                     programa ou na área de trabalho do Windows se você o colocou lá.

                                 x   Clique duas vezes no ícone de documento (OPD) do OmniPage ou no
                                     nome de arquivo. O documento clicado é carregado pelo programa.
                                     Consulte “Documentos do OmniPage” na página 31.
                           Na abertura, a tela com o título do OmniPage SE é exibida e, em seguida, seu
                           ambiente de trabalho. Consulte “O ambiente do OmniPage” na página 24. Ele
                           fornece uma introdução às principais áreas de trabalho do programa.

                           Há várias formas de executar o programa com uma interface limitada:

                                 x   Use o programa Programar OCR. Clique em Iniciar na barra de tarefas
                                     do Windows e escolha ProgramasScanSoft OmniPage Pro 12.0
                                     Programar OCR. Consulte “Processamento de documentos com
                                     Programar OCR” na página 49. Esse recurso não está disponível no
                                     OmniPage SE.

                                 x   Clique em Obter texto no menu Arquivo de um aplicativo registrado
                                     com o recurso Direct OCR™. Consulte “Como configurar o Direct
                                     OCR” na página 46.

                                 x   Clique com o botão direito no ícone de arquivo de imagem ou no
                                     nome de arquivo para obter um menu de atalho. Selecione um item no
                                     sub-menu de ‘Converter para...’ para definir um destino.

                                 x   Use o OmniPage SE com o PaperPort® da ScanSoft ou com os
                                     produtos de gerenciamento de documentos Pagis para acrescentar
                                     serviços de OCR . Consulte “Como usar o OmniPage SE com o
                                     PaperPort” na página 48.




16   Instalação e configuração
Capítulo 1



Registro do software
O assistente de registro da ScanSoft é executado no final da instalação.
Fornecemos um formulário eletrônico simples que pode ser preenchido em
menos de cinco minutos. Quando o formulário é preenchido e você clica em
Enviar, o programa procurará por uma conexão com Internet para realizar o
registro on-line imediatamente.
Se você não tiver registrado o software durante a instalação, será convidado
periodicamente a registrá-lo. Você pode acessar www.scansoft.com para fazer o
registro on-line. Clique em Support (Suporte) e na tela principal de suporte,
escolha Register (Registrar) na coluna esquerda.
Para obter uma declaração sobre o uso dos seus dados de registro, consulte a
Política de privacidade da ScanSoft.




Novos recursos no OmniPage Pro 12
A família de produtos OmniPage® foi ampliada com o OmniPage Pro 12 e o
OmniPage SE. Esta seção relaciona as melhorias introduzidas no produto
profissional OmniPage Pro 12. Algumas foram incorporadas no OmniPage SE,
como detalhado na próxima seção.
Os novos recursos do OmniPage Pro 12, em comparação ao OmniPage Pro 11,
são:

    x   Aumento significativo na precisão
        Uma sinergia aperfeiçoada entre os mecanismos de reconhecimento,
        suporte para dicionários profissionais e a capacidade de treinar
        caracteres escolhidos pelo usuário impulsionam a precisão a novos
        níveis.

    x   Interface otimizada
        O processamento automático e manual são agora acionados
        diretamente da Caixa de ferramentas do OmniPage sem barras de
        ferramentas separadas. Veja página 27. Agora as miniaturas são exibidas
        no Painel Imagem; escolha entre ver a página atual, miniaturas ou
        ambos. Veja página 28. A visualização Detalhe anterior tornou-se o
        Gerenciador de documentos e inclui uma coluna Notas para
        comentários e palavras-chave que podem ser pesquisadas.




                                                   Registro do software        17
x   Novos conceitos de zoneamento
                                     Zoneamento em tempo real permite que alterações na zona sejam
                                     processadas imediatamente sem a necessidade de reconhecer a página
                                     inteira novamente. Veja página 77. Planos de fundo da página são
                                     definidos como processar (zoneamento automático) ou ignorar, de
                                     modo que todas as instruções de zoneamento apareçam na página e
                                     possam ser salvas em gabaritos de zona. Veja página 54. Zonas
                                     irregulares podem ser definidas e zonas podem ser divididas ou
                                     agrupadas mais facilmente, sem a necessidade de ferramentas separadas.
                                     Veja página 59.

                                 x   Melhor correção e verificação
                                     A caixa de diálogo Correção exibe agora palavras suspeitas em um
                                     contexto mais amplo. Um verificador dinâmico pode permanecer
                                     aberto enquanto o texto é verificado, com a visualização e janela da
                                     imagem acompanhando a posição de edição. Veja página 67.

                                 x   Níveis de formatação para exibição e salvamento
                                     Existem três níveis de formatação para a visualização do Editor de texto.
                                     Veja página 66. Agora o nível de formatação de saída é escolhido no
                                     momento da exportação; as opções dependem do tipo de arquivo
                                     especificado. Uma opção de exportação ‘Página ligada’ é uma versão
                                     melhorada da visualização anterior ‘Manter colunas ligadas’. Ela
                                     preserva o layout da página, sem caixas e quadros, sempre que possível,
                                     de modo que o texto possa fluir entre as colunas. Veja página 85.

                                 x   Melhor análise da página
                                     A transferência de formatação de tabela melhorou, particularmente a
                                     detecção de tabelas sem linhas de grade nas páginas originais.
                                     Endereços Web e de correio eletrônico podem ser detectados e
                                     transferidos para o Editor de texto; hyperlinks podem ser inseridos.
                                     Agora a ordem de leitura pode ser visualizada e alterada depois do
                                     reconhecimento na visualização True Page ® do Editor de texto. Veja
                                     página 75.

                                 x   Tratamento melhorado do formato PDF
                                     O OmniPage Pro 12 procura texto de fundo nos arquivos PDF que
                                     abrir, proporcionando uma maior precisão de reconhecimento. Um
                                     novo tipo de arquivo ‘PDF editado’ permite uma boa retenção de
                                     formato em páginas que foram modificadas no Editor de texto após o
                                     reconhecimento.

                                 x   Opções avançadas de salvamento
                                     Uma gama mais ampla de opções de salvamento é oferecida para cada
                                     tipo de arquivo de saída. Podem ser criados tipos de arquivo de saída


18   Instalação e configuração
Capítulo 1


        definidos pelo usuário com configurações personalizadas. Veja
        página 86. Se sua edição do OmniPage Pro 12 incluir os novos
        formatos de salvamento XML e eBook, veja página 99.




OmniPage SE e OmniPage Pro 12
Esta lista indica os recursos que não foram incorporados no OmniPage SE,
mas que podem ser obtidos por meio da atualização para o
OmniPage Pro 12:

    x    Aperfeiçoamento significativo da precisão do reconhecimento.
    x   Acesso ao recurso de treinamento, de IntelliTrain e arquivos de
        treinamento.
    x    Capacidade para abrir e ler o conteúdo de arquivos PDF.
    x    Capacidade para salvar documentos reconhecidos no formato PDF.
    x   Recurso Programar OCR para processamento automático de tarefas
        OCR em horários definidos.
    x   Suporte à digitalização de 2 páginas para facilitar a digitalização de
        livros.
    x   Nível de formatação com saída de página ligada para retenção
        superior do layout da página.
    x   Gerenciamento de arquivos de imagem TIFF LZW e GIF para
        entrada e saída.
    x    Exportação para os formatos eBook e XML.
    x    Suporte para saída em HTML 4.0 'WYSIWYG'.
    x    Suporte para idiomas ampliado, de cerca de 50 para mais de 100.
    x   Acesso a dicionários médicos e jurídicos profissionais em idiomas
        selecionados.
    x   Acesso ao software RealSpeak, Texto para fala, permitindo leitura em
        voz alta de textos reconhecidos.
Para obter mais informações ou fazer a atualização, visite o site
www.scansoft.com.



                                    OmniPage SE e OmniPage Pro 12           19
20   Instalação e configuração
Capítulo 2

             Introdução
             Provavelmente, você usa o computador para correspondência comercial,
             elaboração de relatórios, tratamento de dados e um número cada vez maior de
             outros usos. O desafio é que, apesar da revolução digital, algumas fontes de
             informação ainda circulam na forma de papel impresso e não podem ser usadas
             imediatamente em um computador.
             Por exemplo, se você quiser incluir informações de um artigo de revista em um
             relatório que estiver preparando, precisará obter o texto do artigo de alguma
             forma e colocá-lo em seu computador. Digitar todo o artigo não é uma solução
             interessante.
             Este capítulo lhe apresenta a solução: reconhecimento óptico de caracteres
             (OCR). Ele descreve como o OmniPage SE usa tecnologia de OCR para
             transformar o texto contido em arquivos de imagem ou páginas digitalizadas em
             texto editável para ser usado em seus aplicativos favoritos.

             Apresentamos os seguintes tópicos:
                 x   O que é reconhecimento óptico de caracteres
                        • Documentos no OmniPage SE
                        • Etapas básicas de processamento
                 x   O ambiente do OmniPage
                 x   Gerenciamento de documentos
                 x   Documentos do OmniPage
                 x   Configurações




                                                  OmniPage SE Manual do usuário         21
O que é reconhecimento óptico de caracteres
                  O reconhecimento óptico de caracteres é o processo de extrair texto de uma
                  imagem. Esta imagem pode resultar da digitalização de um documento em papel
                  ou abertura de um arquivo de imagem eletrônica. As imagens não possuem
                  caracteres editáveis de texto; possuem muitos pontos pequenos (pixels) que
                  juntos formam um caractere. Estes apresentam uma figura do texto em uma
                  página.
                  Durante o OCR, o OmniPage SE analisa as formas de caracteres em uma
                  imagem e define soluções para produzir texto editável. Após o OCR, você pode
                  salvar o texto resultante em vários aplicativos de processamento de texto, de
                  editoração eletônica ou planilhas.


                  Recursos de OCR do OmniPage SE
                  Além de reconhecimento de texto, o OmniPage SE pode manter os seguintes
                  elementos de um documento através do processo de OCR.
                  Imagens gráficas
                  Fotos, logos e desenhos são exemplos de imagens gráficas.
                  Formatação de texto
                  Tipos de fonte, tamanhos e estilos (como negrito, itálico e sublinhado) são
                  exemplos de formatação de caracteres. Recuos, tabulações, margens e
                  espaçamento de linha são exemplos de formatação de parágrafos.
                  Formatação de página
                  Estrutura de colunas, formatação de tabela e colocação de imagens gráficas e
                  cabeçalhos são exemplos de formatação de página.
                  Os elementos de formatação de página, texto e imagens gráficas que o
                  OmniPage SE mantém são determinados pelas configurações que você
                  seleciona. Consulte Instruções de configurações na Ajuda on-line para obter mais
                  informações sobre como selecionar as configurações.


                           O OmniPage SE reconhece apenas caracteres gerados por máquina como texto em
                           offset, impresso a laser ou escrito por máquina de escrever. Entretanto, ele pode
                           manter um texto escrito a mão, como uma assinatura, como uma imagem gráfica.




22   Introdução
Capítulo 2


Documentos no OmniPage SE
O OmniPage SE trata os documentos um por vez. Quando você obtém a sua
primeira imagem (do scanner ou do arquivo) um novo documento é iniciado.
Outras imagens obtidas são adicionadas ao mesmo documento, até você salvá-lo
e fechá-lo.
Um documento no OmniPage SE consiste em uma imagem para cada página de
documentos. Depois de realizado o OCR, o documento também conterá texto
reconhecido, exibido no Editor de texto, possivelmente com imagens gráficas e
tabelas. Consulte “O ambiente do OmniPage” na página 24.


Etapas básicas de processamento
Existem duas formas principais de tratamento de documentos: com
processamento automático ou manual. Consulte ”Processamento automático”
na página 40 e ”Processamento manual” na página 42. As etapas básicas dos dois
métodos de processamento são praticamente as mesmas:
1. Colocar um conjunto de imagens no OmniPage SE.
   Você pode digitalizar um documento em papel com ou sem um
   alimentador automático de documentos (ADF) ou carregar arquivos de
   imagens. As imagens resultantes podem aparecer como miniaturas no Painel
   Imagem junto com a imagem da primeira página inserida. As páginas do
   documento estão resumidas no Gerenciador de documentos. Consulte
   “Definição da origem das imagens de página” na página 50.
2. Realizar OCR para gerar texto editável.
   Durante o OCR, o OmniPage Pro cria zonas ao redor de elementos na
   página que serão processadas e interpreta os caracteres de texto ou as
   imagens gráficas em cada zona. O zoneamento manual e de gabaritos
   também é possível. Depois do OCR, você pode verificar e corrigir erros no
   documento usando o Corretor de OCR e editar o documento no Editor de
   texto.
3. Exportar o documento para o local desejado.
   Você pode salvar o documento com um nome e tipo de arquivo
   especificado, colocá-lo na Área de transferência ou enviá-lo como anexo de
   correio eletrônico. Você pode salvá-lo como um documento (OPD) do
   OmniPage como descrito posteriormente. Você pode salvar o mesmo
   documento repetidamente em vários destinos, tipos de arquivo diferentes,
   com níveis de formatação e configuração diferentes. Consulte “Gravação e
   exportação” na página 81.




                           O que é reconhecimento óptico de caracteres     23
O ambiente do OmniPage
                                    O ambiente do OmniPage possui uma barra de títulos e uma barra de menu ao
                                    longo da parte superior e uma barra de status ao longo da parte inferior. Ele tem
                                    três áreas de trabalho principais, separadas por divisores: o Gerenciador de
                                    documentos, o Painel de imagem e o Editor de texto. Cada uma possui botões
                                    de fechar, maximizar e restaurar no canto superior direito. O Painel de imagem
                                    tem uma barra de ferramentas de imagem e o Editor de texto tem uma barra de
                                    ferramentas de formatação.

Barra de
ferramentas
padrão
                                                                                                Barra de ferramentas
Caixa de                                                                                        de formatação
ferramentas do
OmniPage

Miniaturas exibem
uma imagem de cada
página no documento.



A página atual
possui o ícone de um
“olho”.

Esta página foi
reconhecida.


Barra de
ferramentas de
imagem


Botões de
navegação de
página

                                                        Arraste esses divisores    Os botões de visualização
                                                        para redimensionar as      do Editor de texto
                                                        áreas de trabalho.         oferecem três níveis de
Botões para exibir ou ocultar o                                                    formatação.
Gerenciador de documentos, o
Editor de texto e as miniaturas e   Painel de imagem:                              Editor de texto:
a página atual do Painel de         Exibe a imagem da página atual juntamente      Exibe os resultados de
imagem. Isso também pode ser        com suas zonas. O painel de imagem pode        reconhecimento da página atual na
feito no menu Visualizar.           exibir a página atual, miniaturas ou ambos.    visualização True Page.




24      Introdução
Capítulo 2


                    Mostramos o programa com um documento de três páginas. A página um é a
                    página atual, que foi reconhecida e corrigida. A página dois foi reconhecida, mas
                    ainda não foi corrigida. A página três foi obtida e zoneada manualmente, mas
                    ainda não foi reconhecida. Os ícones na parte inferior das imagens em miniatura
                    mostram o status da página.
                    Os botões da barra de status permitem que você mostre ou oculte as áreas da tela
                    principal e vá para outras páginas no documento. Um clique com o botão
                    direito do mouse em uma área qualquer da tela exibe um menu de atalho com os
                    comandos mais úteis da área.


                    A barra de menus
                    Para obter informações concisas sobre qualquer item de menu, clique no botão
                    de ajuda sensível ao contexto e, em seguida, clique no item de menu. Um texto
                    instantâneo explica o propósito do item de menu. Clique em qualquer lugar
                    para fechar o texto instantâneo.


                    As Barras de ferramentas
                    O programa possui três barras de ferramentas principais; todas podem flutuar.
                    Use o menu Visualizar para exibir, ocultar ou personalizar essas barras de
                    ferramentas. A ajuda sensível ao contexto explica a finalidade de todas as
                    ferramentas. Duas outras barras de ferramentas controlam tarefas específicas.

Barra de ferra-                             Outros locais de
                  Local padrão                                     Finalidade
mentas                                      acoplamento

                                            Qualquer extremi-      Executar funções básicas do pro-
                  Horizontal sob a barra
Padrão                                      dade do Ambiente       grama. Consulte página 31 e
                  de Menu
                                            do OmniPage            página 67.

                  Verticalmente à           Verticalmente à di-    Operações de imagem, zoneamento
Imagem            esquerda da atual ima-    reita da atual ima-    e tabela. Consulte página 54 e
                  gem da página             gem da página          página 61.

                  Horizontal na parte
                                                                   Formatação reconheceu texto no
Formatação        superior do Editor de     Nenhum
                                                                   Editor de texto. Veja página 75.
                  texto

                  Passe o cursor sobre a janela do verificador     Controlar a localização e aparência
Verificador
                  para ver esta barra de ferramentas flutuante.    do verificador. Veja página 68.

                  Clique na ferramenta Alterar ordem de leitura.   Modificar a ordem dos elementos em
Reordenar         Esta barra de ferramentas substitui a barra de   páginas reconhecidas. Veja
                  ferramentas Formatação.                          página 75.



                                                                   O ambiente do OmniPage                25
O Painel de imagem
                  Quando é exibida a imagem da página atual, a barra de ferramentas Imagem fica
                  disponível. Todas as imagens de página têm um valor de plano de fundo:
                  processar ou ignorar. Zonas podem ser desenhadas manualmente em imagens de
                  página ou podem ser colocadas automaticamente depois do reconhecimento.
                  Existem cinco tipos de zona: Processar, Ignorar, Texto, Tabela, Imagens gráficas.
                  Áreas dentro de zonas do tipo processar e em um plano de fundo do tipo
                  processar fora de outras zonas têm suas zonas desenhadas automaticamente e
                  seus tipos de zona determinados durante o processamento. Consulte “Zonas e
                  planos de fundo” na página 54. Se a imagem da página atual está oculta,
                  aparecem miniaturas nas linhas para usar o espaço disponível da melhor
                  maneira.




                  O Editor de texto
                  Isso exibe os resultados do reconhecimento em qualquer um dos três níveis de
                  formatação:
                       x Visualização Sem formatação (NF)
                       x Visualização Preservar fontes e parágrafos (RFP)
                       x True Page (TP)
                  True Page mantém o layout da página usando texto, tabela e caixas de imagem e
                  quadros. É possível exibir áreas com várias colunas para mostrar blocos de texto
                  que podem ser tratados como colunas ligadas no momento da exportação. True
                  Page também é um nível de formatação de exportação, juntamente com Página
                  ligada que mantém o layout da página sem caixas ou quadros. Consulte
                  “Exibição e visualizações do editor” na página 66. O OmniPage SE não oferece o
                  recurso de saída de página ligada.


26   Introdução
Capítulo 2


                   A caixa de ferramentas do OmniPage
                   Esta caixa de ferramentas permite controlar o processamento. Por definição, ela
                   está localizada ao longo da parte superior do ambiente do OmniPage,
                   exatamente acima das áreas de trabalho. Ela pode ser movida e fixada ao longo
                   da parte inferior do ambiente.

Botão Iniciar          Botão Obter página        Botão Efetuar OCR         Botão Exportar
                                                                           resultados




  Lista suspensa
                                                         Lista suspensa      Lista suspensa
  Obter páginas
                                                         Descrição do        Resultados da
                                                         layout              exportação

                   O processamento automático é iniciado e pode ser interrompido e reiniciado
                   com o botão Iniciar (1-2-3). Consulte “Processamento automático” na
                   página 40.
                   O processamento manual permite processar documentos página por página e
                   passo a passo. Inicie cada etapa com os três botões grandes: o botão Obter página
                   (1), o botão Executar OCR (2) e o botão Exportar resultados (3). Consulte
                   “Processamento manual” na página 42.
                   Você pode alternar entre o processamento manual e automático a qualquer
                   momento, desde que o programa não esteja ocupado com o processamento. Isto
                   significa que você pode alternar entre eles enquanto está trabalhando em um
                   documento. Você pode processar automaticamente algumas páginas e, em
                   seguida, adicionar mais páginas com processamento manual. Após processar
                   uma pilha de páginas automaticamente, você pode inspecionar os resultados e,
                   em seguida, voltar para processar novamente certas páginas manualmente. Este
                   procedimento é descrito no Capítulo 3. Consulte “Processamento combinado”
                   na página 43.
                   O Assistente de OCR foi projetado para novos usuários. Consulte
                   “Processamento com o Assistente de OCR” na página 45. Se você tiver um
                   documento aberto quando iniciar o Assistente de OCR, o documento será
                   fechado após um aviso para salvá-lo. Quando você usa o Assistente de OCR para
                   processar e salvar um documento, ele continua no programa e pode ser
                   processado novamente (adicionando mais páginas, reconhecendo novamente
                   páginas etc.) com o processamento automático ou manual.


                                                                O ambiente do OmniPage             27
Gerenciamento de documentos
                  O gerenciamento de documentos pode ser feito através de miniaturas no Painel
                  de imagem ou do Gerenciador de documentos, localizado ao longo da parte
                  inferior do Ambiente do OmniPage. As duas visualizações resumem as páginas
                  no documento e são sincronizadas: As nossas figuras mostram as duas
                  visualizações com o mesmo documento de sete páginas. As páginas 1 e 2 são
                  selecionadas e a página 4 é a página atual, isto é, aquela exibida no Painel de
                  imagem. O status da página é exibido da seguinte maneira:

                   Página     Status           Ícone       A imagem da página foi...
                   1          Obtida                       obtida mas ainda não reconhecida.

                                                           reconhecida mas não corrigida, ou a
                   2          Reconhecida
                                                           correção foi interrompida na página.
                              Reconhecida,                 reconhecida e a correção chegou ao fim
                   3
                              Corrigida                    da página.
                                                           reconhecida com pelo menos uma
                   4          Modificada                   mudança de edição ou formatação feita
                                                           no Editor de texto.
                              Modificada,                  reconhecida, editada no Editor de texto
                   5
                              corrigida                    e a correção chegou ao fim da página.
                                                           obtida, talvez reconhecida; algumas
                   6          Pendente                     mudanças de zona estão armazenadas
                                                           mas ainda não foram processadas.
                                                           reconhecida e salva pelo menos uma
                   7          Salva
                                                           vez.


                  Miniaturas
                  Isto apresenta um conjunto de imagens miniaturas numeradas, uma para cada
                  página no documento. Percorra para ver as páginas, conforme necessário. A página
                  atual possui o ícone de um ‘olho’. Você pode selecionar várias páginas no
                  documento; estas possuem uma aparência particular. Use miniaturas para
                  operações com páginas, da seguinte forma:
                  Pular para uma página: Clique na miniatura da página desejada.
                  Reordenar uma página: Clique na miniatura da página que deseja mover e
                  arraste-a para cima do número da página desejada. As páginas são renumeradas
                  automaticamente.
                  Excluir uma página: Selecione a miniatura da página que você deseja excluir e
                  pressione a tecla Delete.



28   Introdução
Capítulo 2


                   Selecionar várias páginas: Mantenha a tecla Shift pressionada e clique em duas
                   miniaturas para selecionar todas as páginas entre elas e incluí-las. Mantenha a
                   tecla Ctrl pressionada conforme você clica nas miniaturas para adicionar páginas
                   a uma seleção, uma a uma. Em seguida, você pode mover ou excluir as páginas
                   selecionadas como um grupo ou enviá-las para (novo) reconhecimento. Você
                   também pode exportar páginas selecionadas.

                            Para obter informações sobre uma imagem de entrada, passe o cursor sobre sua
                            miniatura (desde que o recurso Dicas sobre ferramentas esteja ativado). Um texto
                            instantâneo exibe o tamanho da imagem em pixels e a unidade de medição do
                            programa. A resolução da imagem também é mostrada.


                   Gerenciador de documentos
                   Isso fornece uma visão geral do documento em uma tabela. Cada linha
                   representa uma página. As colunas apresentam informações estatísticas ou de
                   status sobre cada página e (quando for o caso) sobre totais de documento. A
                   figura mostra colunas especificadas por um usuário.



Mova o cursor
sobre o ícone de
status de uma                                                                           Digite aqui
página para ver                                                                         comentários ou
uma miniatura                                                                           palavras-chave
da página.                                                                              que podem ser
                                                                                        pesquisadas.


                   A página atual possui o ícone de um ‘olho’. Você pode usar o Gerenciador de
                   documentos para operações na página, da seguinte forma:
                   Pular para uma página: Clique na parte mais à esquerda da linha da página ou
                   clique duas vezes em qualquer parte de sua linha.
                   Reordenar uma página: Clique na linha da página que deseja mover e arraste-a
                   para o local desejado. Um indicador na esquerda mostra onde a página será
                   inserida. As páginas são renumeradas automaticamente.
                   Excluir uma página: Selecione a linha da página que você deseja excluir e
                   pressione a tecla Delete.
                   Selecionar várias páginas: Mantenha a tecla Shift pressionada e clique em duas
                   linhas de página para selecionar todas as páginas entre elas e incluí-las.
                   Mantenha a tecla Ctrl pressionada conforme você clica nas linhas para adicionar
                   páginas a uma seleção, uma a uma. Em seguida, você pode mover ou excluir as



                                                                Gerenciamento de documentos               29
páginas selecionadas como um grupo ou enviá-las para (novo) reconhecimento.
                  Você também pode exportar páginas selecionadas.
                  Quando várias páginas estiverem sendo selecionadas, a página definida como
                  atual não muda. Todas as páginas selecionadas ficam em destaque.


                  Personalizar colunas do Gerenciador de documentos
                  Você pode especificar quais colunas de informações deseja ver no Gerenciador
                  de documentos. Clique em Personalizar colunas ... no menu Visualizar para a
                  seguinte caixa de diálogo:



                   Esse item está em
                   destaque.

                   Clique em uma caixa
                   de seleção para
                   selecionar o item.                                           Destaque um item
                                                                                e use estas setas
                   Os tamanhos das                                              para alterar a
                   imagens são                                                  ordem das
                   expressos em                                                 colunas.
                   pixels.




                   Defina uma largura
                   para o item
                   destacado.



                  Defina quais colunas devem aparecer, suas larguras e ordem de coluna. O tópico
                  Personalizar colunas do Gerenciador de documentos na Ajuda on-line esclarece o
                  que é apresentado em cada coluna. Você pode alterar as larguras de coluna
                  facilmente no Gerenciador de documentos; basta arrastar os divisores de coluna
                  na barra de título.


                  Exclusão de páginas de um documento
                  As exclusões de página precisam ser confirmadas e podem ser desfeitas. Exclua a
                  página atual somente com o item Excluir página atual no menu Editar. Exclua
                  todas as páginas selecionadas no Gerenciador de documentos ou nas miniaturas
                  pressionando a tecla Delete ou usando o comando Limpar do menu de atalho.



30   Introdução
Capítulo 2


Impressão de um documento
Você pode imprimir o documento com o item Imprimir no menu Arquivo.
Escolha se deseja imprimir imagens ou texto (isto é, os resultados de
reconhecimento conforme aparecem no Editor de texto). Você pode imprimir
todas as páginas ou um intervalo de páginas. A ferramenta Imprimir na barra de
ferramentas Padrão imprime imagens ou texto, dependendo se o Painel de
imagem ou o Editor de texto estiverem ativos.


Fechar um documento
Escolha Fechar no menu Arquivo para fechar um documento. Você é avisado
para salvar o documento se não o tiver salvo ou se o tiver modificado desde a
última gravação. Consulte a próxima seção sobre como salvar o documento
como um documento *.opd do OmniPage. Você também será avisado para
salvar dados de treinamento não salvos se tiver selecionado ‘Perguntar se deseja
salvar dados de treinamento ao fechar o documento’ no painel Correção da caixa
de diálogo Opções. A última frase não se aplica ao OmniPage SE.



Documentos do OmniPage
O documento do OmniPage é o tipo de arquivo patenteado do programa; ele
tem a extensão .opd. Ele é um dos tipos de arquivo oferecidos ao salvar um
documento em um arquivo. Você salva o documento com o tipo de arquivo
OPD se quiser trabalhar com ele novamente no OmniPage em uma sessão
futura. Em seguida, você pode processar as páginas inacabadas, adicionar mais
páginas e corrigir ou editar resultados de reconhecimento.
Um documento do OmniPage contém as imagens originais da página
(desentortadas e pré-processadas) com todas as zonas colocadas nela. Após o
reconhecimento, o OPD também conterá os resultados de reconhecimento. Os
caracteres reconhecidos são armazenados com os dados de confiança e de
coordenadas. Isto preserva os vínculos entre imagem e texto, de forma que a
verificação e a correção continuem disponíveis quando o OPD for reaberto em
sessões futuras.
Quando você salva um documento do OmniPage, as configurações atuais (e o
treinamento não salvo) também são salvos. Quando você abre um documento
do OmniPage, as suas configurações são aplicadas, substituindo as existentes no
programa.




                                            Documentos do OmniPage           31
Um documento OmniPage criado e salvo no OmniPage SE não inclui dados de
                  treinamento. Todos os dados de treinamento contidos em arquivos OPD
                  abertos no OmniPage SE serão ignorados.


                  Por que salvar em OPD
                  Você não tem que salvar os documentos no tipo de arquivo OPD.
                  Normalmente, isto é feito pelas seguintes razões:
                  o   Você não pode terminar de trabalhar com o documento na sessão atual.
                  o   Você quer passar o documento para outros usuários que possuem
                      OmniPage Pro ou OmniPage SE. Por exemplo, você pode passar um
                      arquivo OPD a um especialista para correção. Em uma rede em um
                      escritório, você pode fazer com que um scanner gere imagens para
                      reconhecimento e que sejam corrigidas em várias estações de trabalho.
                  o   Você deseja construir um arquivo de documentos reconhecidos cujas
                      imagens originais continuam acessíveis. Os textos reconhecidos permitem a
                      busca por palavras-chaves e outras técnicas de pesquisa em documentos.


                           Os resultados do reconhecimento devem ser salvos a partir de arquivos OPD antes
                           de instalar uma atualização do OmniPage. Pode ser que estes arquivos não sejam
                           totalmente compatíveis com formatos de arquivos OPD ou que somente as
                           imagens sejam mantidas quando os arquivos forem atualizados. Quando você abre
                           um OPD criado pelo OmniPage Pro 10, apenas as imagens são carregadas.
                           Quando você abre um OPD criado pelo OmniPage Pro 11 ou sua edição especial,
                           são carregadas imagens e páginas reconhecidas mas as zonas não são mantidas.


                  Como salvar como OPD
                  Se você estiver pensando em criar um OPD, pode salvar neste formato em um
                  estágio inicial, por proteção. Use o botão Salvar para salvar periodicamente
                  conforme você trabalha. Salve-o novamente no final da sua sessão.
                  O botão Salvar salva o documento com o nome e tipo de arquivo de sua última
                  gravação. Você pode salvar o documento repetidamente em formatos diferentes.
                  Se a sua primeira gravação for com outro formato (por exemplo .doc), use o item
                  Salvar como... do menu Arquivo para salvá-lo como um OPD. Se um
                  documento é salvo como OPD e você posteriormente o salva com outro
                  formato, ele não é salvo novamente automaticamente como OPD. Quando você
                  fechar um documento ou sair do programa, será avisado para salvar o
                  documento como OPD.
                  A barra de título exibe o nome de arquivo do mais recente documento completo
                  salvo.


32   Introdução
Capítulo 2



Configurações
A caixa de diálogo Opções é o local central para as configurações do OmniPage
SE. Acesse essa caixa de diálogo a partir da bar de ferramentas Padrão ou do
menu Ferramentas. A ajuda sensível ao contexto fornece informações sobre cada
configuração. Na visão geral, os painéis de configuração são:
OCR
Use isto para especificar os idiomas de reconhecimento, um dicionário de
usuário ou profissional, um caracter rejeitado e uma correspondência de fonte.
Clique na caixa de verificação ao lado do idioma para selecioná-lo ou cancelar a
seleção. É possível fazer várias seleções; selecione apenas os idiomas que
aparecem no documento a ser reconhecido. Os itens na parte superior são os
idiomas selecionados recentemente. Digite as primeiras letras de um idioma para
acessá-lo.O OmniPage SE não oferece suporte para dicionários profissionais.
Scanner
Use isto para definir o tamanho da página e orientação para digitalização. Você
também pode fazer configurações de brilho e contraste e definir opções para
digitalizar documentos de várias páginas, com ou sem um alimentador
automático de documentos (ADF). Você pode alterar as definições de
configuração do scanner ou instalar um novo scanner ou alterar o scanner
padrão. Consulte “Entrada do scanner” na página 51. Este painel não estará
disponível se você solicitou a exibição da interface TWAIN nativa de seu scanner
durante sua configuração. Consulte “Configuração do scanner com OmniPage
SE” na página 14.
Direct OCR
Este recurso fornece serviços de OCR diretamente de seu processador de texto
favorito ou aplicativo semelhante. Use este painel para registrar e eliminar o
registro de aplicativos para o Direct OCR e ativar ou desativar este serviço. Você
também pode especificar zoneamento automático ou manual e se a correção
ortográfica é desejada ou não. Consulte “Como configurar o Direct OCR” na
página 46.
Processamento
Use isto para definir o local onde novas imagens devem ser colocadas no
documento, para configurar que sejam solicitadas mais páginas durante a
digitalização, para especificar digitalização de página dupla quando se tratar de
livros e outras configurações. Você pode alterar o idioma da interface aqui. O
OmniPage SE não oferece suporte para a digitalização de 2 páginas.




                                                           Configurações        33
Correção
                  Use isto para definir se a correção deve começar automaticamente após o
                  reconhecimento. Defina também se o IntelliTrain deve ser executado e use-o
                  para carregar ou trabalhar com um arquivo de treinamento. Consulte “Correção
                  de resultados de OCR” na página 67. As referências a treinamento não se
                  aplicam ao OmniPage SE.
                  Layout personalizado
                  Use isto para descrever o layout das páginas do documento de entrada com
                  bastante precisão. Isto dá o controle máximo sobre o processo de zoneamento
                  automático, instruindo-o a procurar ou ignorar colunas, imagens gráficas e
                  tabelas. Consulte “Descrição do layout de documento” na página 53.
                  Editor de texto
                  Use isto para mostrar ou ocultar alguns recursos no Editor de texto, para definir
                  a unidade de medida a ser usada e para ativar ou desativar a mudança de linha.
                  Consulte “Edição de texto e de imagem” na página 75.


                  No OmniPage Pro 12, se você tiver acesso a um Sistema de Gerenciamento de
                  Documentos (DMS) em seu computador e sua edição do OmniPage Pro 12
                  incluir suporte a ODMA, um painel ODMA também pode aparecer. Consulte
                  “Suporte a ODMA” na página 97.




                           Algumas configurações só afetam os reconhecimentos futuros. Alguns exemplos são
                           os idiomas do reconhecimento, um arquivo de treinamento ou o nível de brilho do
                           scanner. Estas configurações devem ser ajustadas corretamente antes de você iniciar
                           o processamento. Para que todas as alterações nestas configurações sejam aplicadas
                           nas páginas já reconhecidas, você terá que reconhecê-las novamente. As outras
                           configurações são implementadas imediatamente em todas as páginas existentes.
                           Alguns exemplos são as configurações de Editor de texto como mudança de linha e
                           unidades de medida.




34   Introdução
Capítulo 3

             Processamento de
             documentos
             Este tutorial descreve diferentes maneiras de processar um documento e também
             fornece informações sobre partes fundamentais deste processamento.
                 x   Guia de início rápido
                 x   Visão geral do processamento
                 x   Processamento automático
                 x   Processamento manual
                 x   Processamento combinado
                 x   Processamento com o Assistente de OCR
                 x   Processamento a partir de outros aplicativos (Direct OCR, PaperPort)
                 x   Processamento de documentos com Programar OCR
             Os tópicos detalhados são:
                 x Definição da origem das imagens de página
                 x Descrição do layout de documento
                 x Zonas e planos de fundo
                        • Zoneamento automático
                        • Zoneamento manual
                        • Tipos de zona e propriedades
                        • Trabalho com zonas
                 x Grades de tabela na imagem
                 x Uso de gabaritos de zonas




                                                OmniPage SE Manual do usuário          35
Guia de início rápido
                          Este tópico o conduz passo a passo pelo processo básico de OCR.




                          Carregamento e reconhecimento de amostras de arquivos de
                          imagem
                          Você encontrará amostras de arquivos de imagem na pasta de programas, que
                          contém arquivos de uma e de várias páginas. Tente ler estes arquivos
                          inicialmente usando o procedimento apresentado abaixo, exceto no que se refere
                          a um scanner. Consulte “Entrada de arquivos de imagem” na página 50. Os
                          resultados fornecem uma avaliação da qualidade do reconhecimento que você
                          deve esperar de seus próprios arquivos com qualidade comparável.
                          Em seguida, experimente digitalizar uma página do scanner.




                          Digitalização e reconhecimento de uma única página
                          Ligue o scanner e certifique-se de que ele está trabalhando corretamente. Escolha
                          uma página com texto claro de boa qualidade para este teste.
                          Partimos do pressuposto de que as configurações padrão do OmniPage SE estão
                          definidas e que o documento está no idioma que você especificou como o
                          idioma de interface durante a instalação. Abra a caixa de diálogo Opções no
                          menu Ferramentas e escolha Usar padrões se você não estiver usando o programa
                          pela primeira vez.
                          Você processará o documento automaticamente e salvará os resultados de
                          reconhecimento em um arquivo. Você corrigirá o documento, mas não o editará
                          dentro do Editor de texto.




36   Processamento de documentos
Capítulo 3



      O que você faz                                     O que acontece
1.    Configure o scanner usando o Assistente de         Configura o OmniPage SE para trabalhar com o scan-
      scanner, se isto ainda não tiver sido feito.       ner.
                                   
                        
2.    Selecione Iniciar Programas ScanSoft
                                                         Abre o OmniPage SE no computador.
      OmniPage SE 2.0     OmniPage SE 2.0
3.    Coloque o documento corretamente no scanner.
4.    Na lista suspensa Obter página, selecione uma      Permite que você determine como as imagens ou tex-
      opção de digitalização para o documento: preto     tos coloridos e fundos aparecerão no documento
      e branco, tons de cinza ou em cores.               exportado. É necessário um scanner colorido para
                                                         realizar digitalização em cores.
5.    Na lista suspensa Descrição do Layout, verifique
      se Automático está selecionado. Para uma           Configura o programa para colocar as zonas na
      ampla gama de documentos, esta é a melhor          página e decidir suas propriedades automaticamente.
      opção.
6.    Na lista suspensa Exportar resultados, verifique   Isto significa que você poderá nomear o arquivo
      se Salvar como arquivo está selecionado.           exportado após ter corrigido o documento.
7.    Clique no botão Iniciar.                           O OmniPage SE começará a digitalizar o documento.
                                                         Surge uma miniatura com um indicador de progresso.
                                                         Surge o Corretor de OCR.
8.    Use o Corretor de OCR para modificar as pala-      O Corretor de OCR funciona como um corretor
      vras que o programa suspeita não terem sido        ortográfico em um programa de processamento de
      reconhecidas corretamente.                         texto, mas com recursos adicionais específicos de
                                                         OCR. Ele remove as marcações de palavras que
                                                         foram corrigidas.
9.    Clique no Editor de texto. Selecione as visualiza-
                                                         Cada visualização de Editor de texto define um nível
      ções do Editor de texto uma após a outra, para
                                                         de formatação. Isto indica qual nível escolher no
      ver como a página aparece em cada visualiza-
                                                         momento de salvar.
      ção.
10.   Clique em Continuar para reiniciar a correção.
                                                     Isto termina o processo de correção de OCR. A caixa
      Quando a mensagem A correção de OCR termi-
                                                     de diálogo Salvar como aparecerá.
      nou aparece, clique em OK.
11.   Escolha um nome de arquivo, tipo de arquivo,       Por definição, Salvar e iniciar é ativado, de forma que
      caminho e nível de formatação para salvar seu      o seu documento será aberto automaticamente no
      documento reconhecido. Clique em OK.               programa de processamento de texto associado ao
                                                         tipo de arquivo selecionado.
12.   Inspecione o documento no programa de pro-         Você usou com êxito o OmniPage SE para recon-
      cessamento de texto.                               hecer o documento e abri-lo no aplicativo de destino!


                          Se você teve êxito em obter bons resultados com as amostras de arquivos de
                          imagem, mas não com a página digitalizada, verifique a instalação e as
                          configurações do scanner: especialmente o brilho e a resolução da imagem.
                          Consulte “Entrada do scanner” na página 51. Isso fornece um modelo de brilho


                                                                               Guia de início rápido          37
ótimo. Consulte também os tópicos de ajuda on-line Configuração do scanner e
                               Solução de problemas do scanner.



                               Visão geral do processamento
                               O seguinte diagrama de fluxo resume as etapas do processamento:

                                        Zoneamento                                         Exportar páginas
     Obter páginas     Descrever                          Realizar
                       layout da        automático
                                                           OCR                               para o arquivo
      do arquivo         página          página 55                         Verificar e
                                                                                               página 83
      página 50        página 53                                             editar
                                        Zoneamento         com as          página 68         para a Área de
                                          manual        configurações                         transferência
      do scanner      Aplicar um                                            Corrigir            página 88
                                         página 56          atuais
      página 51        gabarito                                            página 67
                                                          página 33                            via Correio
                      página 63
                                                                                                página 89


                               Aqui está uma visão geral dos métodos de processamento que você pode usar.
                               Você encontrará instruções passo a passo para cada um deles nas páginas
                               seguintes.
                               Automático
                               A forma mais rápida e fácil de processar documentos é deixar o OmniPage SE
                               fazer isso automaticamente. Selecione as configurações na caixa de diálogo
                               Opções e nas listas suspensas Caixa de ferramentas do OmniPage e clique em
                               Iniciar. Cada página será processada do início ao fim, quando possível
                               funcionando em paralelo. Normalmente, será feito o zoneamento automático
                               nas páginas.
                               Manual
                               O processamento manual lhe dá controle mais preciso sobre a forma com que as
                               suas páginas são tratadas. Você pode processar o documento página a página
                               com configurações diferentes para cada página. O programa também pára entre
                               cada etapa: obtenção de imagens, realização de reconhecimento, exportação. Isto
                               lhe permite, por exemplo, delimitar zonas manualmente ou alterar os idiomas de
                               reconhecimento. Você pode iniciar cada etapa clicando nos três botões na Caixa
                               de ferramentas do OmniPage.
                               Combinado
                               Você pode processar um documento automaticamente e visualizar os resultados
                               no Editor de texto. Se a maior parte das páginas estiverem em ordem, mas
                               algumas não tiverem saído como esperado, você pode alternar para
                               processamento manual para ajustar as configurações e reconhecer novamente


38        Processamento de documentos
Capítulo 3


somente as páginas com problema. Outra alternativa é obter imagens com
processamento manual, desenhar zonas em algumas ou todas elas e então enviar
todas as páginas para o processamento automático.
Uso do Assistente de OCR
O Assistente de OCR o conduz durante a seleção de configurações e comandos
fazendo perguntas. Em seguida, ele aciona o processamento automático. Esta é
uma boa forma de se familiarizar se o OmniPage SE for uma novidade.




Em outros aplicativos
Você pode usar o recurso Direct OCR para chamar os serviços de
reconhecimento do OmniPage SE enquanto trabalha em seu processador de
texto normal ou aplicativo semelhante. O OmniPage SE se associa
automaticamente ao PaperPort da ScanSoft e aos programas de gerenciamento
de documentos Pagis.
Mais tarde
Você pode programar para que trabalhos de OCR sejam realizados
automaticamente mais tarde, mesmo quando não estiver diante de seu
computador. O Assistente de Nova tarefa do Programar OCR permite que você
especifique configurações e a hora de início. O OmniPage SE não oferece
suporte para o recurso Programar OCR.



                                        Visão geral do processamento      39
Processamento automático
                            O processamento automático fornece uma forma eficaz de tratamento de
                            documentos, especialmente os maiores. Primeiro, selecione todas as
                            configurações necessárias e, em seguida, pode usar o botão Iniciar na Caixa de
                            ferramentas do OmniPage para processar um novo documento do início ao fim
                            ou reiniciar e terminar o processamento de um documento aberto.

 Botão Iniciar                Botão Obter página       Botão Efetuar OCR        Botão Exportar resultados




                          Lista suspensa Obter                                                Lista
                          página                                                              suspensa
                                                                                              Resultados
                                                                                              da
                                                                                              exportação

                          Lista suspensa
                          Descrição do layout




                            1. Selecione a configuração Obter página desejada na lista suspensa. Você
                               define a origem de documentos, que pode ser de arquivos de imagem ou de
                               um scanner. Consulte “Definição da origem das imagens de página” na
                               página 50.

                            2. Selecione uma configuração na lista suspensa Descrição do Layout,
                               conforme exibido acima. Isto guia o programa no zoneamento automático
                               das páginas. Você descreve as páginas de entrada ou especifica um arquivo
                               de gabarito de zonas. Consulte “Descrição do layout de documento” na
                               página 53.

                            3. Selecione uma configuração da lista suspensa Exportar resultados. Você
                               pode salvar o documento como um arquivo de Documento do OmniPage.
                               Você pode salvar páginas (atual, selecionadas, todas) em um arquivo, copiá-
                               las para a Área de transferência ou enviá-las como anexos de e-mail.
                               Consulte “Gravação e exportação” na página 81.



40     Processamento de documentos
Capítulo 3




4. Escolha        na barra de ferramentas Padrão ou Opções no menu
   Ferramentas e verifique se as configurações são apropriadas para o
   documento. Você pode, por exemplo, especificar idiomas de
   reconhecimento e se deseja corrigir o documento ou não. Consulte
   “Configurações” na página 33.

5. Clique no botão Iniciar ou escolha Iniciar processamento automático no
   menu Processar. Cada página no documento é processada e terminada uma
   após a outra. O programa pode realizar tarefas simultaneamente, por
   exemplo, pode iniciar a carregar e a reconhecer uma nova página conforme
   você corrige a página anterior.


Interromper e reiniciar o processamento automático
Interromper: Quando o processamento automático estiver em andamento, o
botão Iniciar transforma-se em Interromper. Clique nele para interromper o
processamento automático. Você pode fazer isto se achar que algumas
configurações precisam ser alteradas.
Reiniciar: Quando o processamento automático for interrompido, o botão
Iniciar é restaurado. Clique nele para reiniciar o processamento. A caixa de
diálogo Processamento automático permite que você especifique o que deseja
fazer:
     x Concluir o processamento de páginas não reconhecidas e não
          corrigidas e em seguida exportar os resultados.
     x Exportar novamente um documento já salvo, talvez com
          alterações, para um tipo diferente de arquivo, nome ou local ou
          com nível de formatação diferente.
     x Acrescentar mais páginas da mesma origem ou uma origem
          diferente, com configurações alteradas ou não.
     x Processar novamente todas as páginas para descartar todos os
          resultados de reconhecimento e reconhecer novamente todas as
          páginas no documento com configurações diferentes. Você pode
          especificar zoneamento automático ou um arquivo de gabarito.
          Isso pode ser útil caso uma configuração indesejada tenha causado
          resultados ruins em todas as páginas. Um exemplo é uma escolha
          de idioma incorreto, o que resulta em quase todas as palavras
          marcadas como suspeitas durante a correção. Esta opção permite
          que você realize novo reconhecimento sem ter que digitalizar,
          carregar ou refazer as zonas de todas as imagens novamente.




                                            Processamento automático           41
Processamento manual
                          O processamento manual lhe dá controle mais preciso sobre a forma com que as
                          suas páginas são tratadas. Você pode processar o documento página a página
                          com configurações diferentes para cada página. O programa também pára entre
                          cada etapa: obtenção de imagens, realização de reconhecimento, exportação. Isto
                          permite, por exemplo, alterar o fundo da página e delimitar zonas manualmente
                          em cada página. Você pode iniciar cada etapa do processo clicando nos três
                          botões numerados na Caixa de ferramentas do OmniPage.


                          1. Clique em        na barra de ferramentas Padrão ou em Opções no menu
                             Ferramentas para verificar ou fazer configurações na caixa de diálogo
                             Opções. Consulte “Configurações” na página 33.

                          2. Selecione o valor desejado para o botão Obter página na lista suspensa. Você
                             define a origem de documentos, que pode ser de arquivos de imagem ou de
                             um scanner. Ao digitalizar, selecione um modo de digitalização e use os
                             painéis Scanner e Processo da caixa de diálogo Opções para selecionar as
                             configurações. Consulte “Definição da origem das imagens de página” na
                             página 50.

                          3. Clique no botão Obter página. Isto faz aparecer a caixa de diálogo Carregar
                             arquivo de imagem permitindo que você nomeie arquivos de imagem ou
                             inicie a digitalização. Imagens em miniatura de cada página podem aparecer
                             no Painel de imagem, juntamente com a imagem da página atual. Use os
                             botões da barra de status para exibir ou ocultar qualquer uma delas. As
                             páginas obtidas estão resumidas no Gerenciador de documentos.

                          4. As imagens de todas as páginas entram no programa com plano de fundo
                             configurado para processar. Desde que você não desenhe zona alguma nestas
                             páginas, elas serão zoneadas automaticamente quando for solicitado o
                             reconhecimento.

                          5. Você pode delimitar e modificar zonas manualmente em uma ou mais
                             imagens e atribuir propriedades de zona. Os botões da barra de status
                             permitem que você vá para outras páginas. Assim que você desenha uma zona
                             em uma página, ela assume um plano de fundo do tipo ignorar. Você pode
                             especificar zoneamento automático em partes de uma página ao desenhar
                             zonas do tipo processar. Consulte “Zonas e planos de fundo” na página 54.




42   Processamento de documentos
Capítulo 3


6. Selecione o valor para o botão Efetuar OCR. Você descreve o layout das
   páginas de entrada. Este valor exerce influência se o zoneamento automático
   for executado em todas as páginas. Consulte “Descrição do layout de
   documento” na página 53. Você também pode selecionar um gabarito para
   ter suas zonas colocadas na página atual. Consulte “Uso de gabaritos de
   zonas” na página 63.

7. Clique no botão Efetuar OCR para que a página atual seja reconhecida.
   Para reconhecer as páginas selecionadas, faça várias seleções com miniaturas
   no Gerenciador de documentos (Consulte “Gerenciamento de documentos”
   na página 28.) e, em seguida, clique no botão Efetuar OCR. Páginas
   reconhecidas aparecem no Editor de texto.

8. Se você tiver solicitado correção, a caixa de diálogo Corretor de OCR exibe
   as palavras suspeitas das páginas reconhecidas, uma após a outra. Você pode
   corrigir e editar o texto reconhecido. Consulte “Correção de resultados de
   OCR” na página 67.

9. Continue a carregar páginas, realizar OCR, editar, corrigir e verificar
   conforme desejado. Você pode alterar a ordem de leitura dos elementos da
   página no Editor de texto. Consulte “Edição de texto e de imagem” na
   página 75.

10. Selecione um valor para o botão Exportar resultados. Você pode salvar o
    documento como um arquivo de Documento do OmniPage. Você pode
    salvar páginas (atual, selecionadas ou todas) em um arquivo, copiá-las para a
    Área de transferência ou enviá-las como anexos de e-mail. Clique no botão
    Exportar resultados. Consulte “Gravação e exportação” na página 81.



Processamento combinado
Processamento automático oferece velocidade e eficiência. Processamento
manual exige mais atenção mas proporciona um maior controle sobre os
resultados. É possível aproveitar ambas as vantagens ao processar um único
documento.

Iniciar automaticamente e terminar manualmente:
Quando há um documento grande com somente algumas páginas precisando de
atenção especial, você não tem que processar manualmente todo o documento.
Você pode processá-lo automaticamente e visualizar os resultados no Editor de
texto. Você pode determinar quais páginas estão em ordem e quais precisam de
configurações diferentes ou algum zoneamento manual. Depois de ajustar as


                                              Processamento combinado          43
configurações e/ou modificar as zonas, use o processamento manual para
                          reconhecer novamente apenas aquelas páginas.
                          1. Prepare o documento e realize processamento automático, como já descrito.
                          2. Se você fechar ou terminar de corrigir, será convidado a salvar o documento.
                             Isto é recomendado mesmo se o documento não estiver em sua forma final.
                          3. Selecione uma página que esteja precisando de um novo zoneamento ou
                             modifique as zonas existentes no Painel de imagem. Você também pode
                             carregar um gabarito para fazer com que suas zonas substituam as existentes.
                             Delimite novas zonas, conforme desejado. Consulte “Zonas e planos de
                             fundo” na página 54.
                          4. Altere as outras configurações conforme necessário para a página atual.
                             Consulte “Configurações” na página 33.
                          5. Clique no botão Efetuar OCR para reconhecer novamente a página atual.
                             Confirme que os resultados de reconhecimento anterior devem ser
                             sobrescritos. Outra alternativa é usar o processamento em tempo real para
                             tratar de mudanças de zoneamento sem precisar reconhecer novamente toda
                             a página. Consulte “Edição em tempo real” na página 77.
                          6. Para reconhecer novamente mais de uma página, selecione as páginas
                             necessárias nas miniaturas ou no Gerenciador de documentos antes de clicar
                             no botão Efetuar OCR.
                          7. Quando todas as páginas tiverem sido reconhecidas novamente com
                             resultados aceitáveis, salve o documento novamente.

                          Iniciar e manualmente terminar automaticamente:
                          1. Prepare as configurações e obtenha imagens para o documento clicando no
                             botão Obter página.
                          2. Examine as páginas para ver se o brilho, orientação e conteúdo são
                             adequados. Digitalize novamente ou gire imagens inadequadas. Reorganize
                             as páginas conforme desejar.
                          3. Crie zonas manualmente para as páginas nas quais deseja processar apenas
                             parte da imagem ou se desejar fornecer instruções de zoneamento precisas.
                             Use planos de fundo ou zonas do tipo ignorar para excluir áreas do
                             processamento. Use planos de fundo ou zonas do tipo processar para
                             especificar áreas a serem zoneadas automaticamente.
                          4. Clique no botão Iniciar e então escolha Concluir processamento de páginas
                             existentes na caixa de diálogo Processamento automático.
                          5. Depois de corrigir (caso solicitado), você pode salvar ou exportar o
                             documento.


44   Processamento de documentos
Capítulo 3



Processamento com o Assistente de OCR
O Assistente de OCR pode ser usado para iniciar o processamento de um novo
documento. Se você selecioná-lo com um documento aberto, ele será fechado. O
Assistente o conduz através de seis painéis de configuração, guiando-o para fazer
as configurações em seu documento e, em seguida, iniciando o processamento
automático. A ajuda sensível ao contexto está disponível para todos os painéis do
Assistente. Clique no botão Assistente de OCR na Caixa de ferramentas do
OmniPage para visualizar a primeira tela do assistente:

1. O primeiro painel permite que você defina a origem de documentos:
   scanner ou arquivo de imagem. Consulte “Definição da origem das imagens
   de página” na página 50. Responda à pergunta na primeira tela e, em
   seguida, clique em Avançar.

2. O segundo painel lhe pede para descrever o layout do documento de
   entrada, para auxiliar o zoneamento automático. Consulte “Descrição do
   layout de documento” na página 53.

3. O terceiro painel permite que você defina os idiomas de reconhecimento.
   Os idiomas com suporte de dicionário possuem o ícone de um livro aberto.
   As escolhas mais recentes encontram-se no topo da lista.

4. O quarto painel lhe pergunta se você deseja corrigir o texto antes de
   exportá-lo. Se você escolher Sim, também pode editar o texto antes de salvá-
   lo. Você também decide se cria e usa os dados do IntelliTrain durante a
   correção. Consulte “IntelliTrain” na página 72. As referências a IntelliTrain
   não se aplicam ao OmniPage SE.

5. O último painel lhe pede para definir a escolha de exportação: salvar em
   arquivo ou copiar para Área de transferência. Após configurar sua escolha,
   clique em Concluir para fechar o Assistente e iniciar o processamento
   automático.

6. Se você tiver requisitado correção e o texto contiver palavras suspeitas, a
   caixa de diálogo Corretor de OCR aparecerá. Quando a correção estiver
   concluída ou fechada, a caixa de diálogo Copiar para área de transferência
   ou Copiar como permite que você especifique as configurações de
   exportação de arquivo, incluindo o intervalo de páginas e o nível de
   formatação.

7. O documento continua no OmniPage SE. Você pode editar os resultados
   de reconhecimento e salvá-los novamente com outros formatos. Você pode
   alterar manualmente as zonas ou alterar outras configurações e, em seguida,


                                Processamento com o Assistente de OCR         45
usar processamento manual para reconhecer novamente páginas únicas do
                              documento. Você pode adicionar páginas com ou sem processamento
                              manual.


                                    Os painéis do Assistente apresentam configurações na forma como foram definidas
                                   pela última vez no programa. Além disso, o OmniPage SE lembrará das
                                   configurações que você fizer nos painéis do Assistente de OCR e as aplicará em um
                                   processamento automático ou manual futuro, até que você as altere. Portanto, se
                                   você tiver mais documentos para os quais suas configurações do Assistente de OCR
                                   forem adequadas, basta clicar em Iniciar na Caixa de ferramentas do OmniPage.
                                   As configurações aplicáveis não oferecidas pelo Assistente de OCR utilizam os
                                   últimos valores definidos no programa. Isto diz respeito principalmente a
                                   configurações do scanner, a um dicionário de usuário ou a um arquivo de
                                   treinamento. Os gabaritos de zonas não podem ser usados com o Assistente de
                                   OCR. Se um arquivo de gabaritos foi definido, quando o Assistente de OCR
                                   começar, ele será descarregado e Automático será definido como descrição de
                                   entrada. Você não pode exportar um documento reconhecido como um anexo de
                                   correio. Use o processamento automático ou manual para isso.




                          Processamento a partir de outros aplicativos
                          Você pode usar o recurso Direct OCRTM para chamar os serviços de
                          reconhecimento do OmniPage SE enquanto trabalha em seu processador de
                          texto normal ou em outro aplicativo. Primeiramente, você precisa estabelecer a
                          conexão direta com o aplicativo. Em seguida, dois itens em seu menu Arquivo
                          abrem a porta para os recursos de OCR.

                          Como configurar o Direct OCR
                          1. Inicie o aplicativo que você deseja conectar ao OmniPage SE. Inicie o
                             OmniPage SE, abra a caixa de diálogo Opções no painel Direct OCR e
                             selecione Ativar o Direct OCR.

                          2. Selecione as opções de processamento para correção e zoneamento. Estas
                             funcionarão para futuros trabalhos do Direct OCR até serem modificadas
                             novamente; elas não são aplicadas quando o OmniPage SE for usado
                             sozinho.




46   Processamento de documentos
Capítulo 3


3. O painel Não registrados exibe os aplicativos registrados anteriormente ou
   em execução. Selecione nos desejados e clique em Adicionar. Você pode
   procurar por um aplicativo não listado.

Como usar o Direct OCR
1. Abra o aplicativo registrado e trabalhe em um documento. Para obter
   resultados de reconhecimento de páginas digitalizadas, coloque-as
   corretamente no scanner.
2. Use o item Definições para obter texto... do menu Arquivo do aplicativo de
   destino para especificar as configurações a serem usadas durante o
   reconhecimento. Todas as configurações não oferecidas obtêm seus valores
   com base nos últimos valores usados no OmniPage SE. As configurações
   alteradas para o Direct OCR também são alteradas no OmniPage SE.
3. Use o item Obter texto do menu Arquivo para obter imagens do scanner ou
   do arquivo.
4. Se você tiver selecionado Delimitar zonas automaticamente no painel Direct
   OCR da caixa de diálogo Opções ou sob Definições para obter texto..., o
   reconhecimento começa imediatamente.
5. Se Delimitar zonas automaticamente não estiver selecionado, cada imagem
   da página será apresentada, permitindo que você delimite as zonas
   manualmente. Clique no botão Efetuar OCR para continuar com o
   reconhecimento.

6. Se a correção tiver sido especificada, ela será feita após o reconhecimento.
   Em seguida, o texto reconhecido é colocado na posição do cursor em seu
   aplicativo, com o nível de formatação especificado por Definições para
   obter texto... .

         Se o OmniPage SE estiver sendo executado quando o Direct OCR for chamado de
         um aplicativo de destino, uma segunda instância de OmniPage SE é acionada.
         Consulte os tópicos sobre o Direct OCR na Ajuda on-line para obter mais
         informações. Eles incluem um tópico Perguntas e respostas sobre o Direct OCR. O
         arquivo Leiame e o site da ScanSoft podem trazer informações mais recentes
         relacionadas a aplicativos de destino específicos.




                              Processamento a partir de outros aplicativos            47
Como usar o OmniPage SE com o PaperPort
                          O PaperPort® é um software de gerenciamento de papéis da ScanSoft. Ele
                          permite que você associe páginas a aplicativos adequados. As páginas podem
                          conter figuras, texto ou ambos. Se o PaperPort existir em um computador
                          com o OmniPage SE, os seus serviços de OCR ficam disponíveis e
                          amplificam o poder do PaperPort. Você pode escolher um programa de
                          OCR clicando com o botão direito em um vínculo de aplicativos de texto
                          do PaperPort, selecionando Preferências e, em seguida, selecionando
                          OmniPage SE 2.0 como o pacote de OCR. As configurações de OCR
                          podem ser especificadas, assim como ocorre no Direct OCR.
:




                          Aqui, o OmniPage SE foi selecionado como o pacote de OCR para MS
                          Word 2000. Você pode arrastar imagens de página da área de trabalho do
                          PaperPort para o vínculo do MS Word no PaperPort. Enquanto o texto
                          estiver sendo reconhecido, somente um monitor de progresso será exibido.
                          A janela de zoneamento manual ou o recurso de correção do OmniPage SE
                          aparecerá se solicitado. Os resultados de reconhecimento são colocados em
                          um novo documento não nomeado no aplicativo de destino.




48   Processamento de documentos
Capítulo 3



Processamento de documentos com Programar
OCR
O OmniPage SE não oferece suporte para o recurso Programar OCR. O texto a
seguir aplica-se somente ao OmniPage Pro.
Você pode programar os trabalhos de OCR para que sejam realizados
automaticamente a qualquer momento dentro dos próximos oito dias. Cada tarefa
trata um documento. As páginas do documento podem vir de um scanner com
ADF ou de arquivos de imagem. Você não tem que estar presente diante de seu
computador no momento da tarefa nem o OmniPage SE tem que estar sendo
executado. Não importa se o computador é desligado após a tarefa ser configurada,
contanto que ele esteja funcionando na hora do início da tarefa. Se você estiver
digitalizando páginas, o scanner precisa estar funcionando na hora do início da
tarefa, com as páginas carregadas no ADF. Veja como configurar um trabalho:
1. Clique em Programar OCR no menu Processar ou no menu Iniciar do
                                      
   Windows: selecione Programas ScanSoft OmniPage Pro 12.0 Programar       
   OCR.
2. A caixa de diálogo Programar OCR aparece. Clique em Novo... para iniciar
   o Assistente de nova tarefa. Ele o conduz por seis painéis, semelhantes aos
   do Assistente de OCR.
3. No primeiro painel, você define a origem da imagem: scanner com ADF ou
   arquivo.
4. Os próximos dois painéis são semelhantes aos do Assistente de OCR, mas
   você também pode especificar um dicionário de usuário ou profissional e
   um arquivo de treinamento. Se o IntelliTrain é executado ou não, depende
   da configuração do OmniPage Pro na hora da tarefa.
5. Os seguintes painéis permitem que você especifique o nome, o tipo, o local
   do arquivo de exportação, uma opção de separação de arquivo e um nível de
   formatação.
6. Os dois últimos painéis permitem definir a hora de início e (quando
   aplicável) fim da tarefa e manter ou excluir arquivos de entrada depois do
   processamento. Clique em Concluir para fechar o Assistente.

         A caixa de diálogo Programar OCR lista todas as tarefas, com status Esperando,
         Em execução, Erro ou Concluído. Use Modificar tarefa... para alterar as
         configurações para uma tarefa em espera. Você pode visualizar, modificar e
         reutilizar as tarefas concluídas para processar novas tarefas que precisem de
         configurações semelhantes. Você pode excluir as tarefas concluídas quando não
         forem mais necessárias.



                    Processamento de documentos com Programar OCR                         49
Definição da origem das imagens de página
                             Há duas origens de imagens possíveis: de arquivos de imagem e de um scanner.
                             Existem dois tipos principais de scanners: plano ou de alimentação de folhas.
                             Um scanner pode ter um alimentador de documentos automático (ADF)
                             incorporado, o que torna mais fácil digitalizar documentos de várias páginas. As
                             imagens de documentos digitalizados podem ser inseridas diretamente no
                             OmniPage SE ou podem ser salvas com o próprio software do scanner em um
                             arquivo de imagem, que o OmniPage SE pode abrir posteriormente.


                             Entrada de arquivos de imagem
                             Você pode criar arquivos de imagem a partir de seu próprio scanner ou recebê-
                             los via e-mail ou fax. O OmniPage SE pode abrir uma ampla gama de tipos de
                             arquivos de imagem. Consulte “Tipos de arquivo para abrir e salvar imagens” na
                             página 98. Selecione Carregar arquivo de imagem na lista suspensa Obter página.
                             Os arquivos são especificados na caixa de diálogo Carregar arquivo de imagem.
                             Isto aparece quando você inicia o processamento automático. No processamento
                             manual, clique no botão Obter página ou use o menu Processar. A parte inferior
                             da caixa de diálogo fornece configurações avançadas e pode ser exibida ou ficar
                             oculta. Aqui, ela é exibida.
                                                                                             Selecione essa
Esta é a pasta atual.                                                                        opção para ver
                                                                                             uma miniatura do
Use Shift+ cliques ou                                                                        arquivo
Ctrl+cliques para                                                                            selecionado. Não
colocar mais de um                                                                           disponível quando
arquivo na caixa de                                                                          são selecionados
texto do Nome de                                                                             vários arquivos.
arquivo.


Especifique os tipos de
arquivo que você                                                                        Clique em Avançado
deseja listados.                                                                        para abrir o painel
                                                                                        inferior e Básico para
                                                                                        fechá-lo.
Isto pode ser usado                                                                     Use isto para adicionar
para arquivos DCX,                                                                      arquivos de pastas
MAX e TIFF de várias                                                                    diferentes e para
páginas.                                                                                controlar precisamente
                                                                                        a ordem dos arquivos.


                                                          Use estas setas para alterar a ordem dos arquivos.




50      Processamento de documentos
Capítulo 3


Normalmente, o botão Adicionar coloca cada arquivo na parte final da lista de
arquivos. Para colocar um arquivo em um local diferente, destaque um arquivo
na lista. O novo arquivo será adicionado imediatamente abaixo do mais baixo
arquivo em destaque.


Entrada do scanner
Você precisa ter um scanner compatível em funcionamento instalado
corretamente com o OmniPage SE. Consulte “Configuração do scanner com
OmniPage SE” na página 14. Você tem uma opção de modos de digitalização.
Ao fazer sua opção, há duas considerações principais:
    x    Que tipo de saída você deseja no documento de exportação?
    x    Que modo fornecerá melhor precisão de OCR?

Digitalização em preto e branco
Selecione isto para digitalizar em preto e branco. Isto não é adequado se você
deseja cores no documento de saída, nem se você quer que as imagens se
pareçam com as fotografias 'preto e branco': elas precisam de digitalização em
tons de cinza. Para obter melhor precisão de OCR, use isto para textos nítidos
em preto sobre fundo branco ou claro. As imagens em preto e branco podem ser
digitalizadas e tratadas mais rapidamente do que outras e ocupam menos espaço
em disco.
Digitalizar em tons de cinza
Selecione isto para usar digitalização em tons de cinza. Escolha isto para manter
as fotografias em ‘preto e branco’ no documento de saída. Para obter melhor
precisão de OCR, use isto para as páginas com contraste variado ou baixo (sem
muita diferença entre claro e escuro) e com texto em fundos sombreados ou
coloridos.
Digitalizar em cores
Selecione isto para digitalizar em cores. Isso funcionará apenas com scanners
coloridos. Escolha isto se você deseja imagens gráficas, textos ou fundos
coloridos no documento de saída. Em termos de precisão de OCR, ela não
oferece mais benefícios do que a digitalização em tons de cinza (para uma
determinada resolução), mas precisará de muito mais tempo, recursos de
memória e espaço em disco.
Brilho e contraste
Boas configurações de brilho e contraste são importantes na precisão de OCR.
Configure isso no painel Scanner da caixa de diálogo Opções ou na interface de
seu scanner. O diagrama ilustra uma configuração ótima de brilho. Após
carregar uma imagem, verifique sua aparência. Se os caracteres estiverem
espessos e se tocando, clareie o brilho. Se os caracteres estiverem finos e
quebrados, escureça-o. Em seguida, digitalize novamente a página.

                            Definição da origem das imagens de página           51
Inadequada



                                                                                   Tolerável


                                                                                   Boa

                                                                                   Melhor


                                                                                   Boa

                                                                                   Tolerável

                                                                                   Inadequada




                          Digitalização com um ADF
                          A melhor forma de digitalizar documentos de várias páginas é usar um
                          alimentador automático de documentos (ADF). Basta carregar as páginas no
                          ADF na ordem correta. Coloque páginas em branco se você quiser salvar o
                          documento em vários arquivos de saída usando a opção Criar um novo arquivo a
                          cada página em branco. Consulte “Gravação dos resultados de reconhecimento”
                          na página 83.
                          Se você tiver um documento um pouco maior do que a capacidade do ADF,
                          selecione Solicitar mais páginas automaticamente no painel Processar da caixa de
                          diálogo Opções. Em seguida, uma caixa de diálogo deixa que você adicione mais
                          lotes de páginas e sinaliza quando todas as páginas são digitalizadas.
                          Você pode digitalizar documentos frente e verso com um ADF. Um scanner
                          duplex gerenciará isto automaticamente. Para scanners não duplex, selecione
                          Digitalizar páginas com frente e verso no painel Scanner da caixa de diálogo
                          Opções. Em seguida, você pode digitalizar o documento em alguns passos, com
                          as páginas pares agrupadas e as ímpares também agrupadas. O OmniPage SE
                          mesclará as páginas para você.




52   Processamento de documentos
Capítulo 3


Digitalização sem um ADF
Você pode digitalizar documentos de várias páginas de forma eficaz com um
scanner plano, mesmo sem um ADF. Selecione Digitalizar páginas
automaticamente no painel Scanner da caixa de diálogo Opções e defina um
valor de pausa em segundos. O scanner fará as passagens de digitalização
automaticamente, pausando entre cada digitalização o número definido de
segundos, dando-lhe tempo para colocar a próxima página. Uma caixa de
diálogo permite terminar a pausa logo ou solicitar uma pausa maior e especificar
quando a última página é digitalizada.
O OmniPage Pro 12 permite digitalizar duas páginas de um livro por vez. O
programa divide as imagens recebidas em duas páginas e as desinclina de forma
independente. Esse recurso não está disponível no OmniPage SE.



Descrição do layout de documento
Antes de iniciar o reconhecimento, você é solicitado a descrever o layout das
páginas de entrada, para auxiliar o processo de zoneamento automático. Quando
você usa o Assistente de OCR, o zoneamento automático funciona sempre.
Quando você usa o processamento automático, o zoneamento automático
sempre é executado, a menos que você especifique um gabarito que não
contenha uma zona ou plano de fundo do tipo processar. Quando você faz
processamento manual, o zoneamento automático algumas vezes é executado.
Consulte o tópico Quando o zoneamento automático é executado? da Ajuda on-
line. Aqui estão as suas opções de descrição de entrada:
Automático
Escolha isto para permitir que seu programa tome todas as decisões de
zoneamento automático. Ele decide se o texto está em colunas ou não, se um
item é um texto ou uma imagem gráfica a ser reconhecida e se devem ser
colocadas tabelas ou não. Escolha Automático se o seu documento contém
páginas com layouts diferentes ou desconhecidos. Escolha-o para uma página
com várias colunas e uma tabela e para páginas com mais de uma tabela.
Coluna única, sem tabela
Escolha esta configuração se as suas páginas contêm só uma coluna de texto e
não contêm tabela. As cartas comerciais ou páginas de um livro normalmente
são assim. Escolha-a também para uma página com palavras ou números
arrumados em colunas se você não quiser que eles sejam arrumados em uma
tabela, dispostos sem colunas ou tratados como colunas separadas. As imagens
gráficas podem ser detectadas.




                                     Descrição do layout de documento        53
Várias colunas, sem tabela
                          Escolha esta opção se algumas de suas páginas contiverem texto em colunas e
                          você quiser que percam as colunas ou que as colunas continuem separadas,
                          semelhante ao layout original. Para manter as colunas com quadros no
                          documento de saída, selecione True Page no momento da exportação. A
                          exportação de página ligada do OmniPage Pro 12 mantém as colunas sem
                          quadros. Se forem encontrados dados tabulares, provavelmente serão tratados
                          como texto ligado. As imagens gráficas podem ser detectadas.
                          Coluna única, com tabela
                          Escolha esta configuração se a sua página contém só uma coluna de texto e uma
                          tabela. O zoneamento automático não procurará por colunas mas tentará
                          encontrar uma tabela e a colocará em uma grade no Editor de texto.
                          Posteriormente, você pode especificar se deseja exportar em uma grade ou como
                          colunas de texto separadas por tabulação. As imagens gráficas podem ser
                          detectadas.
                          Planilha
                          Escolha isto se toda a sua página consiste em uma tabela que você deseja exportar
                          para um programa de planilha ou tratar como uma tabela. Nem texto ligado
                          nem zonas gráficas serão detectadas.
                          Personalizado
                          Escolha isto para controle máximo sobre zoneamento automático. Você pode
                          impedir ou incentivar a detecção de colunas, imagens gráficas e tabelas. Faça as
                          suas configurações no painel Layout personalizado da caixa de diálogo Opções.
                          Gabarito
                          Escolha um arquivo de gabarito de zonas se você deseja que seu valor de plano de
                          fundo, zonas e propriedades sejam aplicados a todas as páginas obtidas a partir
                          de agora. As zonas de gabarito também são aplicadas à página atual, substituindo
                          todas as zonas existentes. Elas também serão aplicadas a páginas pré-existentes
                          sem zonas quando elas forem reconhecidas novamente. Consulte “Uso de
                          gabaritos de zonas” na página 63.
                          Se o zoneamento automático forneceu resultados não esperados de
                          reconhecimento, use processamento manual para fazer novo zoneamento em
                          páginas individuais e reconhecê-las novamente.



                          Zonas e planos de fundo
                          As zonas definem áreas na página a serem processadas ou ignoradas. As zonas são
                          retangulares ou irregulares, com os lados formados por linhas verticais ou
                          horizontais. As imagens na página de um documento têm um valor de plano de
                          fundo: processar ou ignorar (este último é mais comum). Os valores de plano de


54   Processamento de documentos
Capítulo 3


                        fundo podem ser mudados com as ferramentas mostradas. Zonas podem ser
                        desenhadas em planos de fundo de página com as seguintes ferramentas:

Planos de
fundo       Processar          Ignorar

                                                                                     Imagens
Zonas       Processar          Ignorar           Texto             Tabela
                                                                                     gráficas

                        Áreas do tipo processar (em zonas ou planos de fundo do tipo processar) são
                        zoneadas automaticamente quando são enviadas para reconhecimento.
                        Áreas do tipo ignorar (em zonas ou planos de fundo do tipo ignorar) são
                        descartadas pelo processamento. Nenhum texto é reconhecido e nenhuma
                        imagem é transferida.


                        Zoneamento automático
                        O zoneamento automático permite que o programa detecte blocos de texto,
                        títulos, figuras e outros elementos em uma página e desenhe zonas em torno
                        deles. Ele atribui tipos de zonas e propriedades àquelas zonas. O zoneamento
                        automático é executado em páginas inteiras quando você usa o processamento
                        automático, a menos que você tenha carregado um gabarito. Ele é executado
                        quando você usa o Assistente de OCR. Você pode também especificar o
                        zoneamento automático ao usar o processamento manual, da seguinte maneira:
                        Zoneamento automático de uma página inteira
                        Obter uma página: Ela aparece com um plano de fundo do tipo processar. Não
                        desenhe nenhuma zona nela e verifique na lista suspensa Descrição de layout que
                        nenhum gabarito de zona foi carregado. Clique no botão Executar OCR. Você
                        pode selecionar várias páginas sem zonas para que elas sejam zoneadas
                        automaticamente e reconhecidas juntas.
                        Zoneamento automático de parte de uma página
                        Obter uma página: Ela aparece com um plano de fundo do tipo processar.
                        Desenhar uma zona. O plano de fundo muda para ignorar. Desenhe zonas de
                        texto, tabela ou imagens gráficas para circundar áreas que você quer que sejam
                        zoneadas manualmente. Desenhe zonas do tipo processar para circundar áreas
                        que você deseja que sejam zoneadas automaticamente, Depois do
                        reconhecimento, as zonas do tipo processar serão substituídas por uma ou mais
                        zonas de texto, tabelas ou imagens gráficas.
                        Zoneamento automático do plano de fundo de uma página
                        Obter uma página: Ela aparece com um plano de fundo do tipo processar.
                        Desenhar uma zona. O plano de fundo muda para ignorar. Desenhe zonas de


                                                                      Zonas e planos de fundo         55
texto, tabela ou imagens gráficas para circundar áreas que você quer que sejam
                              zoneadas manualmente. Clique na ferramenta Plano de fundo processar
                              (mostrado) para definir um plano de fundo do tipo processar. Desenhe zonas do
                              tipo ignorar em partes da página que você não precisa. Depois do
                              reconhecimento a página voltará com um plano de fundo do tipo ignorar e
                              novas zonas em torno de todos os elementos encontrados no plano de fundo.


                              Zoneamento manual
                              Primeiro apresentamos dois exemplos de zonas e planos de fundo. Em seguida
                              detalharemos os tipos de zona. Por fim, explicaremos como desenhar e trabalhar
                              com zonas. Nestes exemplos, os números referem-se à tabela na página seguinte.


                              Desenhar zonas em um plano de fundo do tipo ignorar:


     Antes do                                Depois do
     reconheci-                              reconheci-
     mento:                                  mento:
                                                                                        A zona 4 retorna
                                             Plano de fundo                             como um conjunto de
                                             permanece                                  zonas, neste caso
                                             como ignorar.                              para tratar três colu-
                                                                                        nas de texto e uma
                                                                                        foto.




                              Desenhar zonas em um plano de fundo do tipo processar:


     Antes do                               Depois do
     reconheci-                             reconheci-
     mento:                                 mento:
                                                                                        A zona 6 é absorvida
                                            O plano de                                  no plano de fundo.
                                            fundo é alterado                            Todas as zonas no
                                            para ignorar.                               lado esquerdo da
                                                                                        página foram criadas
                                                                                        automaticamente.




56       Processamento de documentos
Capítulo 3



 Nº        Tipo                      O que acontece:
 1         Zona de texto             OCR é executado e gera texto.
 2         Zona de tabelas           O OCR é executado, o texto é colocado em
                                     uma grade de tabela.
 3         Zona gráfica              A imagem é embutida na página reconhecida.
 4         Zona do tipo processar    O zoneamento automático cria uma ou mais
                                     zonas, decide seus tipos e processa seus
 5         Planos de fundo do tipo   conteúdos.
           processar
 6         Ignorar zona
 7         Planos de fundo do tipo   Nada
           ignorar


Zonas desenhadas automaticamente e zonas de gabarito têm molduras sólidas:



Zonas desenhadas manualmente ou modificadas têm molduras pontilhadas:



Zonas não têm uma ordem de leitura. A reorganização de elementos
reconhecidos pode ser feita no Editor de texto. Consulte “Edição de texto e de
imagem” na página 75. O zoneamento em tempo real é descrito em Capítulo 4.
Consulte “Edição em tempo real” na página 77.


Tipos de zona e propriedades
Cada zona tem um tipo de zona. As zonas contendo texto também podem ter
uma configuração de conteúdo de zona: alfanumérica ou numérica. O tipo de
zona e o conteúdo da zona juntos constituem as propriedades da zona. Clique
com o botão direito na zona para obter um menu de atalho que permita que
você altere as propriedades da zona. Selecione várias zonas com Shift+click para
alterar as suas propriedades com uma ação.
A barra de ferramentas Imagem fornece cinco ferramentas para desenhar zonas,
uma para cada tipo. O tipo da zona é indicado por um ícone em seu canto
superior esquerdo e pelo ícone e pela cor da moldura da zona. Aqui estão as
ferramentas e as cores:
Zona do tipo processar (cor de oliva)
Use isso para desenhar uma zona do tipo processar, para definir a área de uma
página onde o zoneamento automático será realizado. Depois do

                                                Zonas e planos de fundo         57
reconhecimento, esta zona será substituída por uma ou mais zonas com tipos de
                          zona determinados automaticamente. Normalmente, você desenha zonas do
                          tipo processar em um plano de fundo do tipo ignorar. Desenhe uma zona do
                          tipo processar para circundar colunas de texto para que elas sejam tratadas
                          automaticamente. Elas perderão a estrutura de colunas na visualização NF e RFP
                          do Editor de texto, mas serão mantidas em colunas na visualização True Page.
                          Zona do tipo ignorar (cinza)
                          Use isto para desenhar uma zona do tipo ignorar, para definir uma área de
                          página que você não quer que seja transferida para o Editor de texto. O
                          zoneamento automático não colocará zonas aqui. Para excluir uma dada área da
                          página em muitas páginas (por exemplo um título ou a numeração da página),
                          coloque uma zona do tipo ignorar em um gabarito. Normalmente você desenha
                          zonas do tipo ignorar em um plano de fundo do tipo processar.
                          Zona de texto (marrom)
                          Use isso para desenhar uma zona de texto. Desenhe esta zona sobre um bloco
                          único de texto. O conteúdo da zona será tratado como texto ligado, sem
                          encontrar colunas. Se você deseja que colunas de texto sejam tratadas
                          automaticamente, circunde-as em uma zona do tipo processar.
                          Zona de tabelas (azul)
                          Use isto para que o conteúdo da zona seja tratado como uma tabela. As grades de
                          tabela podem ser detectadas automaticamente ou colocadas manualmente como
                          descritas na próxima seção. As zonas de tabelas precisam ser retangulares. O
                          Editor de texto exibe a tabela em uma grade editável. Para muitos tipos de
                          arquivo de saída, você pode escolher se deseja exportar as tabelas em grades ou
                          em colunas separadas por tabulações.
                          Zona gráfica (verde)
                          Use isto para incorporar uma figura, diagrama, desenho, assinatura ou qualquer
                          coisa que você quer transferir para o Editor de texto como uma imagem
                          incorporada e não como texto reconhecido. As imagens incorporadas podem ser
                          exportadas com o documento para os aplicativos de destino que suportam
                          imagens gráficas.


                                   Zonas de texto e tabela têm uma configuração do conteúdo da zona. O conteúdo
                                   alfanumérico valida todos os caracteres necessários para a sua opção de idioma. Os
                                   resultados de reconhecimento de uma zona numérica conterão somente números e
                                   pontuação relativa a número. Nenhuma letra será colocada. Use o menu de atalho
                                   da zona para alterar esta configuração.
                                   Clique com o botão direito do mouse fora de uma zona para obter um menu de
                                   atalho adaptado para a imagem inteira. Isto permite que você amplie, reduza ou
                                   gire a imagem. Quando uma imagem gira, todas as zonas nela são excluídas.




58   Processamento de documentos
Capítulo 3


Trabalho com zonas
A barra de ferramentas Imagem fornece ferramentas de edição de zonas. Uma é
sempre selecionada. Quando você não quiser mais o serviço de uma ferramenta,
clique em uma ferramenta diferente. Algumas ferramentas nesta barra de
ferramentas são agrupadas. Apenas a última ferramenta selecionada do grupo é
visível. Para selecionar uma ferramenta visível, clique nela. Para selecionar uma
ferramenta oculta, mantenha o botão do mouse pressionado no triângulo no
canto inferior direito da ferramenta visível até que as demais ferramentas
apareçam, então clique na ferramenta desejada.
Desenhar uma zona única
Selecione a ferramenta de desenhar zonas do tipo
desejado, em seguida clique e arraste o cursor. Nestes
exemplos, isso é mostrado por uma seta indo de A a
B. Também é possível arrastar do canto superior
esquerdo para o canto inferior direito.
Apenas zonas retangulares podem ser desenhadas;
zonas (exceto zonas de tabela) podem se tornar
irregulares depois de desenhadas.
Para redimensionar uma zona, selecione-a com um clique, mova o cursor para
uma das laterais ou cantos, apanhe uma alça e mova-a para o local desejado.
Para mover uma zona, selecione-a com a ferramenta de seleção de zona e mova-a
conforme desejar. Você não pode mover uma zona de modo que ela venha a
sobrepor outra zona.

Criar uma zona irregular por adição
Desenhe uma zona que parcialmente se sobreponha a outra do mesmo tipo:

 zona existente                               zona resultante



                    nova zona




                                                Zonas e planos de fundo       59
Junte duas zonas do mesmo tipo
                          Desenhe uma zona que parcialmente se sobreponha duas zonas do mesmo tipo.




                             zonas                    nova                              zona resul-
                             exis-                    zona                              tante
                             tentes




                          Criar uma zona irregular por subtração
                          Desenhe uma zona sobreposta do mesmo tipo do plano de fundo (neste
                          exemplo, um plano de fundo do tipo ignorar).


                           zona exis-
                           tente em um
                           plano de
                           fundo do tipo                                                  zona
                           ignorar                                                        result-
                                                             nova                         ante
                                                             zona do
                                                             tipo
                                                             ignorar




                          Dividir uma zona
                          Desenhe uma zona divisora do mesmo tipo do plano de fundo (neste exemplo,
                          um plano de fundo do tipo processar).

                          zona de
                          texto exis-
                          tente em um
                          plano de
                          fundo do                                                         zonas
                          tipo proces-                                                     result-
                          sar                            nova zona do                      antes
                                                         tipo processar




60   Processamento de documentos
Capítulo 3


Os seguintes formatos de zona são proibidos:

  Recuada ao                      Recuada ao                        Com um furo
  longo da parte                  longo da                          no meio
  inferior                        parte supe-
                                  rior


Para expandir uma zona mais rapidamente do que usando as alças de
redimensionamento, desenhe uma zona do mesmo tipo para delimitá-la
completamente. A zona menor é substituída pela maior. Para substituir um
conjunto de zonas de qualquer tipo por uma única zona, desenhe uma zona
maior do tipo desejado para delimitá-las completamente. Todas as zonas
menores são substituídas pela maior.
Quando você desenha uma nova zona que se sobrepõe parcialmente a uma zona
existente de um tipo diferente, na verdade ela não a sobrepõe; a nova zona
substitui a parte sobreposta da zona existente.
Os diagramas no tópico Desenhar zonas manualmente da Ajuda on-line
esclarecem esses dois tópicos.



Grades de tabela na imagem
Após o processamento automático, você poderá ver zonas de tabelas colocadas
em uma página. Elas são denotadas com um ícone de zona de tabela no canto
esquerdo superior da zona. Para mudar uma zona retangular de ou para uma
zona de tabela, use o seu menu de atalho. Você pode também desenhar zonas de
tabela mas elas precisam permanecer retangulares.
Você delimita ou move divisores de tabela para determinar se as linhas de grade
aparecerão quando a tabela for colocada no Editor de texto. Você pode desenhar
ou redimensionar uma zona de tabela (desde que ela permaneça retangular) para
descartar colunas ou linhas desnecessárias das extremidades de uma tabela.
As cinco ferramentas agrupadas de tratamento de tabela na barra de ferramentas
de imagem podem ser usadas se a página atual contiver uma zona do tipo tabela.
Se a ferramenta que você precisa não está visível, clique no triângulo no canto
inferior direito da ferramenta visível para exibir todas as ferramentas e em
seguida clique na ferramenta desejada.
Use as ferramentas de tabela e seus cursores da seguinte maneira:
Inserir divisores de linha
Clique na ferramenta e, em seguida, clique no local na zona de tabela onde você



                                           Grades de tabela na imagem         61
deseja colocar um divisor de linha. Evite colocar um divisor de modo que ele
                          corte um texto ao meio.
                          Inserir divisores de coluna
                          Clique na ferramenta e, em seguida, clique no local na zona de tabela onde você
                          deseja colocar um divisor de coluna.
                          Mover divisores
                          Clique na ferramenta e mova o cursor para o divisor de linha ou coluna a ser
                          movido. Ele exibe uma seta de duas pontas. Arraste o divisor conforme
                          necessário. Você não pode arrastá-lo além de suas vizinhanças. Evite colocar
                          divisores de modo que eles cortem texto ao meio.
                          Remover divisores
                          Clique na ferramenta e, em seguida, clique em um único divisor de linha ou
                          coluna que você deseja excluir. Faça isso se um divisor estiver localizado
                          incorretamente ou se você quiser alterar a aparência da tabela no documento
                          final. Por exemplo, você pode colocar duas colunas de dados em uma única
                          coluna excluindo o divisor entre as colunas.
                          Inserir/Remover todos os divisores
                          Clique nesta ferramenta e clique em seu ícone do cursor dentro de uma zona de
                          tabela sem divisores. Os divisores serão detectados automaticamente e inseridos.
                          Clique nele em um tabela com divisores para fazer com todos desapareçam.
                          Pressione a tecla CTRL enquanto aciona o mouse se desejar inserir, mover ou
                          excluir um divisor apenas na célula atual.
                          Você pode especificar a formatação de linha para molduras e grades de tabela a
                          partir de um menu de atalho Depois do reconhecimento você terá mais escolhas
                          para editar molduras e sombreamento no Editor de texto.




62   Processamento de documentos
Capítulo 3



Uso de gabaritos de zonas
Um gabarito pode conter um valor de plano de fundo e um conjunto de zonas e
suas propriedades, armazenados em um arquivo. Um arquivo de gabarito de
zona pode ser carregado para que as zonas de gabarito sejam usadas durante o
reconhecimento. Carregue um arquivo de gabarito na lista suspensa Descrição
de layout ou no menu Ferramentas.
Quando você carrega um gabarito, seu plano de fundo e suas zonas são inseridos:
   x na página atual, substituindo quaisquer zonas existentes
   x em todas as páginas obtidas futuramente
   x em páginas pré-existentes enviadas para um novo reconhecimento sem
       quaisquer zonas.
Com processamento manual as zonas de gabarito nos dois primeiros casos
podem ser visualizadas e modificadas antes do reconhecimento.
Com processamento automático as zonas de gabarito podem ser visualizadas e
modificadas apenas depois do reconhecimento.
Este comportamento continua até que o gabarito seja descarregado.
Gabaritos aceitam zonas e planos de fundo do tipo ignorar e processar. Portanto,
eles podem ser úteis para definir quais partes das páginas devem ser processadas
com zoneamento automático e quais partes devem ser ignoradas. Zonas ou
planos de fundo do tipo processar em um gabarito podem ser substituídos
durante o reconhecimento por um conjunto de zonas menores; tipos específicos
de zona serão atribuídos a essas zonas.

Como salvar um gabarito de zona
Selecione um valor de plano de fundo e prepare zonas em uma página. Verifique
suas localizações e propriedades. Clique em Gabarito de zona ... no menu
Ferramentas. Na caixa de diálogo, selecione [zonas na página] e clique em
Salvar, em seguida atribua um nome e clique em OK.
Como modificar um gabarito de zona
Carregue um gabarito e obtenha uma imagem adequada com processamento
manual. As zonas do gabarito aparecem. Modifique as zonas e/ou propriedades
conforme desejado. Abra a caixa de diálogo Arquivo de gabarito de zona. O
gabarito atual é selecionado. Clique em Salvar e em Fechar.




                                             Uso de gabaritos de zonas       63
Como descarregar um gabarito
                          Selecione uma configuração sem gabarito na lista suspensa Descrição de layout.
                          As zonas de gabarito não são removidas das páginas existentes ou atuais, mas as
                          zonas de gabarito não serão mais usadas para processamento futuro. Você
                          também pode abrir a caixa de diálogo Arquivos de gabarito de zona, selecionar
                          [nenhum] e clicar no botão Definir como atual. Neste caso, a configuração de
                          descrição do layout volta para Automático.
                          Como substituir um gabarito por outro
                          Selecione um gabarito diferente na lista suspensa Descrição de layout ou abra a
                          caixa de diálogo Arquivos de gabarito de zona, selecione o gabarito desejado e
                          clique no botão Definir como atual. Zonas do novo gabarito são aplicadas à
                          página atual, substituindo quaisquer zonas já existentes. Elas também são
                          aplicadas conforme explicado acima.
                          Como excluir um arquivo de gabarito
                          Abra a caixa de diálogo Arquivos de gabarito de zona. Selecione o gabarito e
                          clique no botão Delete. As zonas já colocadas por este gabarito não são
                          removidas.


                                   Gabaritos estão disponíveis em Direct OCR, mas não no Assistente de OCR.




64   Processamento de documentos
Capítulo 4

             Correção e edição
             Os resultados de reconhecimento são colocados no Editor de texto. Eles podem
             ser textos reconhecidos, tabelas e imagens gráficas incorporadas. Este editor do
             tipo WYSIWYG (What You See Is What You Get, o que se vê é o que será
             impresso) oferece os recursos a seguir, que serão detalhados neste capítulo:
                 x    Exibição e visualizações do editor
                 x    Correção de resultados de OCR
                 x    Verificação de texto
                 x    Dicionários do usuário
                 x    Treinamento
                 x    Edição de texto e de imagem
                 x    Edição em tempo real
                 x    Leitura de texto em voz alta




                                                     OmniPage SE Manual do usuário         65
Exibição e visualizações do editor
                         O Editor de texto exibe os textos reconhecidos e pode marcar as palavras
                         consideradas suspeitas durante o reconhecimento com um sublinhado
                         ondulado.
                             x    Verde – Palavras ausentes do dicionário: Elas foram reconhecidas na
                                  base da confiança mas não foram encontradas em nenhum dicionário
                                  ativo: padrão, de usuário ou profissional.
                             x    Azul – Palavras com caracteres suspeitos: Elas contém caracteres não
                                  reconhecidos ou são palavras aprovadas pelo dicionário contendo
                                  caracteres reconhecidos com menor confiança.
                             x    Vermelho – Palavras suspeitas: Provavelmente são palavras ausentes do
                                  dicionário com um ou mais caracteres suspeitos, mas podem também
                                  ser suspeitas por outros motivos.
                         Você pode configurar se as palavras ausentes de dicionário serão marcadas ou
                         não no painel Corrigir da caixa de diálogo Opções. Todos os marcadores
                         podem ser mostrados ou ocultados conforme selecionado no painel Editor de
                         texto da caixa de diálogo Opções. Você também pode mostrar ou ocultar
                         caracteres não imprimíveis e indicadores de cabeçalho e rodapé. O painel no
                         Editor de texto também permite que você defina uma unidade de gerenciamento
                         do programa e uma configuração de mudança de linha para uso em todas as
                         visualizações do editor de texto exceto a visualização Sem formatação.
                         O OmniPage SE pode exibir páginas com três níveis de formatação. Você pode
                         alternar livremente entre eles usando os três botões no canto inferior esquerdo
                         do Editor de texto ou do menu Visualizar. As imagens gráficas e as tabelas
                         podem aparecer em todas as visualizações. Aqui estão as diferenças principais
                         entre as visualizações:
                         Visualização Sem formatação
                         Exibe texto simples sem colunas alinhado à esquerda com uma única fonte e um
                         tamanho de fonte, com as mesmas quebras de linha do documento original. A
                         maior parte dos botões de formatação e caixas de diálogo estão desativadas. As
                         réguas não são exibidas. Você pode achar isto conveniente para verificar e editar
                         o texto.
                         Visualização Preservar fontes e parágrafos
                         Exibe texto sem colunas com estilo de parágrafo e de fonte. A régua horizontal é
                         exibida. Você pode achar esta visualização conveniente para verificar, editar e
                         modificar o texto com seu estilo.
                         Visualização True Page
                         A visualização True Page® tenta conservar o máximo possível da formatação do
                         documento original. O estilo de caracteres e do parágrafo é mantido. Todos os




66   Correção e edição
Capítulo 4


                          elementos de página, incluindo colunas, são colocados em caixas e quadros. A
                          ordem de leitura pode ser exibida por setas. Veja página 75.
                          O nível de formatação para exportação é escolhido separadamente no momento
                          da exportação.



                          Correção de resultados de OCR
                          Após uma página ser reconhecida, os resultados de reconhecimento aparecem no
                          Editor de texto. A correção inicia automaticamente se isto foi solicitado no
                          painel Correção da caixa de diálogo Opções ou no Assistente de OCR. Você
                          pode iniciar a correção manualmente a qualquer momento. Trabalhe da
                          seguinte maneira:

                          1. Clique na ferramenta Corrigir OCR na barra de ferramentas Padrão ou
                             escolha Corrigir OCR... no menu Ferramentas.

                          2. A correção começa do início do documento, mas pula o texto já corrigido.
                             Se um erro suspeito for detectado, a caixa de diálogo Corretor de OCR
                             colore a palavra suspeita em seu contexto e exibe uma figura de como ela se
                             parecia originalmente na imagem.
Isto informa porque a
palavra está marcada.

Painel de edição: A
palavra marcada é
exibida na cor de seu
marcador: vermelho,                                                                        A imagem da
azul ou verde.                                                                             palavra suspeita
                                                                                           fica em
                                                                                           destaque.



Esta janela mostra a
parte correspondente
da imagem original.                                                                       Arraste um canto
Clique dentro dela                                                                        ou a parte
para ampliar ou reduzir                                                                   inferior da caixa
a exibição.                                                                               de diálogo para
                                                                                          redimensioná-la.




                          3. Se a palavra reconhecida estiver correta, clique em Ignorar ou Ignorar todas
                             para ir para a próxima palavra suspeita. Clique em Acrescentar para
                             adicionar ao dicionário atual do usuário e ir para a próxima palavra suspeita.


                                                                  Correção de resultados de OCR         67
4. Se a palavra reconhecida não estiver correta, modifique-a no painel de
                            Edição ou selecione uma sugestão do dicionário. Clique em Substituir ou
                            Substituir todas para implementar a alteração e ir para a próxima palavra
                            suspeita. Clique em Acrescentar para adicionar a palavra alterada ao
                            dicionário atual do usuário e ir para a próxima palavra suspeita.

                         5. Os marcadores de cores são removidos das palavras no Editor de texto
                            conforme elas são corrigidas. Você pode alternar para o Editor de texto
                            durante a correção para fazer correções lá. Clique no botão Continuar para
                            reiniciar a correção. Clique em Fechar para interromper a correção antes
                            que o fim do documento seja alcançado.


                                  Uma página é marcada com o ícone de corrigido       em sua miniatura e no
                                  Gerenciador de documentos se a correção tiver chegado ao final da página.
                                  Se os marcadores estavam ocultos no Editor de texto quando a correção foi iniciada
                                  ou a opção Localizar próxima suspeita for selecionada, os marcadores passam a ser
                                  exibidos e permanecem visíveis depois da correção.
                                  Se a opção Marcar palavras ausentes do dicionário estiver desativada no painel
                                  Correção da caixa de diálogo Opções, a correção só será interrompida em palavras
                                  marcadas em vermelho ou azul, e não em palavras ausentes do dicionário. Isto é útil
                                  ao verificar páginas com muitas palavras ausentes do dicionário, como em catálogos
                                  de produtos que contém códigos e bibliografias que contém muitos nomes
                                  próprios.
                                  Use a opção Verificar novamente página atual no menu Ferramentas para executar
                                  uma nova verificação ortográfica em uma página que já foi corrigida. Faça isso para
                                  verificar palavras digitadas ou coladas no Editor de texto depois que a correção foi
                                  feita. Isso funciona mesmo que a opção Marcar palavras ausentes do dicionário esteja
                                  desativada no painel Correção.




                         Verificação de texto
                         Após o reconhecimento de OCR, você pode comparar todas as partes do texto
                         reconhecido com a parte correspondente da imagem original para verificar se o
                         texto foi reconhecido corretamente. Trabalhe da seguinte maneira:




68   Correção e edição
Capítulo 4



                                 Para fazer isso:                               Use isso:
                                 Ativar o verificador                           F9 ou ferramenta verificador
                                 Desativar o verificador                        Esc ou F9 ou ferramenta verificador
                                 Ativar/desativar verificador temporaria-
                                                                                F8: pressione e mantenha pressionado
                                 mente
                                 Exibir verificador até próxima tecla ser
                                                                                Clique duas vezes na palavra
                                 pressionada
                                 Ampliar a exibição                             Alt + Num + ou clique no verificador
                                 Reduzir a exibição                             Alt + Num – ou clique no verificador
                                 Tornar o verificador dinâmico ou aco-
                                                                                Alt + Num /
                                 plado/flutuante
                                 Contexto dinâmico (3 valores possíveis)        Alt + Num *

                             A ferramenta verificador está na barra de ferramentas Formatação. O verificador
                             também pode ser controlado pelo menu Ferramentas. Passe o cursor sobre um
                             verificador para obter a barra de ferramentas verificador. Use-a da seguinte
                             forma:

                                                           ferramenta verificador (ativar/desativar)



Arraste entre flutuante e
acoplado




                                  para flutuar ou acoplar (retorna ao último estado)
                                                                        Qual a quantidade de contexto para o
                                                                        verificador dinâmico?
           Barra de                                                     • uma palavra
           ferramentas do                                               • três palavras (atual + vizinhas)
           Verificador:                                                 • linha inteira da imagem
                                                   para dinâmico
          ampliar/reduzir zoom


  Editor de texto




                                                                                              Verificação de texto     69
Você deve corrigir e verificar os textos antes de fazer edições de grande escala. Se
                                  você cortar e colar grandes blocos de texto, as associações entre o texto e a imagem
                                  podem ser corrompidas.
                                  O recurso Texto para fala do OmniPage Pro 12 pode ler em voz alta o texto
                                  reconhecido, como outra forma de verificação de texto. Você pode ouvir o texto
                                  letra a letra, palavra a palavra, linha a linha, frase a frase ou em páginas inteiras.
                                  Consulte a seção ”Leitura de texto em voz alta” na página 78. Este recurso está
                                  disponível no OmniPage SE.




                         Dicionários do usuário
                         O programa possui dicionários internos para muitos idiomas. Estes ajudam no
                         reconhecimento e podem oferecer sugestões durante a correção. Eles podem ser
                         complementados por dicionários do usuário. Você pode salvar quantos
                         dicionários de usuário quiser, mas somente um pode ser carregado por vez. Os
                         dicionários do usuário do Microsoft Word também estão disponíveis; um
                         dicionário chamado Personalizado é o dicionário padrão do usuário para
                         Microsoft Word.
                         Início de um dicionário de usuário
                         Clique em Acrescentar na caixa de diálogo Corretor de OCR sem dicionário de
                         usuário carregado ou abra a caixa de diálogo Arquivos de dicionário do usuário
                         no menu Ferramentas e clique em Novo. Será pedido para que você dê um
                         nome ao dicionário imediatamente.
                         Carregamento ou descarregamento de um dicionário de usuário
                         Faça isso no painel OCR da caixa de diálogo Opções ou na caixa de diálogo
                         Arquivos de dicionário do usuário. Selecione um arquivo de dicionário para
                         carregá-lo ou [nenhum] para descarregar um dicionário do usuário.
                         Edição ou exclusão de um dicionário de usuário
                         Adicione de palavras carregando um dicionário de usuário e, em seguida,
                         clicando em Acrescentar na caixa de diálogo Corretor de OCR. Você pode
                         acrescentar e excluir palavras clicando em Editar na caixa de diálogo Arquivos de
                         dicionário do usuário. O botão Excluir permite que você exclua o dicionário de
                         usuário selecionado.

                                  Ao editar um dicionário de usuário, você pode importar uma lista de palavras de
                                  um arquivo de texto simples para adicionar palavras ao dicionário rapidamente.
                                  Cada palavra precisa estar em uma linha separada sem pontuação no início ou fim
                                  da palavra.




70   Correção e edição
Capítulo 4


No OmniPage Pro 12, dicionários especializados estão disponíveis, em alguns
idiomas, para determinadas profissões (no momento, advogados e médicos). Eles
não estão disponíveis no OmniPage SE.

         O programa identifica o idioma dos textos reconhecidos e exibe-o na barra de
         status. Esta marcação de idioma é exportada junto com o documento. Use Definir
         idioma... no menu Ferramentas para alterar a marcação de idioma do texto
         selecionado. Isto não altera o(s) idioma(s) de reconhecimento.




Treinamento
O OmniPage SE não oferece suporte para o treinamento, IntelliTrain nem para
arquivos de treinamento. Eles se encontram disponíveis no OmniPage Pro 12.
Os dados de treinamento contidos em arquivos OPD serão ignorados quando
abertos no OmniPage SE
Treinamento é o processo de alterar as soluções de OCR atribuídas aos formatos
de caracter na imagem. Isto é útil para documentos degradados uniformemente
ou quando um tipo de fonte incomum é usado em todo um documento. O
treinamento será menos útil em textos com distorções aleatórias. Veja um
exemplo, baseado na letra “g”, que pode ser impressa de formas diferentes:




Os dois primeiros exemplos não precisam de treinamento porque as duas formas
da letra “g” são normais e o programa pode tratá-las. O terceiro exemplo poderia
se beneficiar do treinamento porque a forma de “g” é incomum e todas as
instâncias de “g” no texto provavelmente se parecem com ela. O quarto exemplo
não é bom para treinamento porque o primeiro “g” é impresso de forma fraca e é
improvável que esta forma apareça no documento novamente.
Você pode usar o treinamento para melhorar o reconhecimento de símbolos
especiais como @, ® e © ou para reconhecer letras acentuadas suportadas com
maior confiabilidade. A finalidade do treinamento não é ensinar o programa a
ler caracteres de idiomas ou alfabetos não suportados.
O OmniPage Pro 12 oferece dois tipos de treinamento: treinamento manual e
treinamento automático (IntelliTrain). Os dados provenientes de ambos os tipos
de treinamento são combinados e estão disponíveis para serem salvos em um
arquivo de treinamento.




                                                               Treinamento          71
Quando você sai de uma página na qual os dados de treinamento foram gerados,
                         você será perguntado como aplicá-los às outras páginas existentes no
                         documento.


                         Treinamento manual
                         Para executar o treinamento manual, coloque o ponto de inserção em frente do
                         caracter que deseja treinar ou selecione um grupo de caracteres (até uma palavra)
                         e escolha Treinar caracter ... no menu Ferramentas ou menu de atalho. Você
                         verá uma imagem ampliada do(s) caracter(es) a ser(em) treinado(s), juntamente
                         com a atual solução de OCR. Mude-a para a solução desejada e clique em OK.
                         O programa pega esse treinamento e examina o resto da página. Se ele encontrar
                         palavras candidatas para alterar, elas serão listadas na caixa de diálogo Verificar
                         treinamento. Palavras incorretas devem ser treinadas novamente antes de a lista
                         ser aprovada.
                         Para obter uma orientação sobre como usar as caixas de diálogo Treinar caracter
                         e Verificar treinamento, consulte as ajudas sensíveis a contexto ou o tópico
                         Treinamento manual da Ajuda on-line e outros tópicos relacionados.


                         IntelliTrain
                         O IntelliTrain é uma forma automatizada de treinamento. Ele obtém
                         informações das alterações que você faz durante a correção. Quando você faz
                         uma alteração, ele lembra da forma de caracteres envolvida e da sua alteração de
                         correção. Ele procura por outras formas de caracteres semelhantes no
                         documento, especialmente em palavras suspeitas. Ele avalia se aplica a correção
                         do usuário ou não.
                         Você pode ativar ou desativar o IntelliTrain no painel OCR da caixa de diálogo
                         Opções.
                         O seguinte exemplo mostra como o IntelliTrain funciona, usando a imagem
                         original. O nosso exemplo envolve as letras c e e. Com algumas configurações de
                         digitalização e fontes, a linha horizontal na letra ´e´ pode se tornar muito fina,
                         levando a erros de OCR que o IntelliTrain podem consertar.




72   Correção e edição
Capítulo 4




O OmniPage Pro lê isto
como qualqucr.
Você o alterou durante a
correção para qualquer.                                                         O IntelliTrain se lembra
                                                                                desta forma e desta
                                                                                regra:
                                                                                       Isto não é um c.
                                                                                 e     Isto é um e.




                                                                                O IntelliTrain muda:
                                                                                cstc para este
                                                                                dcspcsas para despesas
                                                                                scja para seja
                                                                                etc.




                           O IntelliTrain lembra-se dos dados de treinamento que coletou e os adiciona a
                           qualquer treinamento manual que você tenha feito. Este treinamento pode ser
                           salvo em um arquivo de treinamento para uso futuro com documentos
                           semelhantes.


                           Arquivos de treinamento
                           Se você quiser ser avisado para salvar dados de treinamento não salvos ao fechar
                           o documento, selecione a opção no painel Correção na caixa de diálogo Opções.
                           Os dados de treinamento não salvos são armazenados em um documento do
                           OmniPage. Se você não salvar o documento como um OPD, o treinamento não
                           salvo é descartado quando o documento é fechado.
                           A gravação do treinamento em um arquivo, o carregamento, a edição e o
                           descarregamento de arquivos de treinamento são feitos na caixa de diálogo
                           Arquivos de treinamento. Abra-a no painel Correção da caixa de diálogo Opções
                           ou no menu Ferramentas.




                                                                                       Treinamento          73
Selecione isto,                                           Clique nisto para editar o
                              clique em Salvar e                                        arquivo de treinamento
                              digite um nome                                            selecionado na caixa de
                              para salvar um                                            diálogo Editar
                              arquivo de                                                treinamento.
                              treinamento.
                                                                                        Use isto também para
                             Selecione isto                                             salvar um novo
                             para descarregar                                           treinamento em um
                             um arquivo de                                              arquivo de treinamento
                             treinamento.                                               carregado. Isto é listado
                                                                                        como: Nome de
                                                                                        arquivo [modificado]


                             O treinamento descarregado pode ser editado na caixa de diálogo Editar
                             treinamento, um asterisco é exibido na barra de títulos no lugar de um nome de
                             arquivo de treinamento. Ele continua não salvo quando você fecha a caixa de
                             diálogo Editar treinamento. Salve-o na caixa de diálogo Arquivos de
                             treinamento.
                             Um arquivo de treinamento também pode ser editado; o seu nome aparece na
                             barra de título. Se ele tiver dados de treinamento não salvos adicionados a ele,
                             um asterisco aparecerá após seu nome. Ambos os treinamentos modificados e
                             não salvos são salvos quando você fecha a caixa de diálogo.
                             A caixa de diálogo Editar treinamento exibe quadros contendo uma forma de
                             caractere e uma solução de OCR associada à forma. Clique em um quadro para
                             selecioná-lo. Em seguida, você pode excluí-lo com a tecla Delete ou alterar a
                             atribuição. Use as teclas de seta para mover para o próximo quadro ou para o
                             anterior.


     Você está editando o
     seu treinamento não                                                                 Clique duas vezes em
     salvo.                                                                              um quadro ou
                                                                                         pressione Enter para
                                                                                         mudar sua solução de
                                                                                         OCR. Digite a nova
     Este quadro está                                                                    solução na caixa de
     acinzentado. Ele foi                                                                texto que aparece e
     excluído. Para recuperá-lo,                                                         pressione Enter. As
     selecione-o novamente e                                                             atribuições alteradas
     pressione a tecla Delete. Os                                                        aparecem em
     caracteres marcados como                                                            vermelho.
     excluídos são realmente
     excluídos quando você
     fecha a caixa de diálogo.          Este quadro está selecionado. A parte superior mostra a forma
                                        da imagem. A parte inferior mostra a solução de OCR
                                        atribuída.




74   Correção e edição
Capítulo 4



Edição de texto e de imagem
O OmniPage SE oferece um Editor de texto WYSIWYG, que fornece muitos
recursos de edição. Eles funcionam de forma muito semelhante aos dos
principais processadores de texto do mercado.
Edição de atributos de caracteres
Em todas as visualizações, exceto na visualização Sem formatação, você pode
alterar o tipo de fonte, o tamanho e os atributos (negrito, itálico, sublinhado)
para o texto selecionado. Use a caixa de ferramentas Formatação na caixa de
diálogo Fonte no menu Formatar. Esta última também oferece opções de
caracteres subscritos, sobrescritos e texto ou fundo colorido.
Na visualização Sem formatação, use a barra de ferramentas Formatação para
especificar um tipo de fonte e tamanho a ser aplicado a todo o documento. Isto
não é usado para exportação e nem transferido para outras visualizações; as
configurações anteriores são restauradas.
Abra a caixa de diálogo Correspondência de fontes no painel OCR na caixa de
diálogo Opções antes do OCR para especificar as fontes a serem usadas para
entrada de texto no Editor de texto.
Edição de atributos de parágrafos
Em todas as visualizações, exceto na visualização Sem formatação, você pode
alterar o alinhamento dos parágrafos selecionados e aplicar marcadores a
parágrafos. Use a caixa de ferramentas Formatação ou a caixa de diálogo
Parágrafo no menu Formatar. Esta última permite que você modifique recuos,
espaçamento de linha e espaçamento entre parágrafos. A régua horizontal do
Editor de texto permite que você defina as posições de recuo e tabulação com
facilidade. As configurações avançadas de tabulação são feitas na caixa de diálogo
Tabulações no menu Formatar.
Estilos de parágrafos
Os estilos de parágrafos são detectados automaticamente durante o
reconhecimento. Uma lista de estilos é criada e apresentada em uma caixa de
seleção à esquerda da caixa de ferramentas Formatação. Use-a para atribuir um
estilo aos parágrafos selecionados. Use a caixa de diálogo Estilo no menu
Formatar para renomear ou modificar um estilo e para definir um novo estilo.
Quando você salva um documento em um arquivo, pode escolher se deseja
exportar os estilos de parágrafo com o documento ou não. Isto é válido somente
se o aplicativo de destino for compatível com estilos de parágrafos.
Imagens gráficas
Você pode editar o conteúdo de uma imagem gráfica selecionada se tiver um
editor de imagens no computador. Clique em Editar imagem no menu
Ferramentas. Isto ativará o editor de imagem associado aos arquivos BMP no
sistema Windows e carregará uma imagem gráfica. Edite a imagem gráfica e, em
seguida, feche o editor para que ela seja reincorporada ao Editor de texto. Não



                                            Edição de texto e de imagem        75
altere o tamanho, a resolução ou o tipo da imagem gráfica, porque isto impedirá
                         a sua reincorporação.
                         Tabelas
                         As tabelas são exibidas no Editor de texto em grades. Mova o cursor para uma
                         área da tabela. Ele muda de aparência, permitindo que você mova as linhas de
                         grade. Você também pode usar as réguas do Editor de texto para modificar uma
                         tabela. Modifique a colocação de texto em células de tabela com os botões de
                         alinhamento na barra de ferramentas Formatação e os controles de tabulação na
                         régua. Ao salvar o documento em alguns tipos de arquivo, você pode escolher se
                         quer tabelas exportadas em grades ou como colunas separadas por tabulação ou
                         espaços.
                         Hyperlinks
                         Endereços de correio eletrônico e de páginas da Web podem ser detectados e
                         inseridos como links no texto reconhecido. Escolha Hyperlink ... no menu
                         Formatar para editar um link existente ou criar um novo. Um novo link pode
                         apontar para uma página da Web ou um arquivo. Use um menu de atalho para
                         excluir um link.
                         Editar no modo True Page
                         Os elementos da página estão contidos em caixas de texto, caixas de tabela e
                         caixas de imagem. Normalmente eles correspondem a zonas de texto, tabela e
                         imagens gráficas na imagem. Clique dentro de um elemento para ver a moldura
                         da caixa; elas possuem a mesma cor da zona correspondente. O tópico True Page
                         da Ajuda on-line fornece detalhes sobre as operações resumidas aqui.
                         Quadros têm molduras cinza e delimitam uma ou mais caixas. Eles são inseridos
                         quando uma moldura visível é detectada em uma imagem. Formate moldura de
                         quadros e tabelas e sombreamento com um menu de atalho ou escolhendo
                         Tabela ... no menu Formatar. O sombreamento de uma caixa de texto pode ser
                         especificado em seu menu de atalho. Para ativar um menu de atalho, clique com
                         o botão direito dentro de um elemento afastado de uma palavra marcada.
                         Áreas com várias colunas têm molduras cor-de-rosa e delimitam uma ou mais
                         caixas. Elas são detectadas automaticamente e exibem qual texto será tratado
                         como colunas quando exportado. Use menus de atalho para desagrupar áreas
                         com várias colunas e quadros, permitindo que seus elementos sejam
                         modificados. Você também pode agrupar elementos em quadros ou áreas com
                         várias colunas.
                         A ordem de leitura pode ser exibida e alterada. Clique na ferramenta Exibir
                         ordem de leitura na barra de ferramentas Formatação para que ordem seja
                         exibida por setas. Clique novamente para remover as setas. Clique na ferramenta
                         Alterar ordem de leitura para obter um conjunto de botões de reorganização ao
                         invés da barra de ferramentas Formatação. A ajuda sensível ao contexto explica
                         seu uso, assim como o tópico Ordem de leitura da Ajuda on-line. Uma ordem
                         alterada é aplicada em visualizações NF e RFP. Ela modifica o modo como o
                         cursor se move pela página quando ela é exportada como True Page.


76   Correção e edição
Capítulo 4



Edição em tempo real
Permite que você modifique uma página reconhecida por meio de novo
zoneamento, sem a necessidade de processar a página inteira novamente.
Quando a edição em tempo real estiver ativada, alterações de zona (exclusão,
desenho, redimensionamento, mudança de tipo) provocam imediatamente
mudanças na página reconhecida. De modo oposto, quando você modifica
elementos na visualização True Page no Editor de texto, isto muda as zonas
naquela página. O zoneamento em tempo real também pode ser usado com
páginas não reconhecidas.
Duas ferramentas vinculadas na barra de ferramentas Imagem controlam o
zoneamento em tempo real. Uma dessas ferramentas está ativa sempre que não
há reconhecimento em andamento.
Clique nisto para ativar a edição em tempo real. O sinal vermelho indica que
não existem alterações de zoneamento armazenadas.
Clique nisto para desativar a edição em tempo real. Suas alterações de
zoneamento são armazenadas; a ferramenta On-the-fly exibe um sinal verde para
indicar que existem alterações armazenadas. Para ativar essas alterações, siga um
dos procedimentos abaixo:
                    Clique na ferramenta On-the-fly com o sinal verde. As
                    alterações de zoneamento causarão mudanças no Editor de
                    texto.
                     Clique no botão Executar OCR para que a página inteira
                     seja reconhecida novamente, incluindo suas alterações de
                     zona.
Para obter detalhes sobre como as alterações são tratadas no zoneamento em
tempo real e seus efeitos nas visualizações do Editor de texto, consulte o tópico
Processamento em tempo real da Ajuda on-line.




                                                   Edição em tempo real        77
Leitura de texto em voz alta
                           O recurso Texto para fala não foi incluído no OmniPage SE. Ele está disponível
                           no OmniPage Pro 12.
                           Este recurso de fala é designado aos que possuem deficiência visual, mas também
                           pode ser útil para qualquer pessoa durante a verificação de texto. A fala é
                           controlada por movimentos do ponto de inserção no Editor de texto, que
                           podem ser controlados pelo mouse ou pelo teclado.

                    Para ouvir texto:                             Use estas teclas:
                                                                  Seta para direita ou para esquerda. Carac-
                    Um caractere por vez, para frente ou para
                                                                  teres de pontuação, números ou letras são
                    trás
                                                                  falados.
                    Palavra atual                                 Ctrl + ´1´ do teclado numérico
                    Uma palavra para a direita                    Ctrl + seta para direita
                    Uma palavra para a esquerda                   Ctrl + seta para esquerda
                    Uma única linha                               Coloque o ponto de inserção na linha
                    Próxima linha                                 Seta para baixo
                    Linha anterior                                Seta para cima
                    Frase atual                                   Ctrl + ´2´ do teclado numérico
                    Do ponto de inserção ao fim da frase          Ctrl + ´6´ do teclado numérico
                    Do ponto inicial da frase ao ponto de
                                                                  Ctrl + ´4´ do teclado numérico
                    inserção
                    Página atual                                  Ctrl + ´3´ do teclado numérico
                    Do início da página atual ao ponto de
                                                                  Ctrl + Home
                    inserção
                    Do ponto de inserção ao fim da página atual   Ctrl + End
                                                                  Ctrl + PgUp, PgDown ou botões de nave-
                    Página anterior, próxima ou qualquer página
                                                                  gação
                                                                  Cada caractere digitado é pronunciado, um
                    Caracteres digitados
                                                                  a um, incluindo pontuação.

                           O recurso de conversão de texto em fala é ativado ou desativado com o item
                           Modo de fala do menu Ferramentas ou com a tecla F5. Um segundo item de
                           menu Configurações de fala... permite que você selecione uma voz (por
                           exemplo, de homem ou mulher, para um certo idioma), velocidade de leitura e o
                           volume.
                           As três teclas de fala básicas são agrupadas no teclado numérico.


78   Correção e edição
Capítulo 4




+            1           2           3

          Falar a     Falar a       Falar a
          palavra     frase atual   página
          atual                     atual



Você também tem os seguintes controles do teclado:

 Para fazer isso:                    Use isso:
 Pausar/Continuar                    Ctrl + ´5´ do teclado numérico
                                     Ctrl + sinal de mais do teclado numérico
 Definir a velocidade mais alta
                                     (+)
                                     Ctrl + sinal de menos do teclado numérico
 Definir a velocidade mais baixa
                                     (–)
                                     Ctrl + sinal de asterisco do teclado
 Restaurar velocidade
                                     numérico (*)


Existem planos para oferecer programas de fala para os seguintes idiomas: Inglês,
francês, alemão, italiano, português e espanhol. Consulte o arquivo Leiame para
obter as últimas informações. Somente um sistema de fala será instalado com o
OmniPage Pro, dependendo da escolha de idioma no início da instalação. Se
você especificar um idioma sem sistema de fala disponível, será instalado o
inglês.
Se você tiver sistemas de fala compatíveis com SAPI para outros idiomas em seu
computador, eles serão detectados e disponibilizados. As vozes deles serão
oferecidas na caixa de diálogo Configurações de fala. Uma vez que você tiver
associado uma voz a um idioma, o OmniPage Pro se lembrará disso e alternará
as vozes de acordo com o idioma de reconhecimento de seu documento.




                                              Leitura de texto em voz alta         79
80   Correção e edição
Capítulo 5

             Gravação e
             exportação
             Uma vez que você tenha adquirido pelo menos uma imagem para um
             documento, você pode exportá-la para um arquivo. Uma vez que você tenha
             reconhecido pelo menos uma página, você pode exportar os resultados do
             reconhecimento – uma página única, páginas selecionadas ou o documento
             inteiro – para um aplicativo de destino salvando em arquivo, copiando para a
             Área de transferência ou enviando para uma aplicação de correio eletrônico.
             Sempre é possível salvar como um Documento do OmniPage.
             Este capítulo apresenta os seguintes tópicos:
                 x    Gravação de imagens originais
                 x    Gravação dos resultados de reconhecimento
                        • Salvar um documento enquanto você trabalha
                        • Selecionar um nível de formatação
                        • Selecionar opções avançadas de salvamento
                        • Salvar como PDF
                 x    Copiar páginas para a Área de transferência
                 x    Enviar páginas via correio


             Um documento continua no OmniPage SE após a exportação. Isto permite que
             você salve, copie ou envie suas páginas repetidamente, por exemplo com níveis
             diferentes de formatação, usando tipos de arquivos, nomes ou locais diferentes.
             Você também pode adicionar ou reconhecer novamente páginas ou modificar o
             texto reconhecido.
             Com processamento automático e usando o Assistente de OCR, você especifica
             o primeiro destino de gravação antes do processamento iniciar. Quando a última


                                                  OmniPage SE Manual do usuário             81
página disponível é reconhecida (ou corrigida, se isto foi solicitado), surge uma
                             caixa de diálogo de exportação.
                             Você pode especificar a exportação a qualquer momento que o programa não
                             estiver ocupado. Se você pedir para exportar um documento com páginas não
                             reconhecidas, será perguntado se elas devem ser reconhecidas antes. Se você
                             responder Não, somente os resultados das páginas reconhecidas serão
                             exportados. Se as zonas tiverem sido modificadas em páginas reconhecidas, você
                             será convidado a reconhecer novamente as páginas antes de exportar.



                             Gravação de imagens originais
                             Você pode salvar as imagens originais em disco em uma ampla variedade de
                             tipos de arquivos. Consulte “Tipos de arquivo para abrir e salvar imagens” na
                             página 98.

                             1. Escolha Salvar imagem... no menu Arquivo. Na caixa de diálogo que
                                aparece, selecione um local de pasta e um tipo de arquivo para suas imagens.
                                Digite um nome de arquivo.

                             2. Selecione para salvar apenas a imagem da zona atual, a imagem da página
                                atual, imagens da página selecionada ou todas as imagens no documento.
                                Nos dois últimos casos, você pode ter todas as imagens em um único
                                arquivo de imagem de várias páginas, contanto que defina o tipo de arquivo
                                TIFF, MAX ou DCX. Caso contrário, cada imagem é colocada em um
                                arquivo separado. O OmniPage SE adiciona sufixos numéricos ao nome de
                                arquivo que você fornece, para gerar nomes de arquivos exclusivos.

                             3. Clique em OK para salvar as imagens como especificado. As zonas e o texto
                                reconhecido não são salvos com o arquivo. Se possível, o arquivo é salvo
                                como exibido: isto é, em preto e branco, tons de cinza ou em cores. As
                                imagens em preto e branco são salvas com as suas resoluções originais. As
                                imagens coloridas e em tons de cinza são reduzidas a aproximadamente 150
                                dpi.


                                      Para ver o tamanho da imagem e a resolução original de uma imagem, passe o
                                      cursor sobre sua miniatura no painel de Imagem.
                                      En OmniPage Pro você pode salvar seu documento em cinco variantes do formato
                                      PDF. Duas delas salvam as imagens originais, as outras salvam os resultados do
                                      reconhecimento. Consulte as seguintes seções. Salvar como PDF não está
                                      disponível no OmniPage SE




82   Gravação e exportação
Capítulo 5



                       Gravação dos resultados de reconhecimento
                       Você pode salvar as páginas reconhecidas em disco em uma ampla variedade de
                       tipos de arquivos. Consulte “Tipos de arquivo para salvar resultados de
                       reconhecimento” na página 99.
                       1. Escolha Salvar como... no menu Arquivo ou clique no botão Exportar
                          resultados na barra de ferramentas do OmniPage com Salvar como arquivo
                          selecionado na lista suspensa.
                       2. A caixa de diálogo Salvar como aparece, como mostrado em sua forma
                          expandida.




Selecione isto para                                                             Clique em Avançado
abrir                                                                           para abrir o painel
automaticamente o                                                               inferior e Básico para
arquivo salvo em                                                                fechá-lo.
seu aplicativo de
destino.
                                                                               Clique nisto para
                                                                               visualizar e alterar as
                                                                               opções de saída para o
Escolhas possíveis:                                                            atual tipo de arquivo.
Todas as páginas
Página atual                                                  Escolhas possíveis:
Páginas selecionadas
                                                              Criar um arquivo para todas as páginas
Selecione páginas                                             Criar um arquivo por página
com as miniaturas ou                                          Criar um novo arquivo a cada página em
no Gerenciador de                                             branco.
documentos.                                                   Criar um novo arquivo para cada arquivo
                                                              de imagem.

                       3. Selecione um local de pasta e um tipo de arquivo para o seu documento. O
                          tipo de arquivo OPD especial é o último na lista de tipo de arquivos. Em
                          seguida selecione um nível de formatação para o documento. Consulte
                          “Selecionar um nível de formatação” na página 85.
                       4. Digite um nome de arquivo. Clique no botão Avançado se desejar
                          especificar um intervalo de páginas, uma opção de separação de arquivo ou
                          outras opções de salvamento. Selecione-as como desejado. Consulte
                          “Selecionar opções avançadas de salvamento” na página 86.


                                                  Gravação dos resultados de reconhecimento          83
5. Clique em OK. O documento é salvo em disco como especificado. Se Salvar
                                e iniciar estiver selecionado, o arquivo exportado aparecerá em seu aplicativo
                                de destino; isto é, o aplicativo associado com o tipo de arquivo selecionado
                                no sistema Windows ou nas opções avançadas de salvamento para o
                                conversor do tipo de arquivo.


                                      Imagens gráficas, grades de tabela e outras propriedades são salvas no documento
                                      apenas se o tipo de arquivo selecionado suportá-las e se elas forem especificadas
                                      para retenção nas configurações avançadas (Opções do conversor) para o atual tipo
                                      de arquivo.
                                      Se mais de um arquivo de exportação for criado, o OmniPage SE associará sufixos
                                      numéricos ao seu nome de arquivo para criar nomes exclusivos de arquivo.
                                      Se você selecionar Criar um novo arquivo a cada página em branco com entrada de
                                      arquivos de imagem, você pode inserir arquivos de imagem vazios no documento.
                                      Consulte “Entrada de arquivos de imagem” na página 50.
                                      Se você selecionar Criar um novo arquivo para cada arquivo de imagem, não é
                                      necessário um nome de arquivo. Cada arquivo de saída obterá seu nome do arquivo
                                      de entrada que o gerou, mudando apenas a extensão.


                             Salvar um documento enquanto você trabalha
                             Clique na ferramentas Salvar na barra de ferramentas Padrão ou escolha Salvar
                             no menu Arquivo para salvar as alterações no documento atual conforme você
                             trabalha. Se você fizer isto com um documento sem título, a caixa Salvar como
                             aparece.
                             No caso de um documento com título, o comando Salvar salva-o com o nome e
                             tipo de arquivo de sua última gravação, como exibido na barra de títulos. Isto só
                             é exibido se o documento inteiro foi salvo.
                             Se o documento foi salvo pela última vez como um documento OmniPage, o
                             comando de gravação atualiza este documento: as imagens novas ou alteradas,
                             zoneamento alterado, resultados de reconhecimento e treinamento são todos
                             salvos. Se o documento foi salvo pela última vez como um outro tipo qualquer
                             de arquivo, somente as alterações nos resultados de reconhecimento são salvas.
                             Se você quiser trabalhar com o seu documento novamente no OmniPage SE em
                             uma sessão posterior, salve-o como um documento do OmniPage. Este é um
                             tipo de arquivo de saída especial. Ele salva as imagens originais com os resultados
                             de reconhecimento, configurações e treinamento. Consulte “Documentos do
                             OmniPage” na página 31. As referências a treinamento não se aplicam ao
                             OmniPage SE.



84   Gravação e exportação
Capítulo 5


A caixa de diálogo Salvar como lista os tipos de arquivo disponíveis em sua lista
suspensa Salvar como tipo. O documento do OmniPage é o último formato na
lista.
Se você salvar o documento primeiramente como um documento do OmniPage
(por exemplo como memo.opd), modificá-lo posteriormente e salvá-lo como
arquivo de texto (por exemplo como memo.txt) e, em seguida, modificá-lo
novamente e clicar em Salvar, as alterações recentes são salvas no arquivo
memo.txt, não no OPD. Ao fechar o documento ou sair do programa, você será
avisado para salvar o documento se ele não tiver sido salvo como um documento
do OmniPage ou se houver alterações desde a última gravação de OPD.


Selecionar um nível de formatação
O nível de formatação para exportação é definido no momento da exportação,
na caixa de diálogo Salvar como, na caixa de diálogo Copiar para Área de
transferência ou na caixa de diálogo Enviar como correio. Três desses níveis
correspondem às visualizações de formatação do mesmo nome no Editor de
texto. Entretanto, o nível a ser aplicado na hora de salvar é independente da
visualização de formatação exibida no Editor de texto. Ao exportar para arquivo
ou correio, primeiro especifique um tipo de arquivo. Isso determina quais níveis
de formatação estão disponíveis. Uma tabela no Capítulo 6 resume estas
informações. Consulte “Tipos de arquivo para salvar resultados de
reconhecimento” na página 99.
Os níveis de formatação são:
Sem formatação (NF)
Exporta texto simples sem colunas e alinhado à esquerda em uma única fonte e
único tamanho de fonte. Ao exportar para os tipos de arquivo Texto ou
Unicode, as imagens gráficas e tabelas não são suportadas. Você pode exportar
texto simples para quase todos os tipos de arquivo e aplicativos de destino; nestes
casos as imagens gráficas, tabelas e marcadores podem ser mantidos.
Visualização Preservar fontes e parágrafos (RFP)
Exporta texto sem colunas com estilo de fonte e parágrafo, juntamente com
imagens gráficas e tabelas. Isto está disponível para quase todos os tipos de
arquivo.
Visualização de Página ligada (FP)
Mantém o layout original das páginas, incluindo colunas. Isto é feito sempre que
possível com as configurações de coluna e recuo, não com quadros ou caixas de
texto. O texto fluirá de uma coluna para outra, o que não acontece quando são
usadas caixas de texto. O OmniPage SE não oferece o recurso de saída de página
ligada. Esse recurso está disponível somente no OmniPage Pro.



                               Gravação dos resultados de reconhecimento        85
True Page (TP)
                             Mantém o layout original das páginas, incluindo colunas. Isto é feito com texto,
                             imagens, caixas de tabelas e quadros. Isto é oferecido apenas para aplicativos de
                             destino capazes de tratar esses elementos.
                             Planilha
                             Exporta resultados de reconhecimento em formato tabular, adequado para uso
                             em aplicativos de planilha.
                             A quebra de colunas das exportações NF e RFP é executada da esquerda para a
                             direita e de cima para baixo:

                                    Página                                                     Resultado sem
                                    original                                                   colunas




                             Antes de exportar, verifique nas visualizações NF e RFP se a ordem dos
                             elementos sem colunas está correta. Caso contrário, alterne para a visualização
                             True Page e clique na ferramenta Exibir ordem de leitura para que a ordem seja
                             exibida por setas. Use a ferramenta Alterar ordem de leitura para especificar uma
                             ordem diferente. Áreas com várias colunas mostram quais colunas estão
                             vinculadas. Se esta vinculação não for adequada, desagrupe a área e mude a
                             ordem dos elementos dentro dela.


                             Selecionar opções avançadas de salvamento
                             Clique no botão Opções do conversor na parte avançada da caixa de diálogo
                             Salvar como para ter um controle preciso sobre a exportação. Isso faz surgir uma
                             caixa de diálogo com o nome do tipo atual de arquivo. Ela apresenta uma série
                             de opções adaptadas para este tipo de arquivo. Primeiro, confirme ou altere o
                             nível de formatação, pois ele influencia quais outras opções serão apresentadas.
                             Selecione as opções como desejar. A Ajuda on-line fornece detalhes sobre como
                             fazê-lo.
                             Clique em Aplicar para que as configurações alteradas sejam aplicadas apenas ao
                             atual salvamento.


                             Clique em Valores padrão para que todas as configurações voltem aos valores
                             padrão para o atual tipo de arquivo.




86   Gravação e exportação
Capítulo 5


Clique em Salvar para que as configurações alteradas sejam aplicadas ao
salvamento atual e também armazenadas como configurações que serão
aplicadas no futuro sempre que este tipo de arquivo for selecionado novamente
para salvamento.




O programa atualmente associado ao tipo de arquivo escolhido para o recurso
Salvar e iniciar é exibido na parte inferior da caixa de diálogo. Clique no botão
dos três pontos para especificar um programa diferente.
Para criar seu próprio conversor personalizado, prepare suas configurações,
clique em Novo conversor, forneça um nome e então clique em OK. Outra
alternativa é primeiro nomear o conversor, alterar as configurações e depois
clicar em Salvar. Conversores personalizados são úteis para tarefas repetitivas,
como a publicação de uma revista semanal. Desta forma todas as páginas
reconhecidas podem ser exportadas com sua formatação adaptada para o uso
pretendido. Você também pode criar um conjunto de conversores
personalizados para um determinado tipo de arquivo definindo as opções de
salvamento para cada nível de formatação de saída, por exemplo: RTF Sem
formatação, RTF Manter fontes e parágrafos e RTF True Page.
Você pode mudar as opções do conversor sem salvar nada em arquivo. Inicie a
caixa de diálogo Conversores de exportação no menu Ferramentas. Selecione o
conversor desejado e clique no botão Opções. Neste caso, o botão Aplicar não
está disponível.




                             Gravação dos resultados de reconhecimento             87
Salvar como PDF
                             Isso não se aplica ao OmniPage SE.
                             No OmniPage Pro 12 você tem cinco opções ao salvar para arquivos PDF
                             (Portable Document Format).
                             PDF (Normal):
                             As páginas são exportadas conforme aparecem no Editor de texto na visualização
                             True Page. O arquivo PDF pode ser visualizado e pesquisado em um
                             visualizador de PDF e editado em um editor de PDF.
                             PDF Editado:
                             Use este formato se você fez mudanças significativas de edição nos resultados do
                             reconhecimento. Você vê três opções de nível de formatação, incluindo True
                             Page. O arquivo PDF pode ser visualizado, pesquisado e editado.
                             PDF com imagens em texto:
                             O arquivo PDF é somente visualizável e não pode ser modificado em um editor
                             de PDF. As imagens originais são exportadas, mas há um arquivo de texto
                             vinculado atrás de cada imagem, assim o texto pode ser procurado. Uma palavra
                             encontrada fica em destaque na imagem.
                             PDF com substitutos de imagem:
                             Como no caso de PDF (Normal), mas as palavras contendo caracteres rejeitados
                             e suspeitos possuem sobreposições de imagem, assim estas palavras incertas são
                             exibidas como no documento original. O arquivo PDF pode ser visualizado,
                             pesquisado e editado.
                             PDF, somente imagem:
                             As imagens originais são exportadas. O arquivo PDF só pode ser visualizado e
                             não pode ser modificado em um editor de PDF e o texto não pode ser
                             procurado.



                             Copiar páginas para a Área de transferência
                             Você pode copiar os resultados do reconhecimento da página atual, de páginas
                             selecionadas ou de todas as páginas do documento para a Área de transferencia.
                             A cópia é acompanhada por um monitor de progresso. Em seguida, você pode
                             colar o conteúdo da Área da transferência em outro aplicativo.
                             A formatação de texto, como negrito e itálico, é mantida quando você cola em
                             um aplicativo compatível com informações de RTF 6.0/95. Caso contrário,
                             somente texto simples ou texto Unicode serão colados. As imagens gráficas são
                             mantidas se o aplicativo oferecer suporte para inserção de imagens.


88   Gravação e exportação
Capítulo 5


w Para copiar páginas para a Área de transferência:
    •   Com o processamento automático, selecione Copiar para Área de
        transferência como o comando na lista suspensa Exportar resultados na
        barra de ferramentas do OmniPage ou no Assistente de OCR. A caixa de
        diálogo Copiar para Área de transferência aparece logo que a última página
        disponível tiver sido reconhecida ou corrigida.
    •   Com processamento manual, selecione Copiar para Área de transferência na
        lista suspensa Exportar resultados e, em seguida, clique em seu botão. Surge
        imediatamente a caixa de diálogo Copiar para Área de transferência.
    •   Especifique um intervalo de páginas e um nível de formatação a serem
        usados e então clique em OK para iniciar a cópia.


             Você pode executar uma operação de copiar e colar para a página atual usando o
             recurso arrastar e soltar. Pressione e mantenha pressionadas as teclas Ctrl+Tab
             enquanto clica na página atual no painel de Imagem e arrasta o cursor para um
             aplicativo de destino com um documento aberto. O conteúdo da página será
             colado na posição do cursor. O OCR será executado caso necessário.




    Enviar páginas via correio
    Você pode enviar resultados de reconhecimento como um ou mais arquivos
    anexados a uma mensagem de correio se tiver instalado um aplicativo compatível
    com MAPI, como o Microsoft Outlook.

w Para enviar um documento por correio eletrônico:
    •   Com o processamento automático, selecione Enviar como correio como
        configuração na lista suspensa Exportar resultados na barra de ferramentas
        do OmniPage. A caixa de diálogo Enviar correio aparece assim que a última
        página disponível no documento for reconhecida ou corrigida.
    •   Com processamento manual, selecione Enviar como correio na lista
        suspensa Exportar resultados e, em seguida, clique em seu botão. A caixa de
        diálogo Enviar como correio aparece imediatamente.
    A qualquer momento que o programa não estiver ocupado, escolha Enviar como
    correio no menu Arquivo para chamar a caixa de diálogo Enviar como correio.




                                                     Enviar páginas via correio            89
1. Esta caixa de diálogo permite que você especifique um tipo de arquivo, um
                                intervalo de página, um nível de formatação e opções de anexo: um anexo
                                para todas as páginas, um anexo por página, anexo novo a cada página em
                                branco ou um anexo para cada arquivo de entrada. Defina todas as opções e
                                clique em OK.

                             2. Faça o login no seu aplicativo de correio se você for solicitado a fazê-lo.

                             3. O aplicativo de correio aparece com os anexos em uma nova mensagem
                                vazia. Os anexos assumem o nome usado na última gravação do documento
                                em OmniPage SE ou ‘Sem título de OmniPage’. A extensão de arquivo
                                adequada é adicionada e sufixos numéricos são usados para vários anexos.

                             4. Coloque o destinatário na mensagem de correio, adicione o texto da
                                mensagem como desejado e clique no botão Enviar.

                                      O programa pode detectar endereços de email enquanto reconhece páginas e
                                      transmite-as para o Editor de texto. Se você clicar em um endereço, seu aplicativo
                                      de correio aparece com uma nova mensagem vazia contendo apenas o endereço de
                                      email.




90   Gravação e exportação
Capítulo 6

             Informações técnicas
             Este capítulo fornece informações sobre solução de problemas e outras
             informações técnicas sobre o uso do OmniPage SE. Leia o arquivo Leiame on-
             line e outros tópicos de ajuda ou visite as páginas da ScanSoft na Web. Sua seção
             sobre scanner contém informações detalhadas e regularmente atualizadas sobre
             configuração e suporte de scanner. O arquivo Leiame contém informações de
             última hora relativas ao OmniPage SE. O acesso ao arquivo Leiame e às páginas
             da ScanSoft na Web é fornecido no menu Ajuda.
             Este capítulo contém as seguintes informações:
                 x    Solução de problemas
                        • Soluções para tentar primeiro
                        • Teste do OmniPage SE
                        • Aumentar recursos de memória
                        • Aumentar espaço em disco
                        • O texto não é reconhecido corretamente
                        • Problemas com reconhecimento de fax
                        • Problemas de desempenho ou de sistema durante o OCR
                 x    Suporte a ODMA
                 x    Recursos avançados em Programar OCR
                 x    Tipos de arquivo compatíveis
                        • Tipos de arquivo para abrir e salvar imagens
                        • Tipos de arquivo para salvar resultados de reconhecimento
                 x    Desinstalação do software




                                                  OmniPage SE Manual do usuário            91
Solução de problemas
                            Apesar do OmniPage SE ser projetado para ser fácil de usar, algumas vezes
                            ocorrem problemas. Muitas das mensagens de erro contêm descrições auto-
                            explicativas sobre o que fazer – verificar conexões, fechar outros aplicativos para
                            liberar memória etc. Algumas vezes, isto é tudo que a solução de problemas lhe
                            ajuda a fazer.
                            Consulte a documentação do Windows para obter informações sobre como
                            otimizar o desempenho do seu sistema e de seu aplicativo.

                            Soluções para tentar primeiro
                            Experimente estas soluções se você estiver tendo problemas ao iniciar ou ao usar
                            o OmniPage SE:
                                x    Certifique-se de que seu sistema atenda a todos os requisitos listados.
                                     Consulte “Requisitos do sistema” na página 12.
                                x    Certifique-se de que o scanner está conectado e que todas as conexões
                                     de cabo estão seguras.
                                x    Visite a seção de suporte do site da ScanSoft na Web em
                                     www.scansoft.com. Ela contém notas técnicas sobre questões relatadas
                                     freqüentemente sobre uso do OmniPage. As nossas páginas na Web
                                     também podem oferecer assistência sobre o processo de instalação e
                                     solução de problemas.
                                x    Desligue o computador e o scanner, ligue o scanner novamente e, em
                                     seguida, reinicie o computador. Certifique-se de que os aplicativos
                                     estão funcionando adequadamente.
                                x    Use o software que veio com o scanner para verificar se o scanner
                                     funciona adequadamente antes de usá-lo com o OmniPage SE.
                                x    Certifique-se de que você possui os drivers corretos para o scanner,
                                     impressora e placa de vídeo. Visite a página da Scansoft na Web através
                                     do menu Ajuda e consulte sua seção sobre scanner para obter mais
                                     informações.
                                x    Execute ScanDisk para Windows 98 ou ME ou Check Disk para
                                     Windows NT, 2000 e XP para verificar se há erros no disco rígido.
                                     Consulte a ajuda on-line do Windows para obter mais informações.
                                x    Desfragmente o seu disco rígido. Consulte a ajuda on-line do Windows
                                     para obter mais informações.
                                x    Desinstale e reinstale o OmniPage SE, como descrito na última seção,
                                     ”Desinstalação do software” na página 100.



92   Informações técnicas
Capítulo 6


    Teste do OmniPage SE
    Reiniciar o Windows 98, Me, 2000 ou XP no modo seguro ou o Windows NT
    no modo VGA permite que você teste o OmniPage SE em um sistema
    simplificado. Isto é recomendado quando você não consegue resolver problemas
    de queda do sistema ou se o OmniPage SE tem a execução interrompida.
    Consulte a ajuda on-line do Windows para obter mais informações.


             O scanner não funcionará com o OmniPage SE no modo seguro ou em modo
             VGA, portanto, não teste problemas de scanner nesta configuração.


w   Para testar o OmniPage SE no modo seguro (Windows 98, 2000, Me ou
    XP):
    1. Reinicie o computador no modo de segurança pressionando F8
       imediatamente depois de ver a mensagem ‘Iniciando Windows’.
    2. Inicie o OmniPage SE e tente efetuar OCR em uma imagem. Use um
       arquivo conhecido de imagem, por exemplo, um dos arquivos de amostra de
       imagem fornecidos.
               • Se o OmniPage SE não iniciar ou executar adequadamente no
                 modo seguro, pode haver um problema com a instalação.
                 Desinstale e reinstale o OmniPage SE (consulte o final deste
                 capítulo) e, em seguida, execute-o no modo seguro do Windows.
               • Se o OmniPage SE funcionar no modo seguro, um driver de
                 dispositivo no seu sistema pode estar interferindo na operação do
                 OmniPage SE. Solucione o problema reiniciando o Windows no
                 modo de confirmação passo a passo. Consulte a ajuda on-line do
                 Windows para obter mais informações.

w   Para testar o OmniPage SE no modo VGA (Windows NT):
    1. Reinicie o computador.
    2. Selecione a estação de trabalho do Windows NT, versão 4.00 [modo VGA]
       e pressione Enter.
    3. Pressione Ctrl+Alt+Del e selecione o Gerenciador de tarefas.
    4. Na caixa de diálogo Gerenciador de tarefas, selecione todos os aplicativos
       em segundo plano e clique em Finalizar tarefa. Consulte a ajuda on-line do
       Windows para obter mais informações.
    5. Inicie o OmniPage SE e tente efetuar OCR em uma imagem. Use um
       arquivo de imagem conhecido, como um dos arquivos de amostra
       fornecidos.


                                                      Solução de problemas          93
Você também pode executar o OmniPage SE a partir de uma linha de comando em
                                     seu próprio modo seguro. Escolha IniciarExecutar, procure pelo arquivo
                                     OmniPage.exe e adicione a opção de linha de comando /safe. Isto inicia o
                                     programa, mas ignora as configurações armazenadas anteriormente e não tenta
                                     recuperar um documento que tenha sofrido um término anormal.


                            Aumentar recursos de memória
                            O OmniPage SE pode funcionar mal sob as condições de pouca memória. Isto
                            pode ser indicado por várias mensagens de erro ou se o OmniPage SE funciona
                            lentamente e acessa o disco rígido freqüentemente. Experimente estas soluções
                            para condições de pouca memória:
                                x   Reinicie o computador.
                                x   Feche os outros aplicativos abertos para liberar memória.
                                x   Feche os aplicativos do OmniPage desnecessários.
                                x   Desfragmente o disco rígido para liberar blocos contíguos de espaço em
                                    disco. Consulte a ajuda on-line do Windows para obter instruções.
                                x   Aumente a quantidade de espaço em disco rígido disponível.
                                x   Aumente a memória física do computador (RAM). Mais memória
                                    otimiza o desempenho de OCR. Consulte “Requisitos do sistema” na
                                    página 12.

                            Aumentar espaço em disco
                            Podem ocorrer problemas se o seu sistema ficar com pouco ou nenhum espaço
                            em disco. Experimente estas soluções para problemas de pouco espaço em disco:
                                x   Esvazie a lixeira do Windows.
                                x   Feche todos os aplicativos abertos e exclua os arquivos *.tmp da pasta
                                    Temp. Normalmente, esta pasta está localizada na pasta Windows.
                                x   Execute o ScanDisk ou o Check Disk
                                x   Faça backup de arquivos desnecessários em discos flexíveis ou outra
                                    mídia e exclua-os do disco rígido.
                                x   Remova os aplicativos do Windows que você não usa.
                                x   Desfragmente o seu disco rígido.
                                x   Limpe a cache do seu navegador de Web e limite o seu tamanho.




94   Informações técnicas
Capítulo 6


O texto não é reconhecido corretamente
Tente estas soluções se uma parte do documento original não for convertida para
texto adequadamente durante o OCR.
     x Olhe na imagem da página original e assegure-se de que todas as áreas
         de texto estão associadas a zonas de texto. Se uma área não estiver
         dentro de uma zona, ela geralmente é ignorada durante OCR. Consulte
         a seção sobre como criar e modificar as zonas, ”Trabalho com zonas” na
         página 59.
     x Certifique-se de que as zonas de texto são identificadas corretamente.
         Identifique novamente os tipos de zona e o conteúdo, se necessário, e
         efetue OCR no documento novamente. Consulte “Tipos de zona e
         propriedades” na página 57.
     x Certifique-se de que você não carregou um gabarito inadequado por
         engano. Se as bordas de zona cortarem o texto, o reconhecimento é
         prejudicado.
     x Ajuste os controles deslizantes de brilho e contraste no painel Scanner
         da caixa de diálogo Opções. Talvez você precise experimentar
         combinações de configurações diferentes para chegar aos resultados
         desejados.
     x Verifique a resolução na imagem original. Passe o cursor sobre uma
         miniatura de página para obter uma janela popup. Se a resolução
         estiver significativamente acima ou abaixo de 300 dpi, provavelmente o
         reconhecimento será afetado.
     x Certifique-se de que os idiomas corretos do documento estão
         selecionados no painel OCR na caixa de diálogo Opções. Somente os
         idiomas incluídos no documento devem ser selecionados.
     x Ative o IntelliTrain e faça algumas correções. Provavelmente, isto
         ajudará com as fontes com estilo ou com documentos degradados
         uniformemente. Se o IntelliTrain estava funcionando, experimente
         desativá-lo – em alguns tipos de documentos degradados, ele pode não
         ajudar. As referências a treinamento não se aplicam ao OmniPage SE.
     x Execute treinamento manual ou edite o treinamento existente para
         remover treinamentos mal sucedidos.
     x Se você usa True Page como a visualização do Editor de texto ou para
         exportação, o texto reconhecido é disposto em caixas de texto ou
         quadros. Pode haver texto oculto se houver uma caixa de texto muito
         pequena. Para visualizar o texto, coloque o cursor na caixa de texto e
         use as teclas de seta no seu teclado para rolar para a parte superior,
         inferior, esquerda ou direita do quadro.
     x Verifique se há poeira, sujeira ou arranhões no vidro, nos espelhos e nas
         lentes de seu scanner. Limpe-os se necessário.


                                                  Solução de problemas       95
O OmniPage SE reconhece apenas caracteres impressos por máquinas, como
                                     impressão a laser ou texto escrito por máquina de escrever. Ele pode lidar com
                                     caracteres matriciais, apesar de que a precisão pode ser inferior em textos de
                                     qualidade baixa. Ele não pode ler texto escrito a mão. Entretanto, pode reter
                                     assinaturas e outros textos escritos à mão como uma imagem gráfica.


                            Problemas com reconhecimento de fax
                            Tente estas soluções para melhorar a precisão de OCR sobre imagens de fax:
                                x Peça aos remetentes para usarem documentos originais e limpos se
                                     possível.
                                x Peça aos remetentes para selecionarem o modo Melhor ou Otimizado
                                     quando enviarem um fax. Isto produz uma resolução de 200 x 200 dpi.
                                x Peça aos remetentes para transmitirem arquivos diretamente para seu
                                     computador via fax-modem se vocês dois o tiverem. Você pode salvar
                                     as imagens de fax como arquivos de imagem e, em seguida, carregá-los
                                     no OmniPage SE. Consulte “Entrada de arquivos de imagem” na
                                     página 50.


                            Problemas de desempenho ou de sistema durante o OCR
                            Tente estas soluções se uma falha no sistema ocorrer durante o OCR ou se o
                            processamento demorar muito tempo:
                                x Resolva os problemas de falta de memória e espaço em disco. Consulte
                                     “Teste do OmniPage SE” na página 93.
                                x Minimize todos os aplicativos ou clique em Alt+Tab para verificar se há
                                     mensagens de erro do Windows.
                                x Verifique a qualidade da imagem. Consulte a documentação do
                                     scanner sobre as formas para melhorar a qualidade das imagens
                                     digitalizadas.
                                x Divida páginas complexas (com muito texto e imagens gráficas ou com
                                     formatação elaborada) em tarefas menores. Delimite as zonas
                                     manualmente ou modifique as zonas criadas automaticamente para
                                     efetuar OCR em uma área de página por vez. Veja ”Trabalho com
                                     zonas” na página 59.
                                x Reinicie o Windows 98, Me, 2000 ou XP no modo seguro ou
                                     Windows NT no modo VGA e teste o OmniPage SE efetuando OCR
                                     nos arquivos de amostra incluídos.
                            Se você estiver realizando várias tarefas no mesmo momento, como
                            reconhecimento e impressão, o OCR pode demorar mais.


96   Informações técnicas
Capítulo 6



Suporte a ODMA
Isso não se aplica ao OmniPage SE. Se sua rede local inclui um Sistema de
Gerenciamento de Documentos (DMS) que suporta clientes ODMA, o
OmniPage Pro poderá trabalhar com ele. No OmniPage Pro surgirá então um
painel ODMA na caixa de diálogo Opções permitindo que você especifique
tipos de arquivos permitidos e outras configurações. Uma interface ODMA
substituirá as caixas de diálogo Carregar arquivo de imagem e Abrir documento
do OmniPage (OPD). Isso permite carregar arquivos de imagem e OPDs, um
por vez, do sistema de arquivos de rede ou de seu computador local. A caixa de
diálogo Salvar como fornecerá um botão Salvar para DMS para salvar
documentos reconhecidos neste sistema. Para obter detalhes, consulte a Ajuda
on-line.



Recursos avançados em Programar OCR
Isso não se aplica ao OmniPage SE. Programar OCR permite que você
especifique arquivos de entrada para uma tarefa. Algumas edições do OmniPage
Pro permitem que você especifique que todos os arquivos de um certo tipo em
uma ou mais páginas sejam processados. Essas edições também oferecem tarefas
de pasta observada. A primeira tela do Assistente de nova tarefa tem dois botões:
Arquivos e pastas. Ela também exibe uma opção Observar pastas para verificar
arquivos de entrada. Selecione esta opção e especifique uma ou mais pastas.
Todos os arquivos do(s) tipo(s) especificado(s) que entrarem na(s) pasta(s) serão
processados na chegada. No quinto painel do Assistente você pode especificar
tanto uma hora inicial quanto uma hora final para a tarefa de observação. Você
pode optar por não especificar uma hora final quando configurar a tarefa. Neste
caso, use o botão Modificar do Programar OCR para especificar uma hora final
posteriormente.
Também é possível interromper e retomar tarefas. O botão Visualizar permite
que você veja um registro, arquivo por arquivo, de todo o processamento
concluído dentro de uma tarefa selecionada. Quando uma tarefa está sendo
executada, uma janela de registro da tarefa fica disponível, exibindo o progresso,
arquivo por arquivo, e relatando quaisquer problemas de processamento.
O quarto painel do Assistente de nova tarefa permite que você especifique um
tipo de arquivo e escolha opções de separação de arquivo. Se você escolher Um
novo arquivo de saída para cada arquivo de entrada, você precisa especificar
apenas uma pasta, os arquivos de saída mantém os nomes dos arquivos de
entrada com as extensões modificadas. Se você escolher uma opção que requeira
vários arquivos de saída, você deve especificar um nome de arquivo e o programa
adiciona sufixos numéricos para gerar nomes de arquivos únicos. Se você
especificar a entrada de um conjunto de pastas, é possível especificar uma pasta
de saída diferente para cada pasta de entrada.

                                                      Suporte a ODMA           97
Tipos de arquivo compatíveis
                            O programa é compatível com uma ampla gama de tipos de arquivo para
                            imagem e texto.

                            Tipos de arquivo para abrir e salvar imagens
                                                                                                              PB, tons de
                 Tipo de arquivo               Extensão        Várias páginas         Abrir / Salvar
                                                                                                              cinza, cores
                 BMP, Bitmap                   bmp             Não                    Abrir e Salvar          Todos
                 DCX                           dcx             Sim                    Abrir e Salvar          Todos
                 GIF                           gif             n/a                    n/a                     n/a
                                                                                                              Tons de cinza,
                 JPEG                          jpg             Não                    Abrir e Salvar
                                                                                                              cores
                 MAX                           max             Sim                    Abrir e Salvar          Todos
                 PCX                           pcx             Não                    Abrir e Salvar          Todos
                                                                                      n/a
                 PDF                           pdf             n/a                                            n/a
                                                                                      (consulte a nota)
                 PNG                           png             Não                    Abrir e Salvar          Todos
                 TIFF compactado com G3        tif             Sim                    Abrir e Salvar          PB
                 TIFF compactado com G4        tif             Sim                    Abrir e Salvar          PB
                 TIFF compactado com
                                               tif             n/a                    n/a                     n/a
                 LZW
                 TIFF FX                       xif             Sim                    Abrir                   Todos
                 TIFF PackBits                 tif             Sim                    Abrir e Salvar          Todos
                 TIFF não compactado           tif             Sim                    Abrir e Salvar          Todos

                            Os arquivos de imagem de entrada podem ter resoluções de até 600 dpi, mas
                            recomenda-se 300 dpi (horizontalmente e verticalmente) para fornecer ótima
                            precisão de OCR. O programa armazena imagens em preto e branco em sua
                            resolução original, mas as imagens em cores e em tons de cinza normalmente
                            não são salvas com mais de 150 dpi. Isto significa que estes não são bons
                            candidatos para futuros processamentos OCR.
                            Passe o cursor sobre uma miniatura da imagem para obter uma janela
                            instantânea mostrando o tamanho e a resolução da imagem original.

                                       Se você tenta salvar uma imagem em preto e branco no formato JPEG, o programa oferecerá
                                       conversão para tons de cinza. Com TIFF G3 e G4, ele oferecerá conversão para preto e
                                       branco.
                                       No OmniPage Pro 12, há cinco opções para salvar em formato PDF. Duas delas, Apenas
                                       imagem e Imagem em texto, exportam imagens originais. Isto é feito na caixa de diálogo Salvar
                                       como. Esse recurso não está disponível no OmniPage SE. Além disso, o OmniPage SE não
                                       pode gerenciar arquivos GIF e TIFF LZW. Consulte “Salvar como PDF” na página 88.




98   Informações técnicas
Capítulo 6


                                 Tipos de arquivo para salvar resultados de reconhecimento
                                 Esta tabela mostra quais níveis de formatação estão disponíveis para cada tipo de
                                 arquivo.
                                                 Sem                 Página
                                        Exten-   for-                ligada       True    Pla-    Imagens
Tipo de arquivo                                           RFP                                                 Tabelas
                                        são      mata-               (consulte    Page    nilha   gráficas
                                                 ção                 a nota 1)

eBook (consulte a nota 1)               opf       q        q                                       qq           q
Excel 97, 2000                          xls       q        q                              q        qq           q
Excel 3.0 a 7.0                         xls       q        q                              q                     q
FrameMaker 5.5.3                        mif       q        q                                       qq           qq
Freelance Graphics                      txt       q        q                                                    ❍q
Harvard Graphics                        txt       q        q                                                    ❍q
HTML 4.0 (consulte a nota 1,2)          htm       q        q                      q                qq           q
HTML 3,2 (consulte a nota 2)            htm       q        q                              q        qq           q
Microsoft PowerPoint 97                 rtf       q        q                                       qq           qq
Microsoft Publisher 98                  rtf       q        q                                       qq           qq
Microsoft Word 6.0, 97, 2000, XP        doc       q        q          q           q                qq           qq
PageMaker 6.5.2                         doc       q        q                                       qq           qq
Quattro Pro para Windows 4.0, 8         xls       q        q                              q                     q
PDF (Normal) (consulte a nota 1)        pdf                                       q                qq           q
PDF Editado (consulte a nota 1)         pdf       q        q                      q                qq           qq
PDF com imagens em texto (1)            pdf                                       (q )             q            q
PDF com substitutos de imagem
                                        pdf                                       q                q            q
(consulte a nota 1)
PDF, somente imagem (1)                 pdf                                       (q )             q            q
RTF Word 2000, 97, 95/6.0 (3)           rtf       q        q          q           q                qq           qq
Ventura Publisher                       doc       q        q                                       q            qq
WordPad                                 rtf       q        q                                       qq           qq
WordPerfect 8, 9, 10                    wpd       q        q          q           q                qq           qq
WordPerfect 6.0, 6.1                    wpd       q        q                      q                qq           qq
WordPerfect 5,1, 0,5, 0,2               wp5       q        q                      q                qq           qq
XML (consulte a nota 1)                 xml                                       q                q            (q )
Texto e texto com quebras de linha
                                        txt       q        q                                                    ❍q
(consulte a nota 4)
Texto – Separado por vírgula (4)        csv       q        q                                                    q
Texto – Formatado (4)                   txt                                       q                             (q )
Documento do OmniPage (5)               opd                    Salvo conforme exibido              q            q



                                                                                 Tipos de arquivo compatíveis          99
Imagens gráficas
                             q Tipo de arquivo suporta imagens gráficas
                             qq Tipo de arquivo suporta imagens gráficas, com opção de exportação para
                                manter ou descartar imagens gráficas.
                             Tabelas
                             q Tipo de arquivo suporta tabelas em grades, não há opções de tratamento de
                                 tabela no momento da exportação
                             qq Tipo de arquivo suporta tabelas, escolha entre usar grades ou colunas sepa-
                                 radas por tabulação
                             ❍q Tipo de arquivo não suporta grades de tabela, escolha converter para colu-
                                 nas separadas por tabulação ou espaço
                             1   O OmniPage SE não oferece o recurso de saída de página ligada e de esses
                                 tipos de arquivo.
                             2   Ao salvar em HTML, todas as imagens gráficas são salvas em arquivos de
                                 imagem separados usando o formato JPEG.
                             3   Os resultados de reconhecimento são enviados para a Área de transferência no
                                 formato RTF 95/6.0 e serão colados neste formato se possível e como texto
                                 Unicode ou texto ASCII se não for possível.
                             4   Todos os formatos de texto estão disponíveis como Texto ou Unicode. O texto
                                 Unicode pode tratar a maior gama de caracteres com acento.
                             5   OmniPage SE pode abrir documentos criados pelo OmniPage SE ou pelo
                                 OmniPage Pro 12. Ele também pode abrir arquivos OPD criados pelo OmniPage
                                 Pro 10, 11 e sua Edição Especial. Esses arquivos entram no programa como
                                 documentos sem nome. Para manter um OPD no formato antigo e também salvá-
                                 lo como um novo OPD, escolha um nome diferente para evitar escrever sobre o
                                 arquivo antigo.




                             Desinstalação do software
                             Algumas vezes a desinstalação e reinstalação do OmniPage SE resolverá o
                             problema. Você também deve desinstalar o OmniPage SE antes de instalar o
                             OmniPage Pro 12 ou qualquer software OmniPage de avaliação. O programa de
                             desinstalação do OmniPage SE não removerá nenhum dos seguintes arquivos
                             criados pelo usuário:
                                  Gabaritos de zona (*.zon)
                                  Arquivos de treinamento (*.otd) (Isso não se aplica ao OmniPage SE.)
                                  Dicionários do usuário (*.ud)
                                  Documentos do OmniPage (*.opd)
                             Para desinstalar do Windows NT, 2000 ou XP, você precisa ter efetuado login
                             em seu computador com privilégios de administrador.



100   Informações técnicas
Capítulo 6


w   Para reinstalar ou desinstalar o OmniPage SE:
        x   Feche o OmniPage SE.
        x   Clique em Iniciar na barra de tarefas do Windows e escolha Painel de
            controle e Adicionar/Rremover programas.
        x   Selecione OmniPage SE e clique em Alterar.
        x   Clique em Avançar na caixa de diálogo que aparece.
        x   Selecione Remover todos ou Reparar todas e, em seguida, Avançar.
        x   Siga as instruções até que o processo tenha terminado.




                                                Desinstalação do software      101
102   Informações técnicas
Í      N D I C E                     R E M I S S I V O



A                                                 salvar em, 32                               marcadores, 68
                                             Assistente                                   Coluna Nota no Gerenciador de
A barra de menus, 25                              para configuração do scanner, 14            documentos, 30
Abertura de arquivos de imagem, 50, 98            para processamento, 45                  Coluna única
Acrescentar                                       para Programar OCR, 49, 97                  páginas, 53, 57
    a zonas, 60                              Assistente de nova tarefa, 49, 97                páginas com tabelas, 54
    páginas a um documento, 41               Atributos de caracteres, 75                  Colunas
    palavras a um dicionário de usuário,     Atualização para o OmniPage Pro, 19              em tabelas, 62
         68                                  Audição de textos lidos em voz alta, 78          no Gerenciador de documentos, 30
    treinamento a arquivos de                Aumentar espaço em disco, 94                 Comparação das palavras reconhecidas
         treinamento, 74                     Aumentar recursos de memória, 94                 com as originais, 68
ADF, 33, 50, 52                              Aviso para salvar dados de treinamento, 31   Concluir um documento, 41
Agrupar elementos, 76                                                                     Configuração do Direct OCR, 47
Ajuda
    on-line, 9                               B                                            Configuração do scanner, 14
                                                                                          Configurações
    Sensível ao contexto, 9, 25, 33          Barra de ferramentas de acoplamento e            efeito das configurações, 34
Ajuda sensível ao contexto, 9, 25, 33             flutuação, 25, 68                           na caixa de diálogo Opções, 33
Alimentador automático de documentos         Barra de ferramentas de flutuação, 25            no Assistente de OCR, 46
    (ADF), 33, 50, 52                        Barra de ferramentas de formatação, 24,          Obter texto, 47
Alternar entre o processamento manual e           25                                          para o Direct OCR, 47
    automático, 27, 43                       Barra de ferramentas de imagem, 24, 25           tipos de zona, 61
Ambiente, 24                                 Barra de ferramentas padrão, 24, 25          Conselho sobre problemas, 92
Ambiente do OmniPage, 24                     Barras de ferramentas de acoplamento, 25     Conteúdo dos documentos do OmniPage,
Ampliação de exibições, 24, 68               Botão Efetuar OCR, 40, 43                        84
Anexos a mensagens de correio, 89            Botão Exportar resultados, 41, 43, 83        Contraste, 33, 51, 95
Área de transferência, 41, 88                Botão Obter página, 40, 42                   Controle sobre o processamento, 42
Áreas com várias colunas, 26, 76             Brilho, 33, 51, 95                           Conversão de imagens, 98
Armazenar alterações de zoneamento, 77                                                    Conversores de exportação, 86
Arquivo de saída PDF, 98
Arquivos
                                             C                                            Copiar páginas para a Área de
                                             Caixa de diálogo Carregar arquivo de             transferência, 45, 88
    como destino de exportação, 82                                                        Correção
    como origem da imagem, 50                    imagem, 50
                                             Caixa de diálogo Corretor, 67                    em futuras sessões, 31
    mantido na desinstalação, 100                                                             opções, 34, 67
    opções de separação, 83, 90              Caixa de diálogo Enviar correio, 89
                                             Caixa de diálogo Opções, 33                  Correção de resultados de OCR, 67
    tipos, 83                                                                             Correção remota, 31
    tipos compatíveis, 98                    Caixa de ferramentas do OmniPage, 24,
                                                 27, 40                                   Correio, 41, 89
    tipos para exportação, 85, 99                                                         Criação de dados de treinamento, 74
Arquivos de imagem                           Caixas, 26, 76
    abrir, 98                                Caixas para texto reconhecido, 95
    amostras, 93                             Caracteres                                   D
    entrada, 22, 50                              não reconhecidos, 66                     Dados de treinamento não salvos, 31
    ordem de leitura, 50                         suspeitos, 66                            Desagrupar elementos, 76
    tipos, 98                                Caracteres não imprimíveis, 66               Descarregamento de um dicionário de
Arquivos de imagem de amostra, 36, 93        Carregar                                         usuário, 70
Arquivos de imagem de várias páginas, 50,        arquivos de treinamento, 74              Descarregar arquivos de treinamento, 74
    82, 98                                       Arquivos OPD, 31                         Descarregar gabaritos de zona, 63
Arquivos de imagem TIFF, 98                      gabaritos de zona, 54, 63                Descrição do layout, 40, 45, 53
Arquivos OPD                                     um dicionário de usuário, 70             Descrição do layout de documento, 40, 53
    definição, 31                            Colorido                                     Desenhar zonas no Direct OCR, 47
    propósito de, 32                             digitalizar, 51                          Desinstalação do software, 100
                                                 imagens, 82                              Dicionários, 45, 68


                                                                                 OmniPage SE Manual do usuário               103
Dicionários do usuário, 67, 70                  tempo real, 77                              colorido, 82
    acrescentar palavras, 67                    texto reconhecido, 75                       conversão, 98
    carregar, 70                           Editor de texto, 24, 26, 34, 66                  edição, 76
    descarregar, 70                        Efeito das configurações, 34                     gravação, 82, 98
    edição, 70                             Entrada                                          obtenção, 23, 42
    iniciando, 70                               de arquivo de imagem, 50                    planos de fundo, 54
Dicionários jurídicos, 68                       de arquivos PDF, 50, 98                     preto e branco, 82
Dicionários médicos, 68                         do scanner, 51                              qualidade, 51
Dicionários profissionais, 68              Entrada de arquivo PDF, 50, 98                   resolução, 29, 82, 95, 98
Digitalização                              Entrada de pasta para Programar OCR, 97          substitutos em PDF, 88
    Assistente, 14                         Enviar páginas via correio, 89                   tamanho, 29
    brilho, 33, 51                         Espaço em disco, 12, 94                          tons de cinza, 82
    colorido, 51                           Etapas básicas de processamento, 23         Imagens gráficas
    contraste, 33                          Excluir                                          edição, 76
    entrada de, 51                              arquivos de treinamento, 74                 em arquivos HTML, 100
    figuras, 51                                 dicionários de usuário, 70                  na exportação, 83, 99
    livros, 33                                  gabaritos de zona, 63                  Impressão
    preto e branco, 51                          páginas, 28, 30                             documentos, 31
    tons de cinza, 51                      Exemplos de treinamento, 71                      páginas reconhecidas, 31
Digitalização de livros, 33                Exportação repetida, 81, 84                 Indicadores de cabeçalho/rodapé, 66
Digitalização de página dupla, 33          Exportação True Page, 86                    Informações técnicas, 91
Direct OCR, 46                             Exportar                                    Iniciando o programa, 14
    Painel Opções, 33                           imagens gráficas, 83, 100              Iniciar aplicativo de destino, 84
Divisão de zonas, 57                            Página ligada, 85                      Início de um dicionário de usuário, 70
Documentos                                      para a Área de transferência, 88       Inserção de divisores de tabela, 62
    com frente e verso, 53                      para aplicativos de destino, 23, 42,   Instalação do
    com layout variado, 53                           82                                     OmniPage SE, 13
    concluir, 41                                para correio, 89                            scanners, 14
    copiar para a Área de transferência,        para o arquivo, 83, 99                 IntelliTrain, 34, 49, 72, 95
         45, 88                                 para PDF, 88, 99                       Interromper o processamento automático,
    descrição do layout, 53                     repetido, 81, 84                            41
    exportar, 23, 40, 43, 81                    tipos de arquivo e níveis de           Itens de menu Obter texto, 47
    fechar, 31                                       formatação, 99
    gerenciamento, 28
    gravação, 32, 81
                                                True Page, 86                          L
                                                                                       Layout de detecção automática, 53
    local para novas páginas, 33
    não concluído, 31
                                           F                                           Layout personalizado, 34, 54
    no OmniPage SE, 23                     Fechar documentos, 31                       Layout, detecção automática, 53
    salvar enquanto trabalha, 84           Finalidade do treinamento, 71               Leitura
Documentos do OmniPage                                                                      ordem dos arquivos de imagem, 50
    conteúdo do, 84                        G                                                texto em voz alta, 78
                                                                                       Linhas em tabelas, 62
    definição, 31                          Geração de divisores de tabela, 62
    propósito de arquivos OPD, 32                                                      Links para páginas da Web, 76
                                           Gerenciador de documentos, 24, 28, 29       Lista suspensa
    salvar como, 32, 84                        personalizar colunas no, 30
Documentos frente e verso, 52                                                               Obter páginas, 42
                                           Gerenciador de tarefas, 93                       Resultados da exportação, 43
Documentos inacabados, 31                  Gerenciamento de documentos, 28
Drivers TWAIN para scanners, 14                                                        Lista suspensa Obter páginas, 42
                                           Gravação de imagem original, 82, 98         Local para novas páginas, 33
                                           Gravação de texto, 83                       Localizar
E                                          Guia de início rápido, 36                        palavras ausentes do dicionário, 67
Edição e zoneamento em tempo real, 77                                                       palavras suspeitas, 67
Edição no modo True Page, 76               H
Editar
    arquivos de treinamento, 74
                                           Hyperlinks, 76                              M
    atributos de caracteres, 75                                                        Manter estilos de parágrafos, 83
    atributos de parágrafo, 75             I                                           Marcadores, 66, 68
    dicionários de usuário, 70             Idioma de interface, 33                     Melhoria da precisão, 51, 72, 95
    imagens gráficas, 76                   Idiomas                                     Menus de atalho, 58
    no modo True Page, 76                      para interface de usuário, 33           Miniaturas, 24, 26, 28
    Saída de PDF, 88                           para reconhecimento, 33, 45, 95         Modificar gabaritos de zona, 63
    tabelas, 61, 76                        Imagens                                     Modo seguro, 93
                                                                                       Modo VGA, 93


104                                                                                               Índice remissivo
Mover                                       Opções de processamento, 33                     conversores de exportação, 86
   divisores de tabela, 62                  Opções de salvamento, 86                    Planos de fundo do tipo ignorar, 54
   entre páginas, 28                        Opções para correção, 34, 67                Planos de fundo do tipo processar, 54
MS Outlook, 89                              Ordem de leitura, 76                        Planos de fundo para zoneamento, 26, 54
Mudança de linha, 34                        Ordem dos elementos da página, 76           Posicionamento da nova página no
Mudar                                       Otimizar o brilho, 33, 51                       documento, 33
   ordem de leitura, 76                                                                 Precisão
   parte de uma página, 77
   tipos de zona, 58
                                            P                                               Influência do brilho, 51
                                                                                            influência do modo de digitalização,
                                            Página ligada, 85                                    51
                                            Páginas
N                                               arquivos de imagem de várias páginas,
                                                                                            influência do treinamento, 71
                                                                                            melhoria, 51, 71, 95
Não completar o processamento                        50, 82, 98                         Preto e branco
    automático, 41                              Botão Obter página, 40, 42                  digitalizar, 51
Níveis de formatação, 49, 66, 99                coluna única, 53, 57                        imagens, 82
Níveis de formatação e tipos de arquivo,        copiar para a Área de transferência,    Problemas com reconhecimento de fax, 96
    99                                               45, 88                             Problemas de desempenho durante o
Novo arquivo em página vazia, 50                corrigidas, 28                              OCR, 96
Novos recursos, 17                              enviar como correio, 89                 Problemas de desempenho ou de sistema
                                                excluir, 28, 30                             durante o OCR, 96
O                                               localização no documento, 33
                                                modificadas, 28
                                                                                        Processamento
O guia do teclado para audição de textos,                                                   alternar entre o processamento
                                                mover entre, 28                                  manual e automático, 27, 43
   78                                           navegação, 24, 78
Obtenção de Ajuda on-line, 9                                                                automático, 27, 40
                                                novo arquivo em página vazia, 50            com o Assistente de OCR, 45
Obtenção de imagens, 23, 42                     obtidas, 28
OCR                                                                                         combinado, 27, 43
                                                páginas com coluna única e com              de outros aplicativos, 46
   Assistente, 39, 45, 46                            tabelas, 53
   configurações, 33                                                                        documentos em futuras sessões, 31
                                                páginas de planilha, 53                     etapas básicas do, 23
   configurações do Direct OCR, 46              pendentes, 28
   definição, 22                                                                            etapas, visão geral, 23, 38
                                                reconhecer tudo novamente, 41               interromper o processamento
   desempenho fraco durante, 96                 reconhecidas, 28
   Direct OCR, 33, 46                                                                            automático, 41
                                                reorganização, 28                           manual, 27, 42
   processamento automático, 27, 40             salvas, 28
   processamento manual, 27, 42                                                             parar o processamento automático,
                                                selecionar várias, 28, 29                        41
   Programar OCR, 49                            status, 28
   realizar OCR, 23                                                                         passo a passo, 42
                                                várias colunas, 53                          processamento automático
   resultados das correção, 67                  zoneada, 28
   tarefas em Programar OCR, 49                                                                  incompleto, 41
                                            Páginas com várias colunas, 54                  reiniciar o processamento
   verificação dos resultados de OCR,       Páginas corrigidas, 28
        68                                                                                       automático, 41
                                            Páginas de planilha, 54                     Processamento automático, 27, 40
Ocultar ou mostrar marcadores, 66           Páginas modificadas, 28
OmniPage Pro                                                                            Processamento combinado, 27, 43
                                            Páginas obtidas, 28                         Processamento manual, 27, 42
   atualizando para, 19                     Páginas pendentes, 28, 77
   novos recursos do, 17                                                                Processamento passo a passo, 23, 42
                                            Páginas reconhecidas, 28                    Processamento preterido, 31
OmniPage SE                                 Páginas salvas, 28
   desinstalação, 100                                                                   Procura de saída de PDF, 88
                                            Painel de imagem, 24, 26                    Programar OCR, 49
   documentos no, 23                        Palavras ausentes do dicionário, 66
   iniciando, 14                                                                            entrada de pastas, 97
                                            Palavras marcadas no Editor de texto, 66        pastas observadas, 97
   Instalação do, 13                        Palavras suspeitas, 66
   recursos, 19                                                                         Propósito de arquivos OPD, 32
                                            PaperPort, 48                               Propriedades de zonas, 57
   recursos do OmniPage SE                  Parágrafo
        comparados com os do                    editar atributos, 75
        OmniPage Pro, 8, 10, 19                 estilos, 75, 83                         Q
   registrando, 17                              manter estilos de parágrafos, 84        Quadros, 26, 76, 86, 95
   reinstalação, 100                        Parar o processamento automático, 41        Qualidade de imagens, 51
   testes, 93                               Pastas observadas, 97
   versões anteriores, 13
On-line
                                            Personalizar
                                                barras de ferramentas, 25
                                                                                        R
   Ajuda HTML, 9                                Colunas do Gerenciador de               Reconhecer páginas novamente, 43
   registro, 17                                      documentos, 30                     Reconhecimento
Opções avançadas de salvamento, 86                                                          acelerar, 96


                                                                                OmniPage SE Manual do usuário              105
executar, 42
    idiomas, 33, 45, 95
                                             T                                                das etapas de processamento, 23
                                                                                              do documento, 28
    precisão, 51, 71, 95                     Tabelas                                          do processamento, 38
    problemas com reconhecimento de              colunas em, 62                           Visão geral do processamento, 36
         fax, 96                                 edição, 76                               Visualização Preservar fontes e parágrafos,
    salvar resultados, 83                        editar divisores, 61                         66, 85
Reconhecimento de fax, 96                        em páginas com coluna única, 54          Visualização Sem formatação, 66, 85
Reconhecimento lento, 96                         gerar divisores, 62                      Visualização True Page, 67
Reconhecimento óptico de caracteres, 22          inserir divisores, 62                    Visualizações
Recurso de conversão de texto em fala, 13,       linhas em, 61                                Manter fontes e parágrafos, 66
    78                                           mover divisores, 62                          Sem formatação, 66
Recursos, novos, 17                              remover divisores, 61                        True Page, 67
Redimensionamento de zonas, 59                   tratamento de tabela no Editor de        Visualizações do Editor de texto, 26, 66
Registro                                              texto, 76
                                                 zonas, 58, 61
    aplicativos para Direct OCR, 47
    OmniPage SE, 17                          Tarefas em Programar OCR, 49                 Z
Reiniciar o processamento automático, 41     Testes do OmniPage SE, 93                    Zona alfanumérica, 57
Reinstalação do OmniPage SE, 100             Texto em itálico, 75                         Zona de texto, 58
Remoção de divisores de tabela, 62           Texto em negrito, 75                         Zona gráfica, 58
Reordenar páginas, 28                        Texto sublinhado, 75                         Zona numérica, 57
Requisitos de memória, 12, 94                Textos impressos por impressora matricial,   Zonas, 26
Requisitos do sistema, 12                        96                                          adicionar a, 60
Requisitos mínimos do sistema, 12            Tipos de arquivo compatíveis, 98                alfanumérica, 57
Resolução, 29, 82, 95, 98                    Tipos de zonas, 57                              definir tipos, 62
Retenção de layout, 67                       Tons de cinza                                   descarregar gabaritos, 64
Retirar imagens gráficas da exportação, 83       digitalizar, 51                             desenhar no Direct OCR, 47
                                                 imagens, 82                                 dividir, 58
                                             Trabalho com zonas, 59                          excluir gabaritos, 63
S                                            Treinamento, 71                                 gabaritos, 54, 63, 95
Salvar                                           arquivos de treinamento, 74                 ignorar, 58
    arquivos de treinamento, 74                  automático, 72                              imagens gráficas, 58
    como documento OmniPage, 32, 84              aviso para salvar dados, 31                 irregulares, 59
    dicionários de usuário, 70                   carregar arquivos de treinamento, 74        manual, 54, 95, 96
    documentos, 81                               criação de dados de treinamento, 74         modificar gabaritos, 63
    documentos enquanto trabalha, 84             dados de treinamento não salvos, 31         mudar tipos, 58
    gabaritos de zona, 63                        descarregar arquivos de treinamento,        na página, 28
    imagens originais, 82, 98                         74                                     numérica, 57
    no formato OPD, 32, 83                       editar arquivos de treinamento, 74          processar, 58
    opções, 86                                   IntelliTrain, 72                            propriedades, 57
    para o arquivo, 45, 82                       manual, 72                                  redimensionar, 59
    resultados do reconhecimento, 83             salvar arquivos de treinamento, 74          retangulares, 59
    Salvar e iniciar, 84                     Treinamento automático, 72                      salvar gabaritos, 63
    texto, 83                                Treinamento manual, 72                          substituir gabaritos, 63
Scanners, 51, 95                             Treinar novamente, 72                           subtrair de, 58
    configuração, 14                         True Page, 26                                   tabela, 58, 61
    drivers, 14                                                                              texto, 58
    duplex, 52                               U                                               tipos, 26, 57, 95
Scanners duplex, 52                                                                          trabalhar com, 59
Seleção de várias páginas, 29                União de zonas, 60                              unir, 60
Selecionar várias páginas, 29                Unidade de medida, 34                        Zonas de gabarito, 54, 63, 95
Solução de problemas, 91, 92                 URLs, 76                                     Zonas do tipo ignorar, 58
Soluções para desempenho baixo, 92           Uso do Direct OCR, 47                        Zonas do tipo processar, 58
Substituir gabaritos de zona, 63                                                          Zonas irregulares, 59
Subtração de zonas, 57                       V                                            Zonas retangulares, 59
Sugestões durante a correção, 68             Verificação de texto, 68                     Zoneamento automático, 26, 34, 40, 53,
Suporte a DMS, 97                            Verificação dos resultados de OCR, 68           58
Suporte a ODMA, 97                           Verificador dinâmico, 68                     Zoneamento em tempo real, 77
                                             Visão geral                                  Zoneamento manual, 42, 54




106                                                                                                   Índice remissivo

Mais conteúdo relacionado

PDF
Guide Bra
PDF
Cac mau ban an dep va sang trong
PPT
Digital Divide Ravi,Alex,Hanum
PPT
Средства ИКТ в помощь обучению
PDF
Infothon JeVeuxSavoir - 30 Novembre 2013
PPT
green-journey
PDF
Ganduxer Consulting Overview
PDF
finales Estambul 2014
Guide Bra
Cac mau ban an dep va sang trong
Digital Divide Ravi,Alex,Hanum
Средства ИКТ в помощь обучению
Infothon JeVeuxSavoir - 30 Novembre 2013
green-journey
Ganduxer Consulting Overview
finales Estambul 2014

Destaque (16)

PPT
Ciate Olot
PDF
El Dorado Lofts Downtown Los Angeles
PPTX
Search Engine
PDF
Guatemalteco luis von ahn, el más influyente en iberoamérica
PDF
新四年-V0.2 oliverding-20120620
DOC
Acta asamblea alc. sábado, 06 04-13
PPTX
Analysis of shots used in my trailer
PDF
Como instalar-wp-en menos5minutos
PPTX
Assignment 6
PPT
Movil
PDF
Creds template ubisoft
PPTX
Los senos
PDF
Block 1 ms-034 unit-1
PDF
Full d'assitència blog
PDF
ADF: Illicit Financial Flows
Ciate Olot
El Dorado Lofts Downtown Los Angeles
Search Engine
Guatemalteco luis von ahn, el más influyente en iberoamérica
新四年-V0.2 oliverding-20120620
Acta asamblea alc. sábado, 06 04-13
Analysis of shots used in my trailer
Como instalar-wp-en menos5minutos
Assignment 6
Movil
Creds template ubisoft
Los senos
Block 1 ms-034 unit-1
Full d'assitència blog
ADF: Illicit Financial Flows
Anúncio

Último (11)

PPTX
Proposta de Implementação de uma Rede de Computador Cabeada.pptx
PPTX
Arquitetura de computadores - Memórias Secundárias
PDF
eBook - GUIA DE CONSULTA RAPIDA EM ROTEADORES E SWITCHES CISCO - VOL I.pdf
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PPTX
Utilizando code blockes por andre backes
PDF
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
PPTX
Viasol Energia Solar -Soluções para geração e economia de energia
PPTX
Eng. Software - pontos essenciais para o início
PPTX
Tipos de servidor em redes de computador.pptx
PPTX
Design - Introdução a Gestalt e teoria das formas
PDF
Manejo integrado de pragas na cultura do algodão
Proposta de Implementação de uma Rede de Computador Cabeada.pptx
Arquitetura de computadores - Memórias Secundárias
eBook - GUIA DE CONSULTA RAPIDA EM ROTEADORES E SWITCHES CISCO - VOL I.pdf
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
Utilizando code blockes por andre backes
Termos utilizados na designação de relação entre pessoa e uma obra.pdf
Viasol Energia Solar -Soluções para geração e economia de energia
Eng. Software - pontos essenciais para o início
Tipos de servidor em redes de computador.pptx
Design - Introdução a Gestalt e teoria das formas
Manejo integrado de pragas na cultura do algodão
Anúncio

Guide bra

  • 2. INFORMAÇÕES LEGAIS Copyright © 2002 ScanSoft, Inc. Todos os direitos reservados. O software descrito neste livro é fornecido sob licença e pode ser usado ou copiado somente de acordo com os termos desta licença. INFORMAÇÃO IMPORTANTE A ScanSoft, Inc. fornece esta publicação assim "como está", sem garantias de nenhum tipo, explícitas ou implícitas, incluindo, dentre outras, garantias implícitas de capacidade de comercialização ou de adequação a um determinado propósito. Alguns estados ou jurisdições não permitem isenção de responsabilidade de garantias implícitas ou explícitas em certas transações, neste caso, esta declaração pode não se aplicar a você. A ScanSoft reserva-se o direito de revisar e fazer alterações no conteúdo desta publicação, de tempos em tempos, sem haver obrigação de sua parte de avisar qualquer pessoa sobre tal revisão ou alterações. MARCAS REGISTRADAS E CRÉDITOS ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page e DirectOCR são marcas registradas ou marcas comerciais da ScanSoft, Inc., nos Estados Unidos e/ou em outros países. Todos os demais nomes de empresas ou nomes de produtos referidos no presente documento podem ser marcas comerciais de seus respectivos proprietários. ScanSoft, Inc. 9 Centennial Drive Peabody, MA 01960 EUA ScanSoft Bélgica BVBA Guldensporenpark 32 BE-9820 Merelbeke Bélgica Número do referencia 58-281201-08A
  • 3. S U M Á R I O BEM-VINDO 7 Como usar este manual 8 Obtenção de Ajuda on-line 9 Ajuda HTML on-line 9 Ajuda sensível ao contexto 9 Notas técnicas 10 Glossário 10 OmniPage SE 10 1 INSTALAÇÃO E CONFIGURAÇÃO 11 Requisitos do sistema 12 Instalação do OmniPage SE 13 Configuração do scanner com OmniPage SE 14 Como iniciar o programa 16 Registro do software 17 Novos recursos no OmniPage Pro 12 17 OmniPage SE e OmniPage Pro 12 19 2 INTRODUÇÃO 21 O que é reconhecimento óptico de caracteres 22 Recursos de OCR do OmniPage SE 22 Documentos no OmniPage SE 23 Etapas básicas de processamento 23 O ambiente do OmniPage 24 A barra de menus 25 OmniPage SE Manual do usuário iii
  • 4. As Barras de ferramentas 25 O Painel de imagem 26 O Editor de texto 26 A caixa de ferramentas do OmniPage 27 Gerenciamento de documentos 28 Miniaturas 28 Gerenciador de documentos 29 Personalizar colunas do Gerenciador de documentos 30 Exclusão de páginas de um documento 30 Impressão de um documento 31 Fechar um documento 31 Documentos do OmniPage 31 Por que salvar em OPD 32 Como salvar como OPD 32 Configurações 33 3 PROCESSAMENTO DE DOCUMENTOS 35 Guia de início rápido 36 Carregamento e reconhecimento de amostras de arquivos de imagem 36 Digitalização e reconhecimento de uma única página 36 Visão geral do processamento 38 Processamento automático 40 Interromper e reiniciar o processamento automático 41 Processamento manual 42 Processamento combinado 43 Processamento com o Assistente de OCR 45 Processamento a partir de outros aplicativos 46 Como configurar o Direct OCR 46 iv Sumário
  • 5. Como usar o Direct OCR 47 Como usar o OmniPage SE com o PaperPort 48 Processamento de documentos com Programar OCR 49 Definição da origem das imagens de página 50 Entrada de arquivos de imagem 50 Entrada do scanner 51 Digitalização com um ADF 52 Digitalização sem um ADF 53 Descrição do layout de documento 53 Zonas e planos de fundo 54 Zoneamento automático 55 Zoneamento manual 56 Tipos de zona e propriedades 57 Trabalho com zonas 59 Grades de tabela na imagem 61 Uso de gabaritos de zonas 63 4 CORREÇÃO E EDIÇÃO 65 Exibição e visualizações do editor 66 Correção de resultados de OCR 67 Verificação de texto 68 Dicionários do usuário 70 Treinamento 71 Treinamento manual 72 IntelliTrain 72 Arquivos de treinamento 73 Edição de texto e de imagem 75 Edição em tempo real 77 Leitura de texto em voz alta 78 OmniPage SE Manual do usuário v
  • 6. 5 GRAVAÇÃO E EXPORTAÇÃO 81 Gravação de imagens originais 82 Gravação dos resultados de reconhecimento 83 Salvar um documento enquanto você trabalha 84 Selecionar um nível de formatação 85 Selecionar opções avançadas de salvamento 86 Salvar como PDF 88 Copiar páginas para a Área de transferência 88 Enviar páginas via correio 89 6 INFORMAÇÕES TÉCNICAS 91 Solução de problemas 92 Soluções para tentar primeiro 92 Teste do OmniPage SE 93 Aumentar recursos de memória 94 Aumentar espaço em disco 94 O texto não é reconhecido corretamente 95 Problemas com reconhecimento de fax 96 Problemas de desempenho ou de sistema durante o OCR 96 Suporte a ODMA 97 Recursos avançados em Programar OCR 97 Tipos de arquivo compatíveis 98 Tipos de arquivo para abrir e salvar imagens 98 Tipos de arquivo para salvar resultados de reconhecimento 99 Desinstalação do software 100 vi Sumário
  • 7. Bem-vindo Seja bem-vindo ao OmniPage® SE e obrigado por usar nosso software! A documentação a seguir é fornecida para ajudá-lo a se familiarizar com o programa e dar-lhe uma visão geral do mesmo. Este manual do usuário Este manual lhe ensina como utilizar o OmniPage SE (Special Edition). Ele inclui instruções de instalação e configuração, uma descrição dos comandos e áreas de trabalho do programa, instruções orientadas por tarefas, formas de personalizar e controlar o processamento e informações técnicas. Este manual é apresentado em formato PDF, permitindo que você use hyperlinks em referências cruzadas e outras ferramentas de navegação em seu visualizador PDF. Ajuda on-line A ajuda on-line do OmniPage SE contém informações sobre recursos, configurações e procedimentos. Ela é fornecida como ajuda HTML e foi projetada para que as informações sejam obtidas de forma rápida e fácil. A ampla ajuda sensível ao contexto visa fornecer a assistência exata que você precisa para continuar a trabalhar sem perda de tempo. Consulte “Obtenção de Ajuda on- line” na página 9. Arquivo leiame O arquivo leiame contém informações de última hora sobre o software. Leia-o antes de usar o OmniPage SE. Para abrir este arquivo HTML, escolha Leiame no programa de instalação do OmniPage SE ou, mais tarde, no menu Ajuda. Digitalização e outras informações O site da ScanSoft na Web no endereço www.scansoft.com fornece informações atuais sobre o programa. O manual do scanner contém informações atualizadas sobre scanners compatíveis e questões relacionadas. A ScanSoft testa os 25 modelos de scanner mais utilizados. Acesse o site da ScanSoft na Web a partir do programa de instalação do OmniPage SE ou, mais tarde, a partir do menu Ajuda. OmniPage SE Manual do usuário 7
  • 8. Como usar este manual Este manual foi escrito partindo-se do pressuposto que você sabe como trabalhar no ambiente Microsoft Windows. Consulte a documentação do Windows se você tiver dúvidas sobre como usar caixas de diálogo, comandos de menu, barras de rolagem, funcionalidades de arrastar e soltar, menus de atalho etc. Partimos também do princípio que você está familiarizado com o scanner e seu software de suporte e que o scanner está instalado e funciona corretamente antes da configuração para o OmniPage SE. Consulte a documentação do scanner se necessário. As seguintes convenções são usadas neste manual: Negrito Introduz termos novos e apresenta sub-cabeçalhos. Itálico Usado no nome dos tópicos do sistema de ajuda on-line. Apresenta textos mais longos das opções em caixas de diálogo. Sem serifa Apresenta nomes de arquivos: sample.tif Uma nota apresenta um item de informação adicional. Uma dica apresenta idéias de uso dos recursos do programa para realizar tarefas específicas. Este manual e utilizando o ícone SE para indicar as diferenças entre os Edição Especial do OmniPage e OmniPage Pro 12. Consulte “OmniPage SE” na página 10. 8 Bem-vindo
  • 9. Obtenção de Ajuda on-line Além de usar este manual, você pode usar a Ajuda on-line do OmniPage SE para aprender sobre recursos, configurações e procedimentos. A ajuda on-line fica disponível após a instalação do OmniPage SE. Ajuda HTML on-line Abra a Ajuda on-line do OmniPage SE no nível superior escolhendo os tópicos de Ajuda do OmniPage SE na parte superior do menu Ajuda. Isto permite que você veja os tópicos organizados em um Índice analítico, procure por uma lista alfabética de palavras-chave ou faça buscas de texto completo através dos tópicos. Os outros itens no menu Ajuda fornecem acesso a tópicos úteis ou páginas na Web. Pressione F1 conforme você estiver trabalhando no programa para ver um tópico de ajuda on-line relacionado à área da tela, caixa de diálogo ou mensagem de advertência atual. Ajuda sensível ao contexto Você pode obter informações concisas no local, que aparecem em uma janela instantânea, sobre um item particular do menu, botão de ferramentas, área da tela ou caixa de diálogo do OmniPage SE da seguinte forma: Clique no botão Ajuda na barra de ferramentas Padrão para obter o ícone de ajuda. Com este ícone, clique em qualquer item na área de trabalho fora de uma caixa de diálogo ou de uma mensagem de advertência. Pressione Shift + F1 para obter o mesmo ícone de ajuda. Use Shift + F1 para obter ajuda sensível ao contexto sobre itens do menu de atalho. Clique no botão de ponto de interrogação no lado superior direito de uma caixa de diálogo e, em seguida, clique no item na caixa de diálogo para ver a janela instantânea. Algumas caixas de diálogo ou mensagens de advertência possuem seu próprio botão de Ajuda ou um texto de ajuda. Clique no botão ou texto para obter informações sobre a caixa de mensagem ou de diálogo. Clique em qualquer lugar para remover uma janela de Ajuda instantânea sensível ao contexto. OmniPage SE Manual do usuário 9
  • 10. Notas técnicas O site da ScanSoft na Web em www.scansoft.com contém notas técnicas sobre questões relatadas freqüentemente, referentes ao uso do OmniPage. As páginas da Web também podem oferecer assistência sobre o processo de instalação e solução de problemas. Glossário Este manual não inclui um glossário. A Ajuda on-line possui um glossário amplo, com seu próprio índice alfabético e um índice analítico. Consulte-o se quiser encontrar o significado de um termo usado neste manual ou no programa. OmniPage SE O produto que você tem é uma edição especial do software OmniPage Pro®, mundialmente conhecido. Esta edição foi desenvolvida para ser distribuída por um grupo seleto de fabricantes de scanners e contém um subconjunto de recursos do produto OmniPage Pro 12. Este manual e a Ajuda on-line descrevem os recursos do produto completo, utilizando o ícone SE para indicar as diferenças entre os dois produtos. Caso constate que outros recursos do produto profissional podem ser vantajosos para você, use as ferramentas on-line para fazer a atualização da Edição Especial 2.0 para o OmniPage Pro 12. Consulte “OmniPage SE e OmniPage Pro 12” na página 19. 10 Bem-vindo
  • 11. Capítulo 1 Instalação e configuração Este capítulo fornece informações sobre como instalar e iniciar o OmniPage SE. Ele apresenta os seguintes tópicos: x Requisitos do sistema x Instalação do OmniPage SE x Configuração do scanner com OmniPage SE x Como iniciar o programa x Registro do software x Novos recursos no OmniPage Pro 12 x OmniPage SE e OmniPage Pro 12 OmniPage SE Manual do usuário 11
  • 12. Requisitos do sistema Você precisa dos seguintes requisitos mínimos de sistema para instalar e executar o OmniPage SE 2.0: x Um computador com processador Pentium ou superior x Microsoft Windows 98 (da segunda edição em diante), Windows Me, Windows NT 4.0 (com pelo menos o Service Pack 6), Windows 2000 ou Windows XP x 64 MB de memória (RAM), 128 MB recomendado x 90 MB disponível em disco rígido para os arquivos do aplicativo além de espaço de trabalho de 5 MB durante a instalação x 5 MB para o Microsoft Installer (MSI) caso ele não esteja presente (Este módulo está presente como parte do sistema operacional no Windows Me, Windows 2000 e Windows XP) x Monitor SVGA com 256 cores, mas preferencialmente cor de 16 bits (chamada High Color no Windows 2000 e Medium Color no XP) e resolução de 800 x 600 pixels x Dispositivo indicador compatível com Windows x Unidade de CD-ROM para instalação x Um scanner compatível, com seu próprio software do driver do scanner se você pretende digitalizar documentos. Consulte o Guia do scanner no site da ScanSoft na Web (www.scansoft.com) para obter uma lista de scanners compatíveis. O desempenho e a velocidade serão melhorados se o processador, a memória e o espaço em disco disponível do seu computador excederem os requisitos mínimos. 12 Instalação e configuração
  • 13. Capítulo 1 Instalação do OmniPage SE O programa de instalação do OmniPage SE o conduz pela instalação com instruções em todas as telas. Antes de instalar o OmniPage SE: x Feche todos os outros aplicativos, especialmente programas antivírus. x Faça o login em seu computador com privilégios de administrador se estiver instalando no Windows NT, 2000 ou XP. x Se você tiver o software OCR do ScanSoft anterior em seu sistema, o programa de instalação solicitará sua permissão para desinstalá-lo primeiro. w Para instalar o OmniPage SE: 1. Coloque o CD-ROM do OmniPage SE na unidade de CD-ROM. O programa de instalação deve iniciar automaticamente. Se ele não iniciar, localize a unidade de CD-ROM no Windows Explorer e clique duas vezes no programa Autorun.exe no nível superior do CD-ROM. 2. Escolha um idioma para usar durante a instalação. O idioma será usado pelo sistema de conversão de texto em fala e como o idioma de interface do programa. O idioma de interface do programa é usado para exibições como itens de menu, caixas de diálogo, mensagens de advertência etc. Você pode alterar o idioma de interface posteriormente a partir do OmniPage SE, mas a sua escolha no momento de instalação determina qual sistema de conversão de texto em fala será instalado no programa. As referências ao recurso Texto para fala não se aplicam ao OmniPage SE. 3. Siga as instruções em cada tela para instalar o software. Todos os arquivos necessários para digitalização são copiados automaticamente durante a instalação. Algumas vezes a desinstalação e reinstalação do OmniPage SE resolverá o problema. Consulte “Desinstalação do software” na página 100. No OmniPage Pro 12, o recurso Texto para fala está disponível para os idiomas inglês (britânico e dos Estados Unidos), francês, alemão, italiano, português ou espanhol. O recurso não está disponível no OmniPage SE. Consulte “Leitura de texto em voz alta” na página 78. Instalação do OmniPage SE 13
  • 14. Configuração do scanner com OmniPage SE Todos os arquivos necessários para configuração e suporte do scanner são copiados automaticamente durante a instalação do programa. Antes de usar o OmniPage SE para digitalização, o scanner deve ser instalado com seu próprio software do driver do scanner e testado quanto ao seu funcionamento correto. O software do driver do scanner não acompanha o OmniPage SE. A instalação do scanner e a sua configuração são feitas pelo Assistente do scanner. Você pode iniciar este processo sozinho, como descrito abaixo. Caso contrário, o Assistente do scanner aparece quando você tenta realizar a digitalização pela primeira vez. Siga estas etapas para usar o Assistente do scanner para configurar o scanner com o OmniPage SE: x Escolha IniciarProgramasScanSoft OmniPage SE 2.0 Assistente do scanner ou clique no botão Configuração no painel Scanner da caixa de diálogo Opções. ou escolha uma configuração de digitalização na lista suspensa Obter página na caixa de ferramentas do OmniPage e clique no botão Obter página. O Assistente de configuração do scanner é iniciado. O primeiro painel aparece apenas na primeira configuração quando chamado de dentro do OmniPage SE. x Escolha ‘Selecione scanner ou câmera digital’ e clique em Avançar. Você verá uma lista com todos os drivers de scanner TWAIN detectados, na qual estará selecionado o scanner padrão do sistema. x Clique uma vez para selecionar o driver do scanner que deseja usar. Clique em ‘Outros drivers...’ se você precisar procurar um driver. Selecione ‘Configurar definições avançadas’ para abrir um outro painel caso deseje que a própria interface do scanner seja ocultada durante a digitalização ou para modificar o método de transferência de imagem. Clique em Avançar. x Escolha Sim para testar a configuração do scanner e, em seguida, clique em Avançar. O assistente testará agora a conexão do computador com o scanner. Ao término, clique em Avançar. 14 Instalação e configuração
  • 15. Capítulo 1 x Coloque uma página de teste no scanner. O assistente agora está preparado para fazer uma digitalização básica usando o software do fabricante do scanner. Clique em Avançar. A interface de usuário original do scanner aparecerá. x Clique em Digitalizar para iniciar a digitalização do teste. x Se necessário, clique em Imagem invertida... ou Faltando imagem... e faça as seleções apropriadas. x Depois que a imagem aparecer corretamente na janela, clique em Avançar. x Selecione o item que descreve mais adequadamente o scanner e, em seguida, clique em Avançar. x Clique em Avançar para ir para o tamanho da página. x Os tamanhos de página que o Assistente do scanner acredita que são compatíveis com seu scanner são listados na janela. Para fazer alterações nos tamanhos da página, clique em Avançado, faça as alterações e clique em Avançar. x Coloque uma página com texto mas sem imagens no scanner. Clique em Avançar para começar a digitalizar no modo preto e branco. x Se necessário, clique em Imagem invertida... ou Faltando imagem... e faça as seleções apropriadas. x Depois que a imagem aparecer corretamente na janela, clique em Avançar. x Se você tiver um scanner colorido, coloque uma fotografia ou uma página colorida com uma imagem colorida no scanner. Clique em Avançar para começar a digitalizar no modo colorido. Se necessário, clique em Imagem invertida... ou Faltando imagem... e faça as seleções apropriadas. Depois que a imagem aparecer corretamente na janela, clique em Avançar. Se o scanner não puder digitalizar em cores, pule esta etapa. x Coloque uma fotografia ou uma página com uma imagem no scanner. Clique em Avançar para começar a digitalizar no modo de tons de cinza. Se necessário, clique em Imagem invertida... ou Faltando imagem... e faça as seleções apropriadas. Depois que a imagem aparecer corretamente na janela, clique em Avançar. x Você configurou o scanner com êxito para trabalhar com o OmniPage SE! Clique em Concluir. Para alterar as configurações do scanner posteriormente ou para configurar um scanner de modo diferente, abra novamente o Assistente de configuração do scanner no menu Iniciar do Windows ou no painel Scanner da caixa de diálogo Opções. Para testar e consertar um scanner que não está funcionando adequadamente, abra o Assistente de configuração do scanner no menu Iniciar Configuração do scanner com OmniPage SE 15
  • 16. do Windows e selecione ‘Testar o scanner ou câmera digital’ no primeiro painel e então execute o procedimento descrito acima. Como iniciar o programa Para iniciar o OmniPage SE, siga um dos procedimentos abaixo: x Clique em Iniciar na barra de tarefas do Windows e escolha ProgramasScanSoft OmniPage SE 2.0OmniPage SE 2.0. x Clique duas vezes no ícone do OmniPage SE na pasta de instalação do programa ou na área de trabalho do Windows se você o colocou lá. x Clique duas vezes no ícone de documento (OPD) do OmniPage ou no nome de arquivo. O documento clicado é carregado pelo programa. Consulte “Documentos do OmniPage” na página 31. Na abertura, a tela com o título do OmniPage SE é exibida e, em seguida, seu ambiente de trabalho. Consulte “O ambiente do OmniPage” na página 24. Ele fornece uma introdução às principais áreas de trabalho do programa. Há várias formas de executar o programa com uma interface limitada: x Use o programa Programar OCR. Clique em Iniciar na barra de tarefas do Windows e escolha ProgramasScanSoft OmniPage Pro 12.0 Programar OCR. Consulte “Processamento de documentos com Programar OCR” na página 49. Esse recurso não está disponível no OmniPage SE. x Clique em Obter texto no menu Arquivo de um aplicativo registrado com o recurso Direct OCR™. Consulte “Como configurar o Direct OCR” na página 46. x Clique com o botão direito no ícone de arquivo de imagem ou no nome de arquivo para obter um menu de atalho. Selecione um item no sub-menu de ‘Converter para...’ para definir um destino. x Use o OmniPage SE com o PaperPort® da ScanSoft ou com os produtos de gerenciamento de documentos Pagis para acrescentar serviços de OCR . Consulte “Como usar o OmniPage SE com o PaperPort” na página 48. 16 Instalação e configuração
  • 17. Capítulo 1 Registro do software O assistente de registro da ScanSoft é executado no final da instalação. Fornecemos um formulário eletrônico simples que pode ser preenchido em menos de cinco minutos. Quando o formulário é preenchido e você clica em Enviar, o programa procurará por uma conexão com Internet para realizar o registro on-line imediatamente. Se você não tiver registrado o software durante a instalação, será convidado periodicamente a registrá-lo. Você pode acessar www.scansoft.com para fazer o registro on-line. Clique em Support (Suporte) e na tela principal de suporte, escolha Register (Registrar) na coluna esquerda. Para obter uma declaração sobre o uso dos seus dados de registro, consulte a Política de privacidade da ScanSoft. Novos recursos no OmniPage Pro 12 A família de produtos OmniPage® foi ampliada com o OmniPage Pro 12 e o OmniPage SE. Esta seção relaciona as melhorias introduzidas no produto profissional OmniPage Pro 12. Algumas foram incorporadas no OmniPage SE, como detalhado na próxima seção. Os novos recursos do OmniPage Pro 12, em comparação ao OmniPage Pro 11, são: x Aumento significativo na precisão Uma sinergia aperfeiçoada entre os mecanismos de reconhecimento, suporte para dicionários profissionais e a capacidade de treinar caracteres escolhidos pelo usuário impulsionam a precisão a novos níveis. x Interface otimizada O processamento automático e manual são agora acionados diretamente da Caixa de ferramentas do OmniPage sem barras de ferramentas separadas. Veja página 27. Agora as miniaturas são exibidas no Painel Imagem; escolha entre ver a página atual, miniaturas ou ambos. Veja página 28. A visualização Detalhe anterior tornou-se o Gerenciador de documentos e inclui uma coluna Notas para comentários e palavras-chave que podem ser pesquisadas. Registro do software 17
  • 18. x Novos conceitos de zoneamento Zoneamento em tempo real permite que alterações na zona sejam processadas imediatamente sem a necessidade de reconhecer a página inteira novamente. Veja página 77. Planos de fundo da página são definidos como processar (zoneamento automático) ou ignorar, de modo que todas as instruções de zoneamento apareçam na página e possam ser salvas em gabaritos de zona. Veja página 54. Zonas irregulares podem ser definidas e zonas podem ser divididas ou agrupadas mais facilmente, sem a necessidade de ferramentas separadas. Veja página 59. x Melhor correção e verificação A caixa de diálogo Correção exibe agora palavras suspeitas em um contexto mais amplo. Um verificador dinâmico pode permanecer aberto enquanto o texto é verificado, com a visualização e janela da imagem acompanhando a posição de edição. Veja página 67. x Níveis de formatação para exibição e salvamento Existem três níveis de formatação para a visualização do Editor de texto. Veja página 66. Agora o nível de formatação de saída é escolhido no momento da exportação; as opções dependem do tipo de arquivo especificado. Uma opção de exportação ‘Página ligada’ é uma versão melhorada da visualização anterior ‘Manter colunas ligadas’. Ela preserva o layout da página, sem caixas e quadros, sempre que possível, de modo que o texto possa fluir entre as colunas. Veja página 85. x Melhor análise da página A transferência de formatação de tabela melhorou, particularmente a detecção de tabelas sem linhas de grade nas páginas originais. Endereços Web e de correio eletrônico podem ser detectados e transferidos para o Editor de texto; hyperlinks podem ser inseridos. Agora a ordem de leitura pode ser visualizada e alterada depois do reconhecimento na visualização True Page ® do Editor de texto. Veja página 75. x Tratamento melhorado do formato PDF O OmniPage Pro 12 procura texto de fundo nos arquivos PDF que abrir, proporcionando uma maior precisão de reconhecimento. Um novo tipo de arquivo ‘PDF editado’ permite uma boa retenção de formato em páginas que foram modificadas no Editor de texto após o reconhecimento. x Opções avançadas de salvamento Uma gama mais ampla de opções de salvamento é oferecida para cada tipo de arquivo de saída. Podem ser criados tipos de arquivo de saída 18 Instalação e configuração
  • 19. Capítulo 1 definidos pelo usuário com configurações personalizadas. Veja página 86. Se sua edição do OmniPage Pro 12 incluir os novos formatos de salvamento XML e eBook, veja página 99. OmniPage SE e OmniPage Pro 12 Esta lista indica os recursos que não foram incorporados no OmniPage SE, mas que podem ser obtidos por meio da atualização para o OmniPage Pro 12: x Aperfeiçoamento significativo da precisão do reconhecimento. x Acesso ao recurso de treinamento, de IntelliTrain e arquivos de treinamento. x Capacidade para abrir e ler o conteúdo de arquivos PDF. x Capacidade para salvar documentos reconhecidos no formato PDF. x Recurso Programar OCR para processamento automático de tarefas OCR em horários definidos. x Suporte à digitalização de 2 páginas para facilitar a digitalização de livros. x Nível de formatação com saída de página ligada para retenção superior do layout da página. x Gerenciamento de arquivos de imagem TIFF LZW e GIF para entrada e saída. x Exportação para os formatos eBook e XML. x Suporte para saída em HTML 4.0 'WYSIWYG'. x Suporte para idiomas ampliado, de cerca de 50 para mais de 100. x Acesso a dicionários médicos e jurídicos profissionais em idiomas selecionados. x Acesso ao software RealSpeak, Texto para fala, permitindo leitura em voz alta de textos reconhecidos. Para obter mais informações ou fazer a atualização, visite o site www.scansoft.com. OmniPage SE e OmniPage Pro 12 19
  • 20. 20 Instalação e configuração
  • 21. Capítulo 2 Introdução Provavelmente, você usa o computador para correspondência comercial, elaboração de relatórios, tratamento de dados e um número cada vez maior de outros usos. O desafio é que, apesar da revolução digital, algumas fontes de informação ainda circulam na forma de papel impresso e não podem ser usadas imediatamente em um computador. Por exemplo, se você quiser incluir informações de um artigo de revista em um relatório que estiver preparando, precisará obter o texto do artigo de alguma forma e colocá-lo em seu computador. Digitar todo o artigo não é uma solução interessante. Este capítulo lhe apresenta a solução: reconhecimento óptico de caracteres (OCR). Ele descreve como o OmniPage SE usa tecnologia de OCR para transformar o texto contido em arquivos de imagem ou páginas digitalizadas em texto editável para ser usado em seus aplicativos favoritos. Apresentamos os seguintes tópicos: x O que é reconhecimento óptico de caracteres • Documentos no OmniPage SE • Etapas básicas de processamento x O ambiente do OmniPage x Gerenciamento de documentos x Documentos do OmniPage x Configurações OmniPage SE Manual do usuário 21
  • 22. O que é reconhecimento óptico de caracteres O reconhecimento óptico de caracteres é o processo de extrair texto de uma imagem. Esta imagem pode resultar da digitalização de um documento em papel ou abertura de um arquivo de imagem eletrônica. As imagens não possuem caracteres editáveis de texto; possuem muitos pontos pequenos (pixels) que juntos formam um caractere. Estes apresentam uma figura do texto em uma página. Durante o OCR, o OmniPage SE analisa as formas de caracteres em uma imagem e define soluções para produzir texto editável. Após o OCR, você pode salvar o texto resultante em vários aplicativos de processamento de texto, de editoração eletônica ou planilhas. Recursos de OCR do OmniPage SE Além de reconhecimento de texto, o OmniPage SE pode manter os seguintes elementos de um documento através do processo de OCR. Imagens gráficas Fotos, logos e desenhos são exemplos de imagens gráficas. Formatação de texto Tipos de fonte, tamanhos e estilos (como negrito, itálico e sublinhado) são exemplos de formatação de caracteres. Recuos, tabulações, margens e espaçamento de linha são exemplos de formatação de parágrafos. Formatação de página Estrutura de colunas, formatação de tabela e colocação de imagens gráficas e cabeçalhos são exemplos de formatação de página. Os elementos de formatação de página, texto e imagens gráficas que o OmniPage SE mantém são determinados pelas configurações que você seleciona. Consulte Instruções de configurações na Ajuda on-line para obter mais informações sobre como selecionar as configurações. O OmniPage SE reconhece apenas caracteres gerados por máquina como texto em offset, impresso a laser ou escrito por máquina de escrever. Entretanto, ele pode manter um texto escrito a mão, como uma assinatura, como uma imagem gráfica. 22 Introdução
  • 23. Capítulo 2 Documentos no OmniPage SE O OmniPage SE trata os documentos um por vez. Quando você obtém a sua primeira imagem (do scanner ou do arquivo) um novo documento é iniciado. Outras imagens obtidas são adicionadas ao mesmo documento, até você salvá-lo e fechá-lo. Um documento no OmniPage SE consiste em uma imagem para cada página de documentos. Depois de realizado o OCR, o documento também conterá texto reconhecido, exibido no Editor de texto, possivelmente com imagens gráficas e tabelas. Consulte “O ambiente do OmniPage” na página 24. Etapas básicas de processamento Existem duas formas principais de tratamento de documentos: com processamento automático ou manual. Consulte ”Processamento automático” na página 40 e ”Processamento manual” na página 42. As etapas básicas dos dois métodos de processamento são praticamente as mesmas: 1. Colocar um conjunto de imagens no OmniPage SE. Você pode digitalizar um documento em papel com ou sem um alimentador automático de documentos (ADF) ou carregar arquivos de imagens. As imagens resultantes podem aparecer como miniaturas no Painel Imagem junto com a imagem da primeira página inserida. As páginas do documento estão resumidas no Gerenciador de documentos. Consulte “Definição da origem das imagens de página” na página 50. 2. Realizar OCR para gerar texto editável. Durante o OCR, o OmniPage Pro cria zonas ao redor de elementos na página que serão processadas e interpreta os caracteres de texto ou as imagens gráficas em cada zona. O zoneamento manual e de gabaritos também é possível. Depois do OCR, você pode verificar e corrigir erros no documento usando o Corretor de OCR e editar o documento no Editor de texto. 3. Exportar o documento para o local desejado. Você pode salvar o documento com um nome e tipo de arquivo especificado, colocá-lo na Área de transferência ou enviá-lo como anexo de correio eletrônico. Você pode salvá-lo como um documento (OPD) do OmniPage como descrito posteriormente. Você pode salvar o mesmo documento repetidamente em vários destinos, tipos de arquivo diferentes, com níveis de formatação e configuração diferentes. Consulte “Gravação e exportação” na página 81. O que é reconhecimento óptico de caracteres 23
  • 24. O ambiente do OmniPage O ambiente do OmniPage possui uma barra de títulos e uma barra de menu ao longo da parte superior e uma barra de status ao longo da parte inferior. Ele tem três áreas de trabalho principais, separadas por divisores: o Gerenciador de documentos, o Painel de imagem e o Editor de texto. Cada uma possui botões de fechar, maximizar e restaurar no canto superior direito. O Painel de imagem tem uma barra de ferramentas de imagem e o Editor de texto tem uma barra de ferramentas de formatação. Barra de ferramentas padrão Barra de ferramentas Caixa de de formatação ferramentas do OmniPage Miniaturas exibem uma imagem de cada página no documento. A página atual possui o ícone de um “olho”. Esta página foi reconhecida. Barra de ferramentas de imagem Botões de navegação de página Arraste esses divisores Os botões de visualização para redimensionar as do Editor de texto áreas de trabalho. oferecem três níveis de Botões para exibir ou ocultar o formatação. Gerenciador de documentos, o Editor de texto e as miniaturas e Painel de imagem: Editor de texto: a página atual do Painel de Exibe a imagem da página atual juntamente Exibe os resultados de imagem. Isso também pode ser com suas zonas. O painel de imagem pode reconhecimento da página atual na feito no menu Visualizar. exibir a página atual, miniaturas ou ambos. visualização True Page. 24 Introdução
  • 25. Capítulo 2 Mostramos o programa com um documento de três páginas. A página um é a página atual, que foi reconhecida e corrigida. A página dois foi reconhecida, mas ainda não foi corrigida. A página três foi obtida e zoneada manualmente, mas ainda não foi reconhecida. Os ícones na parte inferior das imagens em miniatura mostram o status da página. Os botões da barra de status permitem que você mostre ou oculte as áreas da tela principal e vá para outras páginas no documento. Um clique com o botão direito do mouse em uma área qualquer da tela exibe um menu de atalho com os comandos mais úteis da área. A barra de menus Para obter informações concisas sobre qualquer item de menu, clique no botão de ajuda sensível ao contexto e, em seguida, clique no item de menu. Um texto instantâneo explica o propósito do item de menu. Clique em qualquer lugar para fechar o texto instantâneo. As Barras de ferramentas O programa possui três barras de ferramentas principais; todas podem flutuar. Use o menu Visualizar para exibir, ocultar ou personalizar essas barras de ferramentas. A ajuda sensível ao contexto explica a finalidade de todas as ferramentas. Duas outras barras de ferramentas controlam tarefas específicas. Barra de ferra- Outros locais de Local padrão Finalidade mentas acoplamento Qualquer extremi- Executar funções básicas do pro- Horizontal sob a barra Padrão dade do Ambiente grama. Consulte página 31 e de Menu do OmniPage página 67. Verticalmente à Verticalmente à di- Operações de imagem, zoneamento Imagem esquerda da atual ima- reita da atual ima- e tabela. Consulte página 54 e gem da página gem da página página 61. Horizontal na parte Formatação reconheceu texto no Formatação superior do Editor de Nenhum Editor de texto. Veja página 75. texto Passe o cursor sobre a janela do verificador Controlar a localização e aparência Verificador para ver esta barra de ferramentas flutuante. do verificador. Veja página 68. Clique na ferramenta Alterar ordem de leitura. Modificar a ordem dos elementos em Reordenar Esta barra de ferramentas substitui a barra de páginas reconhecidas. Veja ferramentas Formatação. página 75. O ambiente do OmniPage 25
  • 26. O Painel de imagem Quando é exibida a imagem da página atual, a barra de ferramentas Imagem fica disponível. Todas as imagens de página têm um valor de plano de fundo: processar ou ignorar. Zonas podem ser desenhadas manualmente em imagens de página ou podem ser colocadas automaticamente depois do reconhecimento. Existem cinco tipos de zona: Processar, Ignorar, Texto, Tabela, Imagens gráficas. Áreas dentro de zonas do tipo processar e em um plano de fundo do tipo processar fora de outras zonas têm suas zonas desenhadas automaticamente e seus tipos de zona determinados durante o processamento. Consulte “Zonas e planos de fundo” na página 54. Se a imagem da página atual está oculta, aparecem miniaturas nas linhas para usar o espaço disponível da melhor maneira. O Editor de texto Isso exibe os resultados do reconhecimento em qualquer um dos três níveis de formatação: x Visualização Sem formatação (NF) x Visualização Preservar fontes e parágrafos (RFP) x True Page (TP) True Page mantém o layout da página usando texto, tabela e caixas de imagem e quadros. É possível exibir áreas com várias colunas para mostrar blocos de texto que podem ser tratados como colunas ligadas no momento da exportação. True Page também é um nível de formatação de exportação, juntamente com Página ligada que mantém o layout da página sem caixas ou quadros. Consulte “Exibição e visualizações do editor” na página 66. O OmniPage SE não oferece o recurso de saída de página ligada. 26 Introdução
  • 27. Capítulo 2 A caixa de ferramentas do OmniPage Esta caixa de ferramentas permite controlar o processamento. Por definição, ela está localizada ao longo da parte superior do ambiente do OmniPage, exatamente acima das áreas de trabalho. Ela pode ser movida e fixada ao longo da parte inferior do ambiente. Botão Iniciar Botão Obter página Botão Efetuar OCR Botão Exportar resultados Lista suspensa Lista suspensa Lista suspensa Obter páginas Descrição do Resultados da layout exportação O processamento automático é iniciado e pode ser interrompido e reiniciado com o botão Iniciar (1-2-3). Consulte “Processamento automático” na página 40. O processamento manual permite processar documentos página por página e passo a passo. Inicie cada etapa com os três botões grandes: o botão Obter página (1), o botão Executar OCR (2) e o botão Exportar resultados (3). Consulte “Processamento manual” na página 42. Você pode alternar entre o processamento manual e automático a qualquer momento, desde que o programa não esteja ocupado com o processamento. Isto significa que você pode alternar entre eles enquanto está trabalhando em um documento. Você pode processar automaticamente algumas páginas e, em seguida, adicionar mais páginas com processamento manual. Após processar uma pilha de páginas automaticamente, você pode inspecionar os resultados e, em seguida, voltar para processar novamente certas páginas manualmente. Este procedimento é descrito no Capítulo 3. Consulte “Processamento combinado” na página 43. O Assistente de OCR foi projetado para novos usuários. Consulte “Processamento com o Assistente de OCR” na página 45. Se você tiver um documento aberto quando iniciar o Assistente de OCR, o documento será fechado após um aviso para salvá-lo. Quando você usa o Assistente de OCR para processar e salvar um documento, ele continua no programa e pode ser processado novamente (adicionando mais páginas, reconhecendo novamente páginas etc.) com o processamento automático ou manual. O ambiente do OmniPage 27
  • 28. Gerenciamento de documentos O gerenciamento de documentos pode ser feito através de miniaturas no Painel de imagem ou do Gerenciador de documentos, localizado ao longo da parte inferior do Ambiente do OmniPage. As duas visualizações resumem as páginas no documento e são sincronizadas: As nossas figuras mostram as duas visualizações com o mesmo documento de sete páginas. As páginas 1 e 2 são selecionadas e a página 4 é a página atual, isto é, aquela exibida no Painel de imagem. O status da página é exibido da seguinte maneira: Página Status Ícone A imagem da página foi... 1 Obtida obtida mas ainda não reconhecida. reconhecida mas não corrigida, ou a 2 Reconhecida correção foi interrompida na página. Reconhecida, reconhecida e a correção chegou ao fim 3 Corrigida da página. reconhecida com pelo menos uma 4 Modificada mudança de edição ou formatação feita no Editor de texto. Modificada, reconhecida, editada no Editor de texto 5 corrigida e a correção chegou ao fim da página. obtida, talvez reconhecida; algumas 6 Pendente mudanças de zona estão armazenadas mas ainda não foram processadas. reconhecida e salva pelo menos uma 7 Salva vez. Miniaturas Isto apresenta um conjunto de imagens miniaturas numeradas, uma para cada página no documento. Percorra para ver as páginas, conforme necessário. A página atual possui o ícone de um ‘olho’. Você pode selecionar várias páginas no documento; estas possuem uma aparência particular. Use miniaturas para operações com páginas, da seguinte forma: Pular para uma página: Clique na miniatura da página desejada. Reordenar uma página: Clique na miniatura da página que deseja mover e arraste-a para cima do número da página desejada. As páginas são renumeradas automaticamente. Excluir uma página: Selecione a miniatura da página que você deseja excluir e pressione a tecla Delete. 28 Introdução
  • 29. Capítulo 2 Selecionar várias páginas: Mantenha a tecla Shift pressionada e clique em duas miniaturas para selecionar todas as páginas entre elas e incluí-las. Mantenha a tecla Ctrl pressionada conforme você clica nas miniaturas para adicionar páginas a uma seleção, uma a uma. Em seguida, você pode mover ou excluir as páginas selecionadas como um grupo ou enviá-las para (novo) reconhecimento. Você também pode exportar páginas selecionadas. Para obter informações sobre uma imagem de entrada, passe o cursor sobre sua miniatura (desde que o recurso Dicas sobre ferramentas esteja ativado). Um texto instantâneo exibe o tamanho da imagem em pixels e a unidade de medição do programa. A resolução da imagem também é mostrada. Gerenciador de documentos Isso fornece uma visão geral do documento em uma tabela. Cada linha representa uma página. As colunas apresentam informações estatísticas ou de status sobre cada página e (quando for o caso) sobre totais de documento. A figura mostra colunas especificadas por um usuário. Mova o cursor sobre o ícone de status de uma Digite aqui página para ver comentários ou uma miniatura palavras-chave da página. que podem ser pesquisadas. A página atual possui o ícone de um ‘olho’. Você pode usar o Gerenciador de documentos para operações na página, da seguinte forma: Pular para uma página: Clique na parte mais à esquerda da linha da página ou clique duas vezes em qualquer parte de sua linha. Reordenar uma página: Clique na linha da página que deseja mover e arraste-a para o local desejado. Um indicador na esquerda mostra onde a página será inserida. As páginas são renumeradas automaticamente. Excluir uma página: Selecione a linha da página que você deseja excluir e pressione a tecla Delete. Selecionar várias páginas: Mantenha a tecla Shift pressionada e clique em duas linhas de página para selecionar todas as páginas entre elas e incluí-las. Mantenha a tecla Ctrl pressionada conforme você clica nas linhas para adicionar páginas a uma seleção, uma a uma. Em seguida, você pode mover ou excluir as Gerenciamento de documentos 29
  • 30. páginas selecionadas como um grupo ou enviá-las para (novo) reconhecimento. Você também pode exportar páginas selecionadas. Quando várias páginas estiverem sendo selecionadas, a página definida como atual não muda. Todas as páginas selecionadas ficam em destaque. Personalizar colunas do Gerenciador de documentos Você pode especificar quais colunas de informações deseja ver no Gerenciador de documentos. Clique em Personalizar colunas ... no menu Visualizar para a seguinte caixa de diálogo: Esse item está em destaque. Clique em uma caixa de seleção para selecionar o item. Destaque um item e use estas setas Os tamanhos das para alterar a imagens são ordem das expressos em colunas. pixels. Defina uma largura para o item destacado. Defina quais colunas devem aparecer, suas larguras e ordem de coluna. O tópico Personalizar colunas do Gerenciador de documentos na Ajuda on-line esclarece o que é apresentado em cada coluna. Você pode alterar as larguras de coluna facilmente no Gerenciador de documentos; basta arrastar os divisores de coluna na barra de título. Exclusão de páginas de um documento As exclusões de página precisam ser confirmadas e podem ser desfeitas. Exclua a página atual somente com o item Excluir página atual no menu Editar. Exclua todas as páginas selecionadas no Gerenciador de documentos ou nas miniaturas pressionando a tecla Delete ou usando o comando Limpar do menu de atalho. 30 Introdução
  • 31. Capítulo 2 Impressão de um documento Você pode imprimir o documento com o item Imprimir no menu Arquivo. Escolha se deseja imprimir imagens ou texto (isto é, os resultados de reconhecimento conforme aparecem no Editor de texto). Você pode imprimir todas as páginas ou um intervalo de páginas. A ferramenta Imprimir na barra de ferramentas Padrão imprime imagens ou texto, dependendo se o Painel de imagem ou o Editor de texto estiverem ativos. Fechar um documento Escolha Fechar no menu Arquivo para fechar um documento. Você é avisado para salvar o documento se não o tiver salvo ou se o tiver modificado desde a última gravação. Consulte a próxima seção sobre como salvar o documento como um documento *.opd do OmniPage. Você também será avisado para salvar dados de treinamento não salvos se tiver selecionado ‘Perguntar se deseja salvar dados de treinamento ao fechar o documento’ no painel Correção da caixa de diálogo Opções. A última frase não se aplica ao OmniPage SE. Documentos do OmniPage O documento do OmniPage é o tipo de arquivo patenteado do programa; ele tem a extensão .opd. Ele é um dos tipos de arquivo oferecidos ao salvar um documento em um arquivo. Você salva o documento com o tipo de arquivo OPD se quiser trabalhar com ele novamente no OmniPage em uma sessão futura. Em seguida, você pode processar as páginas inacabadas, adicionar mais páginas e corrigir ou editar resultados de reconhecimento. Um documento do OmniPage contém as imagens originais da página (desentortadas e pré-processadas) com todas as zonas colocadas nela. Após o reconhecimento, o OPD também conterá os resultados de reconhecimento. Os caracteres reconhecidos são armazenados com os dados de confiança e de coordenadas. Isto preserva os vínculos entre imagem e texto, de forma que a verificação e a correção continuem disponíveis quando o OPD for reaberto em sessões futuras. Quando você salva um documento do OmniPage, as configurações atuais (e o treinamento não salvo) também são salvos. Quando você abre um documento do OmniPage, as suas configurações são aplicadas, substituindo as existentes no programa. Documentos do OmniPage 31
  • 32. Um documento OmniPage criado e salvo no OmniPage SE não inclui dados de treinamento. Todos os dados de treinamento contidos em arquivos OPD abertos no OmniPage SE serão ignorados. Por que salvar em OPD Você não tem que salvar os documentos no tipo de arquivo OPD. Normalmente, isto é feito pelas seguintes razões: o Você não pode terminar de trabalhar com o documento na sessão atual. o Você quer passar o documento para outros usuários que possuem OmniPage Pro ou OmniPage SE. Por exemplo, você pode passar um arquivo OPD a um especialista para correção. Em uma rede em um escritório, você pode fazer com que um scanner gere imagens para reconhecimento e que sejam corrigidas em várias estações de trabalho. o Você deseja construir um arquivo de documentos reconhecidos cujas imagens originais continuam acessíveis. Os textos reconhecidos permitem a busca por palavras-chaves e outras técnicas de pesquisa em documentos. Os resultados do reconhecimento devem ser salvos a partir de arquivos OPD antes de instalar uma atualização do OmniPage. Pode ser que estes arquivos não sejam totalmente compatíveis com formatos de arquivos OPD ou que somente as imagens sejam mantidas quando os arquivos forem atualizados. Quando você abre um OPD criado pelo OmniPage Pro 10, apenas as imagens são carregadas. Quando você abre um OPD criado pelo OmniPage Pro 11 ou sua edição especial, são carregadas imagens e páginas reconhecidas mas as zonas não são mantidas. Como salvar como OPD Se você estiver pensando em criar um OPD, pode salvar neste formato em um estágio inicial, por proteção. Use o botão Salvar para salvar periodicamente conforme você trabalha. Salve-o novamente no final da sua sessão. O botão Salvar salva o documento com o nome e tipo de arquivo de sua última gravação. Você pode salvar o documento repetidamente em formatos diferentes. Se a sua primeira gravação for com outro formato (por exemplo .doc), use o item Salvar como... do menu Arquivo para salvá-lo como um OPD. Se um documento é salvo como OPD e você posteriormente o salva com outro formato, ele não é salvo novamente automaticamente como OPD. Quando você fechar um documento ou sair do programa, será avisado para salvar o documento como OPD. A barra de título exibe o nome de arquivo do mais recente documento completo salvo. 32 Introdução
  • 33. Capítulo 2 Configurações A caixa de diálogo Opções é o local central para as configurações do OmniPage SE. Acesse essa caixa de diálogo a partir da bar de ferramentas Padrão ou do menu Ferramentas. A ajuda sensível ao contexto fornece informações sobre cada configuração. Na visão geral, os painéis de configuração são: OCR Use isto para especificar os idiomas de reconhecimento, um dicionário de usuário ou profissional, um caracter rejeitado e uma correspondência de fonte. Clique na caixa de verificação ao lado do idioma para selecioná-lo ou cancelar a seleção. É possível fazer várias seleções; selecione apenas os idiomas que aparecem no documento a ser reconhecido. Os itens na parte superior são os idiomas selecionados recentemente. Digite as primeiras letras de um idioma para acessá-lo.O OmniPage SE não oferece suporte para dicionários profissionais. Scanner Use isto para definir o tamanho da página e orientação para digitalização. Você também pode fazer configurações de brilho e contraste e definir opções para digitalizar documentos de várias páginas, com ou sem um alimentador automático de documentos (ADF). Você pode alterar as definições de configuração do scanner ou instalar um novo scanner ou alterar o scanner padrão. Consulte “Entrada do scanner” na página 51. Este painel não estará disponível se você solicitou a exibição da interface TWAIN nativa de seu scanner durante sua configuração. Consulte “Configuração do scanner com OmniPage SE” na página 14. Direct OCR Este recurso fornece serviços de OCR diretamente de seu processador de texto favorito ou aplicativo semelhante. Use este painel para registrar e eliminar o registro de aplicativos para o Direct OCR e ativar ou desativar este serviço. Você também pode especificar zoneamento automático ou manual e se a correção ortográfica é desejada ou não. Consulte “Como configurar o Direct OCR” na página 46. Processamento Use isto para definir o local onde novas imagens devem ser colocadas no documento, para configurar que sejam solicitadas mais páginas durante a digitalização, para especificar digitalização de página dupla quando se tratar de livros e outras configurações. Você pode alterar o idioma da interface aqui. O OmniPage SE não oferece suporte para a digitalização de 2 páginas. Configurações 33
  • 34. Correção Use isto para definir se a correção deve começar automaticamente após o reconhecimento. Defina também se o IntelliTrain deve ser executado e use-o para carregar ou trabalhar com um arquivo de treinamento. Consulte “Correção de resultados de OCR” na página 67. As referências a treinamento não se aplicam ao OmniPage SE. Layout personalizado Use isto para descrever o layout das páginas do documento de entrada com bastante precisão. Isto dá o controle máximo sobre o processo de zoneamento automático, instruindo-o a procurar ou ignorar colunas, imagens gráficas e tabelas. Consulte “Descrição do layout de documento” na página 53. Editor de texto Use isto para mostrar ou ocultar alguns recursos no Editor de texto, para definir a unidade de medida a ser usada e para ativar ou desativar a mudança de linha. Consulte “Edição de texto e de imagem” na página 75. No OmniPage Pro 12, se você tiver acesso a um Sistema de Gerenciamento de Documentos (DMS) em seu computador e sua edição do OmniPage Pro 12 incluir suporte a ODMA, um painel ODMA também pode aparecer. Consulte “Suporte a ODMA” na página 97. Algumas configurações só afetam os reconhecimentos futuros. Alguns exemplos são os idiomas do reconhecimento, um arquivo de treinamento ou o nível de brilho do scanner. Estas configurações devem ser ajustadas corretamente antes de você iniciar o processamento. Para que todas as alterações nestas configurações sejam aplicadas nas páginas já reconhecidas, você terá que reconhecê-las novamente. As outras configurações são implementadas imediatamente em todas as páginas existentes. Alguns exemplos são as configurações de Editor de texto como mudança de linha e unidades de medida. 34 Introdução
  • 35. Capítulo 3 Processamento de documentos Este tutorial descreve diferentes maneiras de processar um documento e também fornece informações sobre partes fundamentais deste processamento. x Guia de início rápido x Visão geral do processamento x Processamento automático x Processamento manual x Processamento combinado x Processamento com o Assistente de OCR x Processamento a partir de outros aplicativos (Direct OCR, PaperPort) x Processamento de documentos com Programar OCR Os tópicos detalhados são: x Definição da origem das imagens de página x Descrição do layout de documento x Zonas e planos de fundo • Zoneamento automático • Zoneamento manual • Tipos de zona e propriedades • Trabalho com zonas x Grades de tabela na imagem x Uso de gabaritos de zonas OmniPage SE Manual do usuário 35
  • 36. Guia de início rápido Este tópico o conduz passo a passo pelo processo básico de OCR. Carregamento e reconhecimento de amostras de arquivos de imagem Você encontrará amostras de arquivos de imagem na pasta de programas, que contém arquivos de uma e de várias páginas. Tente ler estes arquivos inicialmente usando o procedimento apresentado abaixo, exceto no que se refere a um scanner. Consulte “Entrada de arquivos de imagem” na página 50. Os resultados fornecem uma avaliação da qualidade do reconhecimento que você deve esperar de seus próprios arquivos com qualidade comparável. Em seguida, experimente digitalizar uma página do scanner. Digitalização e reconhecimento de uma única página Ligue o scanner e certifique-se de que ele está trabalhando corretamente. Escolha uma página com texto claro de boa qualidade para este teste. Partimos do pressuposto de que as configurações padrão do OmniPage SE estão definidas e que o documento está no idioma que você especificou como o idioma de interface durante a instalação. Abra a caixa de diálogo Opções no menu Ferramentas e escolha Usar padrões se você não estiver usando o programa pela primeira vez. Você processará o documento automaticamente e salvará os resultados de reconhecimento em um arquivo. Você corrigirá o documento, mas não o editará dentro do Editor de texto. 36 Processamento de documentos
  • 37. Capítulo 3 O que você faz O que acontece 1. Configure o scanner usando o Assistente de Configura o OmniPage SE para trabalhar com o scan- scanner, se isto ainda não tiver sido feito. ner. 2. Selecione Iniciar Programas ScanSoft Abre o OmniPage SE no computador. OmniPage SE 2.0 OmniPage SE 2.0 3. Coloque o documento corretamente no scanner. 4. Na lista suspensa Obter página, selecione uma Permite que você determine como as imagens ou tex- opção de digitalização para o documento: preto tos coloridos e fundos aparecerão no documento e branco, tons de cinza ou em cores. exportado. É necessário um scanner colorido para realizar digitalização em cores. 5. Na lista suspensa Descrição do Layout, verifique se Automático está selecionado. Para uma Configura o programa para colocar as zonas na ampla gama de documentos, esta é a melhor página e decidir suas propriedades automaticamente. opção. 6. Na lista suspensa Exportar resultados, verifique Isto significa que você poderá nomear o arquivo se Salvar como arquivo está selecionado. exportado após ter corrigido o documento. 7. Clique no botão Iniciar. O OmniPage SE começará a digitalizar o documento. Surge uma miniatura com um indicador de progresso. Surge o Corretor de OCR. 8. Use o Corretor de OCR para modificar as pala- O Corretor de OCR funciona como um corretor vras que o programa suspeita não terem sido ortográfico em um programa de processamento de reconhecidas corretamente. texto, mas com recursos adicionais específicos de OCR. Ele remove as marcações de palavras que foram corrigidas. 9. Clique no Editor de texto. Selecione as visualiza- Cada visualização de Editor de texto define um nível ções do Editor de texto uma após a outra, para de formatação. Isto indica qual nível escolher no ver como a página aparece em cada visualiza- momento de salvar. ção. 10. Clique em Continuar para reiniciar a correção. Isto termina o processo de correção de OCR. A caixa Quando a mensagem A correção de OCR termi- de diálogo Salvar como aparecerá. nou aparece, clique em OK. 11. Escolha um nome de arquivo, tipo de arquivo, Por definição, Salvar e iniciar é ativado, de forma que caminho e nível de formatação para salvar seu o seu documento será aberto automaticamente no documento reconhecido. Clique em OK. programa de processamento de texto associado ao tipo de arquivo selecionado. 12. Inspecione o documento no programa de pro- Você usou com êxito o OmniPage SE para recon- cessamento de texto. hecer o documento e abri-lo no aplicativo de destino! Se você teve êxito em obter bons resultados com as amostras de arquivos de imagem, mas não com a página digitalizada, verifique a instalação e as configurações do scanner: especialmente o brilho e a resolução da imagem. Consulte “Entrada do scanner” na página 51. Isso fornece um modelo de brilho Guia de início rápido 37
  • 38. ótimo. Consulte também os tópicos de ajuda on-line Configuração do scanner e Solução de problemas do scanner. Visão geral do processamento O seguinte diagrama de fluxo resume as etapas do processamento: Zoneamento Exportar páginas Obter páginas Descrever Realizar layout da automático OCR para o arquivo do arquivo página página 55 Verificar e página 83 página 50 página 53 editar Zoneamento com as página 68 para a Área de manual configurações transferência do scanner Aplicar um Corrigir página 88 página 56 atuais página 51 gabarito página 67 página 33 via Correio página 63 página 89 Aqui está uma visão geral dos métodos de processamento que você pode usar. Você encontrará instruções passo a passo para cada um deles nas páginas seguintes. Automático A forma mais rápida e fácil de processar documentos é deixar o OmniPage SE fazer isso automaticamente. Selecione as configurações na caixa de diálogo Opções e nas listas suspensas Caixa de ferramentas do OmniPage e clique em Iniciar. Cada página será processada do início ao fim, quando possível funcionando em paralelo. Normalmente, será feito o zoneamento automático nas páginas. Manual O processamento manual lhe dá controle mais preciso sobre a forma com que as suas páginas são tratadas. Você pode processar o documento página a página com configurações diferentes para cada página. O programa também pára entre cada etapa: obtenção de imagens, realização de reconhecimento, exportação. Isto lhe permite, por exemplo, delimitar zonas manualmente ou alterar os idiomas de reconhecimento. Você pode iniciar cada etapa clicando nos três botões na Caixa de ferramentas do OmniPage. Combinado Você pode processar um documento automaticamente e visualizar os resultados no Editor de texto. Se a maior parte das páginas estiverem em ordem, mas algumas não tiverem saído como esperado, você pode alternar para processamento manual para ajustar as configurações e reconhecer novamente 38 Processamento de documentos
  • 39. Capítulo 3 somente as páginas com problema. Outra alternativa é obter imagens com processamento manual, desenhar zonas em algumas ou todas elas e então enviar todas as páginas para o processamento automático. Uso do Assistente de OCR O Assistente de OCR o conduz durante a seleção de configurações e comandos fazendo perguntas. Em seguida, ele aciona o processamento automático. Esta é uma boa forma de se familiarizar se o OmniPage SE for uma novidade. Em outros aplicativos Você pode usar o recurso Direct OCR para chamar os serviços de reconhecimento do OmniPage SE enquanto trabalha em seu processador de texto normal ou aplicativo semelhante. O OmniPage SE se associa automaticamente ao PaperPort da ScanSoft e aos programas de gerenciamento de documentos Pagis. Mais tarde Você pode programar para que trabalhos de OCR sejam realizados automaticamente mais tarde, mesmo quando não estiver diante de seu computador. O Assistente de Nova tarefa do Programar OCR permite que você especifique configurações e a hora de início. O OmniPage SE não oferece suporte para o recurso Programar OCR. Visão geral do processamento 39
  • 40. Processamento automático O processamento automático fornece uma forma eficaz de tratamento de documentos, especialmente os maiores. Primeiro, selecione todas as configurações necessárias e, em seguida, pode usar o botão Iniciar na Caixa de ferramentas do OmniPage para processar um novo documento do início ao fim ou reiniciar e terminar o processamento de um documento aberto. Botão Iniciar Botão Obter página Botão Efetuar OCR Botão Exportar resultados Lista suspensa Obter Lista página suspensa Resultados da exportação Lista suspensa Descrição do layout 1. Selecione a configuração Obter página desejada na lista suspensa. Você define a origem de documentos, que pode ser de arquivos de imagem ou de um scanner. Consulte “Definição da origem das imagens de página” na página 50. 2. Selecione uma configuração na lista suspensa Descrição do Layout, conforme exibido acima. Isto guia o programa no zoneamento automático das páginas. Você descreve as páginas de entrada ou especifica um arquivo de gabarito de zonas. Consulte “Descrição do layout de documento” na página 53. 3. Selecione uma configuração da lista suspensa Exportar resultados. Você pode salvar o documento como um arquivo de Documento do OmniPage. Você pode salvar páginas (atual, selecionadas, todas) em um arquivo, copiá- las para a Área de transferência ou enviá-las como anexos de e-mail. Consulte “Gravação e exportação” na página 81. 40 Processamento de documentos
  • 41. Capítulo 3 4. Escolha na barra de ferramentas Padrão ou Opções no menu Ferramentas e verifique se as configurações são apropriadas para o documento. Você pode, por exemplo, especificar idiomas de reconhecimento e se deseja corrigir o documento ou não. Consulte “Configurações” na página 33. 5. Clique no botão Iniciar ou escolha Iniciar processamento automático no menu Processar. Cada página no documento é processada e terminada uma após a outra. O programa pode realizar tarefas simultaneamente, por exemplo, pode iniciar a carregar e a reconhecer uma nova página conforme você corrige a página anterior. Interromper e reiniciar o processamento automático Interromper: Quando o processamento automático estiver em andamento, o botão Iniciar transforma-se em Interromper. Clique nele para interromper o processamento automático. Você pode fazer isto se achar que algumas configurações precisam ser alteradas. Reiniciar: Quando o processamento automático for interrompido, o botão Iniciar é restaurado. Clique nele para reiniciar o processamento. A caixa de diálogo Processamento automático permite que você especifique o que deseja fazer: x Concluir o processamento de páginas não reconhecidas e não corrigidas e em seguida exportar os resultados. x Exportar novamente um documento já salvo, talvez com alterações, para um tipo diferente de arquivo, nome ou local ou com nível de formatação diferente. x Acrescentar mais páginas da mesma origem ou uma origem diferente, com configurações alteradas ou não. x Processar novamente todas as páginas para descartar todos os resultados de reconhecimento e reconhecer novamente todas as páginas no documento com configurações diferentes. Você pode especificar zoneamento automático ou um arquivo de gabarito. Isso pode ser útil caso uma configuração indesejada tenha causado resultados ruins em todas as páginas. Um exemplo é uma escolha de idioma incorreto, o que resulta em quase todas as palavras marcadas como suspeitas durante a correção. Esta opção permite que você realize novo reconhecimento sem ter que digitalizar, carregar ou refazer as zonas de todas as imagens novamente. Processamento automático 41
  • 42. Processamento manual O processamento manual lhe dá controle mais preciso sobre a forma com que as suas páginas são tratadas. Você pode processar o documento página a página com configurações diferentes para cada página. O programa também pára entre cada etapa: obtenção de imagens, realização de reconhecimento, exportação. Isto permite, por exemplo, alterar o fundo da página e delimitar zonas manualmente em cada página. Você pode iniciar cada etapa do processo clicando nos três botões numerados na Caixa de ferramentas do OmniPage. 1. Clique em na barra de ferramentas Padrão ou em Opções no menu Ferramentas para verificar ou fazer configurações na caixa de diálogo Opções. Consulte “Configurações” na página 33. 2. Selecione o valor desejado para o botão Obter página na lista suspensa. Você define a origem de documentos, que pode ser de arquivos de imagem ou de um scanner. Ao digitalizar, selecione um modo de digitalização e use os painéis Scanner e Processo da caixa de diálogo Opções para selecionar as configurações. Consulte “Definição da origem das imagens de página” na página 50. 3. Clique no botão Obter página. Isto faz aparecer a caixa de diálogo Carregar arquivo de imagem permitindo que você nomeie arquivos de imagem ou inicie a digitalização. Imagens em miniatura de cada página podem aparecer no Painel de imagem, juntamente com a imagem da página atual. Use os botões da barra de status para exibir ou ocultar qualquer uma delas. As páginas obtidas estão resumidas no Gerenciador de documentos. 4. As imagens de todas as páginas entram no programa com plano de fundo configurado para processar. Desde que você não desenhe zona alguma nestas páginas, elas serão zoneadas automaticamente quando for solicitado o reconhecimento. 5. Você pode delimitar e modificar zonas manualmente em uma ou mais imagens e atribuir propriedades de zona. Os botões da barra de status permitem que você vá para outras páginas. Assim que você desenha uma zona em uma página, ela assume um plano de fundo do tipo ignorar. Você pode especificar zoneamento automático em partes de uma página ao desenhar zonas do tipo processar. Consulte “Zonas e planos de fundo” na página 54. 42 Processamento de documentos
  • 43. Capítulo 3 6. Selecione o valor para o botão Efetuar OCR. Você descreve o layout das páginas de entrada. Este valor exerce influência se o zoneamento automático for executado em todas as páginas. Consulte “Descrição do layout de documento” na página 53. Você também pode selecionar um gabarito para ter suas zonas colocadas na página atual. Consulte “Uso de gabaritos de zonas” na página 63. 7. Clique no botão Efetuar OCR para que a página atual seja reconhecida. Para reconhecer as páginas selecionadas, faça várias seleções com miniaturas no Gerenciador de documentos (Consulte “Gerenciamento de documentos” na página 28.) e, em seguida, clique no botão Efetuar OCR. Páginas reconhecidas aparecem no Editor de texto. 8. Se você tiver solicitado correção, a caixa de diálogo Corretor de OCR exibe as palavras suspeitas das páginas reconhecidas, uma após a outra. Você pode corrigir e editar o texto reconhecido. Consulte “Correção de resultados de OCR” na página 67. 9. Continue a carregar páginas, realizar OCR, editar, corrigir e verificar conforme desejado. Você pode alterar a ordem de leitura dos elementos da página no Editor de texto. Consulte “Edição de texto e de imagem” na página 75. 10. Selecione um valor para o botão Exportar resultados. Você pode salvar o documento como um arquivo de Documento do OmniPage. Você pode salvar páginas (atual, selecionadas ou todas) em um arquivo, copiá-las para a Área de transferência ou enviá-las como anexos de e-mail. Clique no botão Exportar resultados. Consulte “Gravação e exportação” na página 81. Processamento combinado Processamento automático oferece velocidade e eficiência. Processamento manual exige mais atenção mas proporciona um maior controle sobre os resultados. É possível aproveitar ambas as vantagens ao processar um único documento. Iniciar automaticamente e terminar manualmente: Quando há um documento grande com somente algumas páginas precisando de atenção especial, você não tem que processar manualmente todo o documento. Você pode processá-lo automaticamente e visualizar os resultados no Editor de texto. Você pode determinar quais páginas estão em ordem e quais precisam de configurações diferentes ou algum zoneamento manual. Depois de ajustar as Processamento combinado 43
  • 44. configurações e/ou modificar as zonas, use o processamento manual para reconhecer novamente apenas aquelas páginas. 1. Prepare o documento e realize processamento automático, como já descrito. 2. Se você fechar ou terminar de corrigir, será convidado a salvar o documento. Isto é recomendado mesmo se o documento não estiver em sua forma final. 3. Selecione uma página que esteja precisando de um novo zoneamento ou modifique as zonas existentes no Painel de imagem. Você também pode carregar um gabarito para fazer com que suas zonas substituam as existentes. Delimite novas zonas, conforme desejado. Consulte “Zonas e planos de fundo” na página 54. 4. Altere as outras configurações conforme necessário para a página atual. Consulte “Configurações” na página 33. 5. Clique no botão Efetuar OCR para reconhecer novamente a página atual. Confirme que os resultados de reconhecimento anterior devem ser sobrescritos. Outra alternativa é usar o processamento em tempo real para tratar de mudanças de zoneamento sem precisar reconhecer novamente toda a página. Consulte “Edição em tempo real” na página 77. 6. Para reconhecer novamente mais de uma página, selecione as páginas necessárias nas miniaturas ou no Gerenciador de documentos antes de clicar no botão Efetuar OCR. 7. Quando todas as páginas tiverem sido reconhecidas novamente com resultados aceitáveis, salve o documento novamente. Iniciar e manualmente terminar automaticamente: 1. Prepare as configurações e obtenha imagens para o documento clicando no botão Obter página. 2. Examine as páginas para ver se o brilho, orientação e conteúdo são adequados. Digitalize novamente ou gire imagens inadequadas. Reorganize as páginas conforme desejar. 3. Crie zonas manualmente para as páginas nas quais deseja processar apenas parte da imagem ou se desejar fornecer instruções de zoneamento precisas. Use planos de fundo ou zonas do tipo ignorar para excluir áreas do processamento. Use planos de fundo ou zonas do tipo processar para especificar áreas a serem zoneadas automaticamente. 4. Clique no botão Iniciar e então escolha Concluir processamento de páginas existentes na caixa de diálogo Processamento automático. 5. Depois de corrigir (caso solicitado), você pode salvar ou exportar o documento. 44 Processamento de documentos
  • 45. Capítulo 3 Processamento com o Assistente de OCR O Assistente de OCR pode ser usado para iniciar o processamento de um novo documento. Se você selecioná-lo com um documento aberto, ele será fechado. O Assistente o conduz através de seis painéis de configuração, guiando-o para fazer as configurações em seu documento e, em seguida, iniciando o processamento automático. A ajuda sensível ao contexto está disponível para todos os painéis do Assistente. Clique no botão Assistente de OCR na Caixa de ferramentas do OmniPage para visualizar a primeira tela do assistente: 1. O primeiro painel permite que você defina a origem de documentos: scanner ou arquivo de imagem. Consulte “Definição da origem das imagens de página” na página 50. Responda à pergunta na primeira tela e, em seguida, clique em Avançar. 2. O segundo painel lhe pede para descrever o layout do documento de entrada, para auxiliar o zoneamento automático. Consulte “Descrição do layout de documento” na página 53. 3. O terceiro painel permite que você defina os idiomas de reconhecimento. Os idiomas com suporte de dicionário possuem o ícone de um livro aberto. As escolhas mais recentes encontram-se no topo da lista. 4. O quarto painel lhe pergunta se você deseja corrigir o texto antes de exportá-lo. Se você escolher Sim, também pode editar o texto antes de salvá- lo. Você também decide se cria e usa os dados do IntelliTrain durante a correção. Consulte “IntelliTrain” na página 72. As referências a IntelliTrain não se aplicam ao OmniPage SE. 5. O último painel lhe pede para definir a escolha de exportação: salvar em arquivo ou copiar para Área de transferência. Após configurar sua escolha, clique em Concluir para fechar o Assistente e iniciar o processamento automático. 6. Se você tiver requisitado correção e o texto contiver palavras suspeitas, a caixa de diálogo Corretor de OCR aparecerá. Quando a correção estiver concluída ou fechada, a caixa de diálogo Copiar para área de transferência ou Copiar como permite que você especifique as configurações de exportação de arquivo, incluindo o intervalo de páginas e o nível de formatação. 7. O documento continua no OmniPage SE. Você pode editar os resultados de reconhecimento e salvá-los novamente com outros formatos. Você pode alterar manualmente as zonas ou alterar outras configurações e, em seguida, Processamento com o Assistente de OCR 45
  • 46. usar processamento manual para reconhecer novamente páginas únicas do documento. Você pode adicionar páginas com ou sem processamento manual. Os painéis do Assistente apresentam configurações na forma como foram definidas pela última vez no programa. Além disso, o OmniPage SE lembrará das configurações que você fizer nos painéis do Assistente de OCR e as aplicará em um processamento automático ou manual futuro, até que você as altere. Portanto, se você tiver mais documentos para os quais suas configurações do Assistente de OCR forem adequadas, basta clicar em Iniciar na Caixa de ferramentas do OmniPage. As configurações aplicáveis não oferecidas pelo Assistente de OCR utilizam os últimos valores definidos no programa. Isto diz respeito principalmente a configurações do scanner, a um dicionário de usuário ou a um arquivo de treinamento. Os gabaritos de zonas não podem ser usados com o Assistente de OCR. Se um arquivo de gabaritos foi definido, quando o Assistente de OCR começar, ele será descarregado e Automático será definido como descrição de entrada. Você não pode exportar um documento reconhecido como um anexo de correio. Use o processamento automático ou manual para isso. Processamento a partir de outros aplicativos Você pode usar o recurso Direct OCRTM para chamar os serviços de reconhecimento do OmniPage SE enquanto trabalha em seu processador de texto normal ou em outro aplicativo. Primeiramente, você precisa estabelecer a conexão direta com o aplicativo. Em seguida, dois itens em seu menu Arquivo abrem a porta para os recursos de OCR. Como configurar o Direct OCR 1. Inicie o aplicativo que você deseja conectar ao OmniPage SE. Inicie o OmniPage SE, abra a caixa de diálogo Opções no painel Direct OCR e selecione Ativar o Direct OCR. 2. Selecione as opções de processamento para correção e zoneamento. Estas funcionarão para futuros trabalhos do Direct OCR até serem modificadas novamente; elas não são aplicadas quando o OmniPage SE for usado sozinho. 46 Processamento de documentos
  • 47. Capítulo 3 3. O painel Não registrados exibe os aplicativos registrados anteriormente ou em execução. Selecione nos desejados e clique em Adicionar. Você pode procurar por um aplicativo não listado. Como usar o Direct OCR 1. Abra o aplicativo registrado e trabalhe em um documento. Para obter resultados de reconhecimento de páginas digitalizadas, coloque-as corretamente no scanner. 2. Use o item Definições para obter texto... do menu Arquivo do aplicativo de destino para especificar as configurações a serem usadas durante o reconhecimento. Todas as configurações não oferecidas obtêm seus valores com base nos últimos valores usados no OmniPage SE. As configurações alteradas para o Direct OCR também são alteradas no OmniPage SE. 3. Use o item Obter texto do menu Arquivo para obter imagens do scanner ou do arquivo. 4. Se você tiver selecionado Delimitar zonas automaticamente no painel Direct OCR da caixa de diálogo Opções ou sob Definições para obter texto..., o reconhecimento começa imediatamente. 5. Se Delimitar zonas automaticamente não estiver selecionado, cada imagem da página será apresentada, permitindo que você delimite as zonas manualmente. Clique no botão Efetuar OCR para continuar com o reconhecimento. 6. Se a correção tiver sido especificada, ela será feita após o reconhecimento. Em seguida, o texto reconhecido é colocado na posição do cursor em seu aplicativo, com o nível de formatação especificado por Definições para obter texto... . Se o OmniPage SE estiver sendo executado quando o Direct OCR for chamado de um aplicativo de destino, uma segunda instância de OmniPage SE é acionada. Consulte os tópicos sobre o Direct OCR na Ajuda on-line para obter mais informações. Eles incluem um tópico Perguntas e respostas sobre o Direct OCR. O arquivo Leiame e o site da ScanSoft podem trazer informações mais recentes relacionadas a aplicativos de destino específicos. Processamento a partir de outros aplicativos 47
  • 48. Como usar o OmniPage SE com o PaperPort O PaperPort® é um software de gerenciamento de papéis da ScanSoft. Ele permite que você associe páginas a aplicativos adequados. As páginas podem conter figuras, texto ou ambos. Se o PaperPort existir em um computador com o OmniPage SE, os seus serviços de OCR ficam disponíveis e amplificam o poder do PaperPort. Você pode escolher um programa de OCR clicando com o botão direito em um vínculo de aplicativos de texto do PaperPort, selecionando Preferências e, em seguida, selecionando OmniPage SE 2.0 como o pacote de OCR. As configurações de OCR podem ser especificadas, assim como ocorre no Direct OCR. : Aqui, o OmniPage SE foi selecionado como o pacote de OCR para MS Word 2000. Você pode arrastar imagens de página da área de trabalho do PaperPort para o vínculo do MS Word no PaperPort. Enquanto o texto estiver sendo reconhecido, somente um monitor de progresso será exibido. A janela de zoneamento manual ou o recurso de correção do OmniPage SE aparecerá se solicitado. Os resultados de reconhecimento são colocados em um novo documento não nomeado no aplicativo de destino. 48 Processamento de documentos
  • 49. Capítulo 3 Processamento de documentos com Programar OCR O OmniPage SE não oferece suporte para o recurso Programar OCR. O texto a seguir aplica-se somente ao OmniPage Pro. Você pode programar os trabalhos de OCR para que sejam realizados automaticamente a qualquer momento dentro dos próximos oito dias. Cada tarefa trata um documento. As páginas do documento podem vir de um scanner com ADF ou de arquivos de imagem. Você não tem que estar presente diante de seu computador no momento da tarefa nem o OmniPage SE tem que estar sendo executado. Não importa se o computador é desligado após a tarefa ser configurada, contanto que ele esteja funcionando na hora do início da tarefa. Se você estiver digitalizando páginas, o scanner precisa estar funcionando na hora do início da tarefa, com as páginas carregadas no ADF. Veja como configurar um trabalho: 1. Clique em Programar OCR no menu Processar ou no menu Iniciar do Windows: selecione Programas ScanSoft OmniPage Pro 12.0 Programar OCR. 2. A caixa de diálogo Programar OCR aparece. Clique em Novo... para iniciar o Assistente de nova tarefa. Ele o conduz por seis painéis, semelhantes aos do Assistente de OCR. 3. No primeiro painel, você define a origem da imagem: scanner com ADF ou arquivo. 4. Os próximos dois painéis são semelhantes aos do Assistente de OCR, mas você também pode especificar um dicionário de usuário ou profissional e um arquivo de treinamento. Se o IntelliTrain é executado ou não, depende da configuração do OmniPage Pro na hora da tarefa. 5. Os seguintes painéis permitem que você especifique o nome, o tipo, o local do arquivo de exportação, uma opção de separação de arquivo e um nível de formatação. 6. Os dois últimos painéis permitem definir a hora de início e (quando aplicável) fim da tarefa e manter ou excluir arquivos de entrada depois do processamento. Clique em Concluir para fechar o Assistente. A caixa de diálogo Programar OCR lista todas as tarefas, com status Esperando, Em execução, Erro ou Concluído. Use Modificar tarefa... para alterar as configurações para uma tarefa em espera. Você pode visualizar, modificar e reutilizar as tarefas concluídas para processar novas tarefas que precisem de configurações semelhantes. Você pode excluir as tarefas concluídas quando não forem mais necessárias. Processamento de documentos com Programar OCR 49
  • 50. Definição da origem das imagens de página Há duas origens de imagens possíveis: de arquivos de imagem e de um scanner. Existem dois tipos principais de scanners: plano ou de alimentação de folhas. Um scanner pode ter um alimentador de documentos automático (ADF) incorporado, o que torna mais fácil digitalizar documentos de várias páginas. As imagens de documentos digitalizados podem ser inseridas diretamente no OmniPage SE ou podem ser salvas com o próprio software do scanner em um arquivo de imagem, que o OmniPage SE pode abrir posteriormente. Entrada de arquivos de imagem Você pode criar arquivos de imagem a partir de seu próprio scanner ou recebê- los via e-mail ou fax. O OmniPage SE pode abrir uma ampla gama de tipos de arquivos de imagem. Consulte “Tipos de arquivo para abrir e salvar imagens” na página 98. Selecione Carregar arquivo de imagem na lista suspensa Obter página. Os arquivos são especificados na caixa de diálogo Carregar arquivo de imagem. Isto aparece quando você inicia o processamento automático. No processamento manual, clique no botão Obter página ou use o menu Processar. A parte inferior da caixa de diálogo fornece configurações avançadas e pode ser exibida ou ficar oculta. Aqui, ela é exibida. Selecione essa Esta é a pasta atual. opção para ver uma miniatura do Use Shift+ cliques ou arquivo Ctrl+cliques para selecionado. Não colocar mais de um disponível quando arquivo na caixa de são selecionados texto do Nome de vários arquivos. arquivo. Especifique os tipos de arquivo que você Clique em Avançado deseja listados. para abrir o painel inferior e Básico para fechá-lo. Isto pode ser usado Use isto para adicionar para arquivos DCX, arquivos de pastas MAX e TIFF de várias diferentes e para páginas. controlar precisamente a ordem dos arquivos. Use estas setas para alterar a ordem dos arquivos. 50 Processamento de documentos
  • 51. Capítulo 3 Normalmente, o botão Adicionar coloca cada arquivo na parte final da lista de arquivos. Para colocar um arquivo em um local diferente, destaque um arquivo na lista. O novo arquivo será adicionado imediatamente abaixo do mais baixo arquivo em destaque. Entrada do scanner Você precisa ter um scanner compatível em funcionamento instalado corretamente com o OmniPage SE. Consulte “Configuração do scanner com OmniPage SE” na página 14. Você tem uma opção de modos de digitalização. Ao fazer sua opção, há duas considerações principais: x Que tipo de saída você deseja no documento de exportação? x Que modo fornecerá melhor precisão de OCR? Digitalização em preto e branco Selecione isto para digitalizar em preto e branco. Isto não é adequado se você deseja cores no documento de saída, nem se você quer que as imagens se pareçam com as fotografias 'preto e branco': elas precisam de digitalização em tons de cinza. Para obter melhor precisão de OCR, use isto para textos nítidos em preto sobre fundo branco ou claro. As imagens em preto e branco podem ser digitalizadas e tratadas mais rapidamente do que outras e ocupam menos espaço em disco. Digitalizar em tons de cinza Selecione isto para usar digitalização em tons de cinza. Escolha isto para manter as fotografias em ‘preto e branco’ no documento de saída. Para obter melhor precisão de OCR, use isto para as páginas com contraste variado ou baixo (sem muita diferença entre claro e escuro) e com texto em fundos sombreados ou coloridos. Digitalizar em cores Selecione isto para digitalizar em cores. Isso funcionará apenas com scanners coloridos. Escolha isto se você deseja imagens gráficas, textos ou fundos coloridos no documento de saída. Em termos de precisão de OCR, ela não oferece mais benefícios do que a digitalização em tons de cinza (para uma determinada resolução), mas precisará de muito mais tempo, recursos de memória e espaço em disco. Brilho e contraste Boas configurações de brilho e contraste são importantes na precisão de OCR. Configure isso no painel Scanner da caixa de diálogo Opções ou na interface de seu scanner. O diagrama ilustra uma configuração ótima de brilho. Após carregar uma imagem, verifique sua aparência. Se os caracteres estiverem espessos e se tocando, clareie o brilho. Se os caracteres estiverem finos e quebrados, escureça-o. Em seguida, digitalize novamente a página. Definição da origem das imagens de página 51
  • 52. Inadequada Tolerável Boa Melhor Boa Tolerável Inadequada Digitalização com um ADF A melhor forma de digitalizar documentos de várias páginas é usar um alimentador automático de documentos (ADF). Basta carregar as páginas no ADF na ordem correta. Coloque páginas em branco se você quiser salvar o documento em vários arquivos de saída usando a opção Criar um novo arquivo a cada página em branco. Consulte “Gravação dos resultados de reconhecimento” na página 83. Se você tiver um documento um pouco maior do que a capacidade do ADF, selecione Solicitar mais páginas automaticamente no painel Processar da caixa de diálogo Opções. Em seguida, uma caixa de diálogo deixa que você adicione mais lotes de páginas e sinaliza quando todas as páginas são digitalizadas. Você pode digitalizar documentos frente e verso com um ADF. Um scanner duplex gerenciará isto automaticamente. Para scanners não duplex, selecione Digitalizar páginas com frente e verso no painel Scanner da caixa de diálogo Opções. Em seguida, você pode digitalizar o documento em alguns passos, com as páginas pares agrupadas e as ímpares também agrupadas. O OmniPage SE mesclará as páginas para você. 52 Processamento de documentos
  • 53. Capítulo 3 Digitalização sem um ADF Você pode digitalizar documentos de várias páginas de forma eficaz com um scanner plano, mesmo sem um ADF. Selecione Digitalizar páginas automaticamente no painel Scanner da caixa de diálogo Opções e defina um valor de pausa em segundos. O scanner fará as passagens de digitalização automaticamente, pausando entre cada digitalização o número definido de segundos, dando-lhe tempo para colocar a próxima página. Uma caixa de diálogo permite terminar a pausa logo ou solicitar uma pausa maior e especificar quando a última página é digitalizada. O OmniPage Pro 12 permite digitalizar duas páginas de um livro por vez. O programa divide as imagens recebidas em duas páginas e as desinclina de forma independente. Esse recurso não está disponível no OmniPage SE. Descrição do layout de documento Antes de iniciar o reconhecimento, você é solicitado a descrever o layout das páginas de entrada, para auxiliar o processo de zoneamento automático. Quando você usa o Assistente de OCR, o zoneamento automático funciona sempre. Quando você usa o processamento automático, o zoneamento automático sempre é executado, a menos que você especifique um gabarito que não contenha uma zona ou plano de fundo do tipo processar. Quando você faz processamento manual, o zoneamento automático algumas vezes é executado. Consulte o tópico Quando o zoneamento automático é executado? da Ajuda on- line. Aqui estão as suas opções de descrição de entrada: Automático Escolha isto para permitir que seu programa tome todas as decisões de zoneamento automático. Ele decide se o texto está em colunas ou não, se um item é um texto ou uma imagem gráfica a ser reconhecida e se devem ser colocadas tabelas ou não. Escolha Automático se o seu documento contém páginas com layouts diferentes ou desconhecidos. Escolha-o para uma página com várias colunas e uma tabela e para páginas com mais de uma tabela. Coluna única, sem tabela Escolha esta configuração se as suas páginas contêm só uma coluna de texto e não contêm tabela. As cartas comerciais ou páginas de um livro normalmente são assim. Escolha-a também para uma página com palavras ou números arrumados em colunas se você não quiser que eles sejam arrumados em uma tabela, dispostos sem colunas ou tratados como colunas separadas. As imagens gráficas podem ser detectadas. Descrição do layout de documento 53
  • 54. Várias colunas, sem tabela Escolha esta opção se algumas de suas páginas contiverem texto em colunas e você quiser que percam as colunas ou que as colunas continuem separadas, semelhante ao layout original. Para manter as colunas com quadros no documento de saída, selecione True Page no momento da exportação. A exportação de página ligada do OmniPage Pro 12 mantém as colunas sem quadros. Se forem encontrados dados tabulares, provavelmente serão tratados como texto ligado. As imagens gráficas podem ser detectadas. Coluna única, com tabela Escolha esta configuração se a sua página contém só uma coluna de texto e uma tabela. O zoneamento automático não procurará por colunas mas tentará encontrar uma tabela e a colocará em uma grade no Editor de texto. Posteriormente, você pode especificar se deseja exportar em uma grade ou como colunas de texto separadas por tabulação. As imagens gráficas podem ser detectadas. Planilha Escolha isto se toda a sua página consiste em uma tabela que você deseja exportar para um programa de planilha ou tratar como uma tabela. Nem texto ligado nem zonas gráficas serão detectadas. Personalizado Escolha isto para controle máximo sobre zoneamento automático. Você pode impedir ou incentivar a detecção de colunas, imagens gráficas e tabelas. Faça as suas configurações no painel Layout personalizado da caixa de diálogo Opções. Gabarito Escolha um arquivo de gabarito de zonas se você deseja que seu valor de plano de fundo, zonas e propriedades sejam aplicados a todas as páginas obtidas a partir de agora. As zonas de gabarito também são aplicadas à página atual, substituindo todas as zonas existentes. Elas também serão aplicadas a páginas pré-existentes sem zonas quando elas forem reconhecidas novamente. Consulte “Uso de gabaritos de zonas” na página 63. Se o zoneamento automático forneceu resultados não esperados de reconhecimento, use processamento manual para fazer novo zoneamento em páginas individuais e reconhecê-las novamente. Zonas e planos de fundo As zonas definem áreas na página a serem processadas ou ignoradas. As zonas são retangulares ou irregulares, com os lados formados por linhas verticais ou horizontais. As imagens na página de um documento têm um valor de plano de fundo: processar ou ignorar (este último é mais comum). Os valores de plano de 54 Processamento de documentos
  • 55. Capítulo 3 fundo podem ser mudados com as ferramentas mostradas. Zonas podem ser desenhadas em planos de fundo de página com as seguintes ferramentas: Planos de fundo Processar Ignorar Imagens Zonas Processar Ignorar Texto Tabela gráficas Áreas do tipo processar (em zonas ou planos de fundo do tipo processar) são zoneadas automaticamente quando são enviadas para reconhecimento. Áreas do tipo ignorar (em zonas ou planos de fundo do tipo ignorar) são descartadas pelo processamento. Nenhum texto é reconhecido e nenhuma imagem é transferida. Zoneamento automático O zoneamento automático permite que o programa detecte blocos de texto, títulos, figuras e outros elementos em uma página e desenhe zonas em torno deles. Ele atribui tipos de zonas e propriedades àquelas zonas. O zoneamento automático é executado em páginas inteiras quando você usa o processamento automático, a menos que você tenha carregado um gabarito. Ele é executado quando você usa o Assistente de OCR. Você pode também especificar o zoneamento automático ao usar o processamento manual, da seguinte maneira: Zoneamento automático de uma página inteira Obter uma página: Ela aparece com um plano de fundo do tipo processar. Não desenhe nenhuma zona nela e verifique na lista suspensa Descrição de layout que nenhum gabarito de zona foi carregado. Clique no botão Executar OCR. Você pode selecionar várias páginas sem zonas para que elas sejam zoneadas automaticamente e reconhecidas juntas. Zoneamento automático de parte de uma página Obter uma página: Ela aparece com um plano de fundo do tipo processar. Desenhar uma zona. O plano de fundo muda para ignorar. Desenhe zonas de texto, tabela ou imagens gráficas para circundar áreas que você quer que sejam zoneadas manualmente. Desenhe zonas do tipo processar para circundar áreas que você deseja que sejam zoneadas automaticamente, Depois do reconhecimento, as zonas do tipo processar serão substituídas por uma ou mais zonas de texto, tabelas ou imagens gráficas. Zoneamento automático do plano de fundo de uma página Obter uma página: Ela aparece com um plano de fundo do tipo processar. Desenhar uma zona. O plano de fundo muda para ignorar. Desenhe zonas de Zonas e planos de fundo 55
  • 56. texto, tabela ou imagens gráficas para circundar áreas que você quer que sejam zoneadas manualmente. Clique na ferramenta Plano de fundo processar (mostrado) para definir um plano de fundo do tipo processar. Desenhe zonas do tipo ignorar em partes da página que você não precisa. Depois do reconhecimento a página voltará com um plano de fundo do tipo ignorar e novas zonas em torno de todos os elementos encontrados no plano de fundo. Zoneamento manual Primeiro apresentamos dois exemplos de zonas e planos de fundo. Em seguida detalharemos os tipos de zona. Por fim, explicaremos como desenhar e trabalhar com zonas. Nestes exemplos, os números referem-se à tabela na página seguinte. Desenhar zonas em um plano de fundo do tipo ignorar: Antes do Depois do reconheci- reconheci- mento: mento: A zona 4 retorna Plano de fundo como um conjunto de permanece zonas, neste caso como ignorar. para tratar três colu- nas de texto e uma foto. Desenhar zonas em um plano de fundo do tipo processar: Antes do Depois do reconheci- reconheci- mento: mento: A zona 6 é absorvida O plano de no plano de fundo. fundo é alterado Todas as zonas no para ignorar. lado esquerdo da página foram criadas automaticamente. 56 Processamento de documentos
  • 57. Capítulo 3 Nº Tipo O que acontece: 1 Zona de texto OCR é executado e gera texto. 2 Zona de tabelas O OCR é executado, o texto é colocado em uma grade de tabela. 3 Zona gráfica A imagem é embutida na página reconhecida. 4 Zona do tipo processar O zoneamento automático cria uma ou mais zonas, decide seus tipos e processa seus 5 Planos de fundo do tipo conteúdos. processar 6 Ignorar zona 7 Planos de fundo do tipo Nada ignorar Zonas desenhadas automaticamente e zonas de gabarito têm molduras sólidas: Zonas desenhadas manualmente ou modificadas têm molduras pontilhadas: Zonas não têm uma ordem de leitura. A reorganização de elementos reconhecidos pode ser feita no Editor de texto. Consulte “Edição de texto e de imagem” na página 75. O zoneamento em tempo real é descrito em Capítulo 4. Consulte “Edição em tempo real” na página 77. Tipos de zona e propriedades Cada zona tem um tipo de zona. As zonas contendo texto também podem ter uma configuração de conteúdo de zona: alfanumérica ou numérica. O tipo de zona e o conteúdo da zona juntos constituem as propriedades da zona. Clique com o botão direito na zona para obter um menu de atalho que permita que você altere as propriedades da zona. Selecione várias zonas com Shift+click para alterar as suas propriedades com uma ação. A barra de ferramentas Imagem fornece cinco ferramentas para desenhar zonas, uma para cada tipo. O tipo da zona é indicado por um ícone em seu canto superior esquerdo e pelo ícone e pela cor da moldura da zona. Aqui estão as ferramentas e as cores: Zona do tipo processar (cor de oliva) Use isso para desenhar uma zona do tipo processar, para definir a área de uma página onde o zoneamento automático será realizado. Depois do Zonas e planos de fundo 57
  • 58. reconhecimento, esta zona será substituída por uma ou mais zonas com tipos de zona determinados automaticamente. Normalmente, você desenha zonas do tipo processar em um plano de fundo do tipo ignorar. Desenhe uma zona do tipo processar para circundar colunas de texto para que elas sejam tratadas automaticamente. Elas perderão a estrutura de colunas na visualização NF e RFP do Editor de texto, mas serão mantidas em colunas na visualização True Page. Zona do tipo ignorar (cinza) Use isto para desenhar uma zona do tipo ignorar, para definir uma área de página que você não quer que seja transferida para o Editor de texto. O zoneamento automático não colocará zonas aqui. Para excluir uma dada área da página em muitas páginas (por exemplo um título ou a numeração da página), coloque uma zona do tipo ignorar em um gabarito. Normalmente você desenha zonas do tipo ignorar em um plano de fundo do tipo processar. Zona de texto (marrom) Use isso para desenhar uma zona de texto. Desenhe esta zona sobre um bloco único de texto. O conteúdo da zona será tratado como texto ligado, sem encontrar colunas. Se você deseja que colunas de texto sejam tratadas automaticamente, circunde-as em uma zona do tipo processar. Zona de tabelas (azul) Use isto para que o conteúdo da zona seja tratado como uma tabela. As grades de tabela podem ser detectadas automaticamente ou colocadas manualmente como descritas na próxima seção. As zonas de tabelas precisam ser retangulares. O Editor de texto exibe a tabela em uma grade editável. Para muitos tipos de arquivo de saída, você pode escolher se deseja exportar as tabelas em grades ou em colunas separadas por tabulações. Zona gráfica (verde) Use isto para incorporar uma figura, diagrama, desenho, assinatura ou qualquer coisa que você quer transferir para o Editor de texto como uma imagem incorporada e não como texto reconhecido. As imagens incorporadas podem ser exportadas com o documento para os aplicativos de destino que suportam imagens gráficas. Zonas de texto e tabela têm uma configuração do conteúdo da zona. O conteúdo alfanumérico valida todos os caracteres necessários para a sua opção de idioma. Os resultados de reconhecimento de uma zona numérica conterão somente números e pontuação relativa a número. Nenhuma letra será colocada. Use o menu de atalho da zona para alterar esta configuração. Clique com o botão direito do mouse fora de uma zona para obter um menu de atalho adaptado para a imagem inteira. Isto permite que você amplie, reduza ou gire a imagem. Quando uma imagem gira, todas as zonas nela são excluídas. 58 Processamento de documentos
  • 59. Capítulo 3 Trabalho com zonas A barra de ferramentas Imagem fornece ferramentas de edição de zonas. Uma é sempre selecionada. Quando você não quiser mais o serviço de uma ferramenta, clique em uma ferramenta diferente. Algumas ferramentas nesta barra de ferramentas são agrupadas. Apenas a última ferramenta selecionada do grupo é visível. Para selecionar uma ferramenta visível, clique nela. Para selecionar uma ferramenta oculta, mantenha o botão do mouse pressionado no triângulo no canto inferior direito da ferramenta visível até que as demais ferramentas apareçam, então clique na ferramenta desejada. Desenhar uma zona única Selecione a ferramenta de desenhar zonas do tipo desejado, em seguida clique e arraste o cursor. Nestes exemplos, isso é mostrado por uma seta indo de A a B. Também é possível arrastar do canto superior esquerdo para o canto inferior direito. Apenas zonas retangulares podem ser desenhadas; zonas (exceto zonas de tabela) podem se tornar irregulares depois de desenhadas. Para redimensionar uma zona, selecione-a com um clique, mova o cursor para uma das laterais ou cantos, apanhe uma alça e mova-a para o local desejado. Para mover uma zona, selecione-a com a ferramenta de seleção de zona e mova-a conforme desejar. Você não pode mover uma zona de modo que ela venha a sobrepor outra zona. Criar uma zona irregular por adição Desenhe uma zona que parcialmente se sobreponha a outra do mesmo tipo: zona existente zona resultante nova zona Zonas e planos de fundo 59
  • 60. Junte duas zonas do mesmo tipo Desenhe uma zona que parcialmente se sobreponha duas zonas do mesmo tipo. zonas nova zona resul- exis- zona tante tentes Criar uma zona irregular por subtração Desenhe uma zona sobreposta do mesmo tipo do plano de fundo (neste exemplo, um plano de fundo do tipo ignorar). zona exis- tente em um plano de fundo do tipo zona ignorar result- nova ante zona do tipo ignorar Dividir uma zona Desenhe uma zona divisora do mesmo tipo do plano de fundo (neste exemplo, um plano de fundo do tipo processar). zona de texto exis- tente em um plano de fundo do zonas tipo proces- result- sar nova zona do antes tipo processar 60 Processamento de documentos
  • 61. Capítulo 3 Os seguintes formatos de zona são proibidos: Recuada ao Recuada ao Com um furo longo da parte longo da no meio inferior parte supe- rior Para expandir uma zona mais rapidamente do que usando as alças de redimensionamento, desenhe uma zona do mesmo tipo para delimitá-la completamente. A zona menor é substituída pela maior. Para substituir um conjunto de zonas de qualquer tipo por uma única zona, desenhe uma zona maior do tipo desejado para delimitá-las completamente. Todas as zonas menores são substituídas pela maior. Quando você desenha uma nova zona que se sobrepõe parcialmente a uma zona existente de um tipo diferente, na verdade ela não a sobrepõe; a nova zona substitui a parte sobreposta da zona existente. Os diagramas no tópico Desenhar zonas manualmente da Ajuda on-line esclarecem esses dois tópicos. Grades de tabela na imagem Após o processamento automático, você poderá ver zonas de tabelas colocadas em uma página. Elas são denotadas com um ícone de zona de tabela no canto esquerdo superior da zona. Para mudar uma zona retangular de ou para uma zona de tabela, use o seu menu de atalho. Você pode também desenhar zonas de tabela mas elas precisam permanecer retangulares. Você delimita ou move divisores de tabela para determinar se as linhas de grade aparecerão quando a tabela for colocada no Editor de texto. Você pode desenhar ou redimensionar uma zona de tabela (desde que ela permaneça retangular) para descartar colunas ou linhas desnecessárias das extremidades de uma tabela. As cinco ferramentas agrupadas de tratamento de tabela na barra de ferramentas de imagem podem ser usadas se a página atual contiver uma zona do tipo tabela. Se a ferramenta que você precisa não está visível, clique no triângulo no canto inferior direito da ferramenta visível para exibir todas as ferramentas e em seguida clique na ferramenta desejada. Use as ferramentas de tabela e seus cursores da seguinte maneira: Inserir divisores de linha Clique na ferramenta e, em seguida, clique no local na zona de tabela onde você Grades de tabela na imagem 61
  • 62. deseja colocar um divisor de linha. Evite colocar um divisor de modo que ele corte um texto ao meio. Inserir divisores de coluna Clique na ferramenta e, em seguida, clique no local na zona de tabela onde você deseja colocar um divisor de coluna. Mover divisores Clique na ferramenta e mova o cursor para o divisor de linha ou coluna a ser movido. Ele exibe uma seta de duas pontas. Arraste o divisor conforme necessário. Você não pode arrastá-lo além de suas vizinhanças. Evite colocar divisores de modo que eles cortem texto ao meio. Remover divisores Clique na ferramenta e, em seguida, clique em um único divisor de linha ou coluna que você deseja excluir. Faça isso se um divisor estiver localizado incorretamente ou se você quiser alterar a aparência da tabela no documento final. Por exemplo, você pode colocar duas colunas de dados em uma única coluna excluindo o divisor entre as colunas. Inserir/Remover todos os divisores Clique nesta ferramenta e clique em seu ícone do cursor dentro de uma zona de tabela sem divisores. Os divisores serão detectados automaticamente e inseridos. Clique nele em um tabela com divisores para fazer com todos desapareçam. Pressione a tecla CTRL enquanto aciona o mouse se desejar inserir, mover ou excluir um divisor apenas na célula atual. Você pode especificar a formatação de linha para molduras e grades de tabela a partir de um menu de atalho Depois do reconhecimento você terá mais escolhas para editar molduras e sombreamento no Editor de texto. 62 Processamento de documentos
  • 63. Capítulo 3 Uso de gabaritos de zonas Um gabarito pode conter um valor de plano de fundo e um conjunto de zonas e suas propriedades, armazenados em um arquivo. Um arquivo de gabarito de zona pode ser carregado para que as zonas de gabarito sejam usadas durante o reconhecimento. Carregue um arquivo de gabarito na lista suspensa Descrição de layout ou no menu Ferramentas. Quando você carrega um gabarito, seu plano de fundo e suas zonas são inseridos: x na página atual, substituindo quaisquer zonas existentes x em todas as páginas obtidas futuramente x em páginas pré-existentes enviadas para um novo reconhecimento sem quaisquer zonas. Com processamento manual as zonas de gabarito nos dois primeiros casos podem ser visualizadas e modificadas antes do reconhecimento. Com processamento automático as zonas de gabarito podem ser visualizadas e modificadas apenas depois do reconhecimento. Este comportamento continua até que o gabarito seja descarregado. Gabaritos aceitam zonas e planos de fundo do tipo ignorar e processar. Portanto, eles podem ser úteis para definir quais partes das páginas devem ser processadas com zoneamento automático e quais partes devem ser ignoradas. Zonas ou planos de fundo do tipo processar em um gabarito podem ser substituídos durante o reconhecimento por um conjunto de zonas menores; tipos específicos de zona serão atribuídos a essas zonas. Como salvar um gabarito de zona Selecione um valor de plano de fundo e prepare zonas em uma página. Verifique suas localizações e propriedades. Clique em Gabarito de zona ... no menu Ferramentas. Na caixa de diálogo, selecione [zonas na página] e clique em Salvar, em seguida atribua um nome e clique em OK. Como modificar um gabarito de zona Carregue um gabarito e obtenha uma imagem adequada com processamento manual. As zonas do gabarito aparecem. Modifique as zonas e/ou propriedades conforme desejado. Abra a caixa de diálogo Arquivo de gabarito de zona. O gabarito atual é selecionado. Clique em Salvar e em Fechar. Uso de gabaritos de zonas 63
  • 64. Como descarregar um gabarito Selecione uma configuração sem gabarito na lista suspensa Descrição de layout. As zonas de gabarito não são removidas das páginas existentes ou atuais, mas as zonas de gabarito não serão mais usadas para processamento futuro. Você também pode abrir a caixa de diálogo Arquivos de gabarito de zona, selecionar [nenhum] e clicar no botão Definir como atual. Neste caso, a configuração de descrição do layout volta para Automático. Como substituir um gabarito por outro Selecione um gabarito diferente na lista suspensa Descrição de layout ou abra a caixa de diálogo Arquivos de gabarito de zona, selecione o gabarito desejado e clique no botão Definir como atual. Zonas do novo gabarito são aplicadas à página atual, substituindo quaisquer zonas já existentes. Elas também são aplicadas conforme explicado acima. Como excluir um arquivo de gabarito Abra a caixa de diálogo Arquivos de gabarito de zona. Selecione o gabarito e clique no botão Delete. As zonas já colocadas por este gabarito não são removidas. Gabaritos estão disponíveis em Direct OCR, mas não no Assistente de OCR. 64 Processamento de documentos
  • 65. Capítulo 4 Correção e edição Os resultados de reconhecimento são colocados no Editor de texto. Eles podem ser textos reconhecidos, tabelas e imagens gráficas incorporadas. Este editor do tipo WYSIWYG (What You See Is What You Get, o que se vê é o que será impresso) oferece os recursos a seguir, que serão detalhados neste capítulo: x Exibição e visualizações do editor x Correção de resultados de OCR x Verificação de texto x Dicionários do usuário x Treinamento x Edição de texto e de imagem x Edição em tempo real x Leitura de texto em voz alta OmniPage SE Manual do usuário 65
  • 66. Exibição e visualizações do editor O Editor de texto exibe os textos reconhecidos e pode marcar as palavras consideradas suspeitas durante o reconhecimento com um sublinhado ondulado. x Verde – Palavras ausentes do dicionário: Elas foram reconhecidas na base da confiança mas não foram encontradas em nenhum dicionário ativo: padrão, de usuário ou profissional. x Azul – Palavras com caracteres suspeitos: Elas contém caracteres não reconhecidos ou são palavras aprovadas pelo dicionário contendo caracteres reconhecidos com menor confiança. x Vermelho – Palavras suspeitas: Provavelmente são palavras ausentes do dicionário com um ou mais caracteres suspeitos, mas podem também ser suspeitas por outros motivos. Você pode configurar se as palavras ausentes de dicionário serão marcadas ou não no painel Corrigir da caixa de diálogo Opções. Todos os marcadores podem ser mostrados ou ocultados conforme selecionado no painel Editor de texto da caixa de diálogo Opções. Você também pode mostrar ou ocultar caracteres não imprimíveis e indicadores de cabeçalho e rodapé. O painel no Editor de texto também permite que você defina uma unidade de gerenciamento do programa e uma configuração de mudança de linha para uso em todas as visualizações do editor de texto exceto a visualização Sem formatação. O OmniPage SE pode exibir páginas com três níveis de formatação. Você pode alternar livremente entre eles usando os três botões no canto inferior esquerdo do Editor de texto ou do menu Visualizar. As imagens gráficas e as tabelas podem aparecer em todas as visualizações. Aqui estão as diferenças principais entre as visualizações: Visualização Sem formatação Exibe texto simples sem colunas alinhado à esquerda com uma única fonte e um tamanho de fonte, com as mesmas quebras de linha do documento original. A maior parte dos botões de formatação e caixas de diálogo estão desativadas. As réguas não são exibidas. Você pode achar isto conveniente para verificar e editar o texto. Visualização Preservar fontes e parágrafos Exibe texto sem colunas com estilo de parágrafo e de fonte. A régua horizontal é exibida. Você pode achar esta visualização conveniente para verificar, editar e modificar o texto com seu estilo. Visualização True Page A visualização True Page® tenta conservar o máximo possível da formatação do documento original. O estilo de caracteres e do parágrafo é mantido. Todos os 66 Correção e edição
  • 67. Capítulo 4 elementos de página, incluindo colunas, são colocados em caixas e quadros. A ordem de leitura pode ser exibida por setas. Veja página 75. O nível de formatação para exportação é escolhido separadamente no momento da exportação. Correção de resultados de OCR Após uma página ser reconhecida, os resultados de reconhecimento aparecem no Editor de texto. A correção inicia automaticamente se isto foi solicitado no painel Correção da caixa de diálogo Opções ou no Assistente de OCR. Você pode iniciar a correção manualmente a qualquer momento. Trabalhe da seguinte maneira: 1. Clique na ferramenta Corrigir OCR na barra de ferramentas Padrão ou escolha Corrigir OCR... no menu Ferramentas. 2. A correção começa do início do documento, mas pula o texto já corrigido. Se um erro suspeito for detectado, a caixa de diálogo Corretor de OCR colore a palavra suspeita em seu contexto e exibe uma figura de como ela se parecia originalmente na imagem. Isto informa porque a palavra está marcada. Painel de edição: A palavra marcada é exibida na cor de seu marcador: vermelho, A imagem da azul ou verde. palavra suspeita fica em destaque. Esta janela mostra a parte correspondente da imagem original. Arraste um canto Clique dentro dela ou a parte para ampliar ou reduzir inferior da caixa a exibição. de diálogo para redimensioná-la. 3. Se a palavra reconhecida estiver correta, clique em Ignorar ou Ignorar todas para ir para a próxima palavra suspeita. Clique em Acrescentar para adicionar ao dicionário atual do usuário e ir para a próxima palavra suspeita. Correção de resultados de OCR 67
  • 68. 4. Se a palavra reconhecida não estiver correta, modifique-a no painel de Edição ou selecione uma sugestão do dicionário. Clique em Substituir ou Substituir todas para implementar a alteração e ir para a próxima palavra suspeita. Clique em Acrescentar para adicionar a palavra alterada ao dicionário atual do usuário e ir para a próxima palavra suspeita. 5. Os marcadores de cores são removidos das palavras no Editor de texto conforme elas são corrigidas. Você pode alternar para o Editor de texto durante a correção para fazer correções lá. Clique no botão Continuar para reiniciar a correção. Clique em Fechar para interromper a correção antes que o fim do documento seja alcançado. Uma página é marcada com o ícone de corrigido em sua miniatura e no Gerenciador de documentos se a correção tiver chegado ao final da página. Se os marcadores estavam ocultos no Editor de texto quando a correção foi iniciada ou a opção Localizar próxima suspeita for selecionada, os marcadores passam a ser exibidos e permanecem visíveis depois da correção. Se a opção Marcar palavras ausentes do dicionário estiver desativada no painel Correção da caixa de diálogo Opções, a correção só será interrompida em palavras marcadas em vermelho ou azul, e não em palavras ausentes do dicionário. Isto é útil ao verificar páginas com muitas palavras ausentes do dicionário, como em catálogos de produtos que contém códigos e bibliografias que contém muitos nomes próprios. Use a opção Verificar novamente página atual no menu Ferramentas para executar uma nova verificação ortográfica em uma página que já foi corrigida. Faça isso para verificar palavras digitadas ou coladas no Editor de texto depois que a correção foi feita. Isso funciona mesmo que a opção Marcar palavras ausentes do dicionário esteja desativada no painel Correção. Verificação de texto Após o reconhecimento de OCR, você pode comparar todas as partes do texto reconhecido com a parte correspondente da imagem original para verificar se o texto foi reconhecido corretamente. Trabalhe da seguinte maneira: 68 Correção e edição
  • 69. Capítulo 4 Para fazer isso: Use isso: Ativar o verificador F9 ou ferramenta verificador Desativar o verificador Esc ou F9 ou ferramenta verificador Ativar/desativar verificador temporaria- F8: pressione e mantenha pressionado mente Exibir verificador até próxima tecla ser Clique duas vezes na palavra pressionada Ampliar a exibição Alt + Num + ou clique no verificador Reduzir a exibição Alt + Num – ou clique no verificador Tornar o verificador dinâmico ou aco- Alt + Num / plado/flutuante Contexto dinâmico (3 valores possíveis) Alt + Num * A ferramenta verificador está na barra de ferramentas Formatação. O verificador também pode ser controlado pelo menu Ferramentas. Passe o cursor sobre um verificador para obter a barra de ferramentas verificador. Use-a da seguinte forma: ferramenta verificador (ativar/desativar) Arraste entre flutuante e acoplado para flutuar ou acoplar (retorna ao último estado) Qual a quantidade de contexto para o verificador dinâmico? Barra de • uma palavra ferramentas do • três palavras (atual + vizinhas) Verificador: • linha inteira da imagem para dinâmico ampliar/reduzir zoom Editor de texto Verificação de texto 69
  • 70. Você deve corrigir e verificar os textos antes de fazer edições de grande escala. Se você cortar e colar grandes blocos de texto, as associações entre o texto e a imagem podem ser corrompidas. O recurso Texto para fala do OmniPage Pro 12 pode ler em voz alta o texto reconhecido, como outra forma de verificação de texto. Você pode ouvir o texto letra a letra, palavra a palavra, linha a linha, frase a frase ou em páginas inteiras. Consulte a seção ”Leitura de texto em voz alta” na página 78. Este recurso está disponível no OmniPage SE. Dicionários do usuário O programa possui dicionários internos para muitos idiomas. Estes ajudam no reconhecimento e podem oferecer sugestões durante a correção. Eles podem ser complementados por dicionários do usuário. Você pode salvar quantos dicionários de usuário quiser, mas somente um pode ser carregado por vez. Os dicionários do usuário do Microsoft Word também estão disponíveis; um dicionário chamado Personalizado é o dicionário padrão do usuário para Microsoft Word. Início de um dicionário de usuário Clique em Acrescentar na caixa de diálogo Corretor de OCR sem dicionário de usuário carregado ou abra a caixa de diálogo Arquivos de dicionário do usuário no menu Ferramentas e clique em Novo. Será pedido para que você dê um nome ao dicionário imediatamente. Carregamento ou descarregamento de um dicionário de usuário Faça isso no painel OCR da caixa de diálogo Opções ou na caixa de diálogo Arquivos de dicionário do usuário. Selecione um arquivo de dicionário para carregá-lo ou [nenhum] para descarregar um dicionário do usuário. Edição ou exclusão de um dicionário de usuário Adicione de palavras carregando um dicionário de usuário e, em seguida, clicando em Acrescentar na caixa de diálogo Corretor de OCR. Você pode acrescentar e excluir palavras clicando em Editar na caixa de diálogo Arquivos de dicionário do usuário. O botão Excluir permite que você exclua o dicionário de usuário selecionado. Ao editar um dicionário de usuário, você pode importar uma lista de palavras de um arquivo de texto simples para adicionar palavras ao dicionário rapidamente. Cada palavra precisa estar em uma linha separada sem pontuação no início ou fim da palavra. 70 Correção e edição
  • 71. Capítulo 4 No OmniPage Pro 12, dicionários especializados estão disponíveis, em alguns idiomas, para determinadas profissões (no momento, advogados e médicos). Eles não estão disponíveis no OmniPage SE. O programa identifica o idioma dos textos reconhecidos e exibe-o na barra de status. Esta marcação de idioma é exportada junto com o documento. Use Definir idioma... no menu Ferramentas para alterar a marcação de idioma do texto selecionado. Isto não altera o(s) idioma(s) de reconhecimento. Treinamento O OmniPage SE não oferece suporte para o treinamento, IntelliTrain nem para arquivos de treinamento. Eles se encontram disponíveis no OmniPage Pro 12. Os dados de treinamento contidos em arquivos OPD serão ignorados quando abertos no OmniPage SE Treinamento é o processo de alterar as soluções de OCR atribuídas aos formatos de caracter na imagem. Isto é útil para documentos degradados uniformemente ou quando um tipo de fonte incomum é usado em todo um documento. O treinamento será menos útil em textos com distorções aleatórias. Veja um exemplo, baseado na letra “g”, que pode ser impressa de formas diferentes: Os dois primeiros exemplos não precisam de treinamento porque as duas formas da letra “g” são normais e o programa pode tratá-las. O terceiro exemplo poderia se beneficiar do treinamento porque a forma de “g” é incomum e todas as instâncias de “g” no texto provavelmente se parecem com ela. O quarto exemplo não é bom para treinamento porque o primeiro “g” é impresso de forma fraca e é improvável que esta forma apareça no documento novamente. Você pode usar o treinamento para melhorar o reconhecimento de símbolos especiais como @, ® e © ou para reconhecer letras acentuadas suportadas com maior confiabilidade. A finalidade do treinamento não é ensinar o programa a ler caracteres de idiomas ou alfabetos não suportados. O OmniPage Pro 12 oferece dois tipos de treinamento: treinamento manual e treinamento automático (IntelliTrain). Os dados provenientes de ambos os tipos de treinamento são combinados e estão disponíveis para serem salvos em um arquivo de treinamento. Treinamento 71
  • 72. Quando você sai de uma página na qual os dados de treinamento foram gerados, você será perguntado como aplicá-los às outras páginas existentes no documento. Treinamento manual Para executar o treinamento manual, coloque o ponto de inserção em frente do caracter que deseja treinar ou selecione um grupo de caracteres (até uma palavra) e escolha Treinar caracter ... no menu Ferramentas ou menu de atalho. Você verá uma imagem ampliada do(s) caracter(es) a ser(em) treinado(s), juntamente com a atual solução de OCR. Mude-a para a solução desejada e clique em OK. O programa pega esse treinamento e examina o resto da página. Se ele encontrar palavras candidatas para alterar, elas serão listadas na caixa de diálogo Verificar treinamento. Palavras incorretas devem ser treinadas novamente antes de a lista ser aprovada. Para obter uma orientação sobre como usar as caixas de diálogo Treinar caracter e Verificar treinamento, consulte as ajudas sensíveis a contexto ou o tópico Treinamento manual da Ajuda on-line e outros tópicos relacionados. IntelliTrain O IntelliTrain é uma forma automatizada de treinamento. Ele obtém informações das alterações que você faz durante a correção. Quando você faz uma alteração, ele lembra da forma de caracteres envolvida e da sua alteração de correção. Ele procura por outras formas de caracteres semelhantes no documento, especialmente em palavras suspeitas. Ele avalia se aplica a correção do usuário ou não. Você pode ativar ou desativar o IntelliTrain no painel OCR da caixa de diálogo Opções. O seguinte exemplo mostra como o IntelliTrain funciona, usando a imagem original. O nosso exemplo envolve as letras c e e. Com algumas configurações de digitalização e fontes, a linha horizontal na letra ´e´ pode se tornar muito fina, levando a erros de OCR que o IntelliTrain podem consertar. 72 Correção e edição
  • 73. Capítulo 4 O OmniPage Pro lê isto como qualqucr. Você o alterou durante a correção para qualquer. O IntelliTrain se lembra desta forma e desta regra: Isto não é um c. e Isto é um e. O IntelliTrain muda: cstc para este dcspcsas para despesas scja para seja etc. O IntelliTrain lembra-se dos dados de treinamento que coletou e os adiciona a qualquer treinamento manual que você tenha feito. Este treinamento pode ser salvo em um arquivo de treinamento para uso futuro com documentos semelhantes. Arquivos de treinamento Se você quiser ser avisado para salvar dados de treinamento não salvos ao fechar o documento, selecione a opção no painel Correção na caixa de diálogo Opções. Os dados de treinamento não salvos são armazenados em um documento do OmniPage. Se você não salvar o documento como um OPD, o treinamento não salvo é descartado quando o documento é fechado. A gravação do treinamento em um arquivo, o carregamento, a edição e o descarregamento de arquivos de treinamento são feitos na caixa de diálogo Arquivos de treinamento. Abra-a no painel Correção da caixa de diálogo Opções ou no menu Ferramentas. Treinamento 73
  • 74. Selecione isto, Clique nisto para editar o clique em Salvar e arquivo de treinamento digite um nome selecionado na caixa de para salvar um diálogo Editar arquivo de treinamento. treinamento. Use isto também para Selecione isto salvar um novo para descarregar treinamento em um um arquivo de arquivo de treinamento treinamento. carregado. Isto é listado como: Nome de arquivo [modificado] O treinamento descarregado pode ser editado na caixa de diálogo Editar treinamento, um asterisco é exibido na barra de títulos no lugar de um nome de arquivo de treinamento. Ele continua não salvo quando você fecha a caixa de diálogo Editar treinamento. Salve-o na caixa de diálogo Arquivos de treinamento. Um arquivo de treinamento também pode ser editado; o seu nome aparece na barra de título. Se ele tiver dados de treinamento não salvos adicionados a ele, um asterisco aparecerá após seu nome. Ambos os treinamentos modificados e não salvos são salvos quando você fecha a caixa de diálogo. A caixa de diálogo Editar treinamento exibe quadros contendo uma forma de caractere e uma solução de OCR associada à forma. Clique em um quadro para selecioná-lo. Em seguida, você pode excluí-lo com a tecla Delete ou alterar a atribuição. Use as teclas de seta para mover para o próximo quadro ou para o anterior. Você está editando o seu treinamento não Clique duas vezes em salvo. um quadro ou pressione Enter para mudar sua solução de OCR. Digite a nova Este quadro está solução na caixa de acinzentado. Ele foi texto que aparece e excluído. Para recuperá-lo, pressione Enter. As selecione-o novamente e atribuições alteradas pressione a tecla Delete. Os aparecem em caracteres marcados como vermelho. excluídos são realmente excluídos quando você fecha a caixa de diálogo. Este quadro está selecionado. A parte superior mostra a forma da imagem. A parte inferior mostra a solução de OCR atribuída. 74 Correção e edição
  • 75. Capítulo 4 Edição de texto e de imagem O OmniPage SE oferece um Editor de texto WYSIWYG, que fornece muitos recursos de edição. Eles funcionam de forma muito semelhante aos dos principais processadores de texto do mercado. Edição de atributos de caracteres Em todas as visualizações, exceto na visualização Sem formatação, você pode alterar o tipo de fonte, o tamanho e os atributos (negrito, itálico, sublinhado) para o texto selecionado. Use a caixa de ferramentas Formatação na caixa de diálogo Fonte no menu Formatar. Esta última também oferece opções de caracteres subscritos, sobrescritos e texto ou fundo colorido. Na visualização Sem formatação, use a barra de ferramentas Formatação para especificar um tipo de fonte e tamanho a ser aplicado a todo o documento. Isto não é usado para exportação e nem transferido para outras visualizações; as configurações anteriores são restauradas. Abra a caixa de diálogo Correspondência de fontes no painel OCR na caixa de diálogo Opções antes do OCR para especificar as fontes a serem usadas para entrada de texto no Editor de texto. Edição de atributos de parágrafos Em todas as visualizações, exceto na visualização Sem formatação, você pode alterar o alinhamento dos parágrafos selecionados e aplicar marcadores a parágrafos. Use a caixa de ferramentas Formatação ou a caixa de diálogo Parágrafo no menu Formatar. Esta última permite que você modifique recuos, espaçamento de linha e espaçamento entre parágrafos. A régua horizontal do Editor de texto permite que você defina as posições de recuo e tabulação com facilidade. As configurações avançadas de tabulação são feitas na caixa de diálogo Tabulações no menu Formatar. Estilos de parágrafos Os estilos de parágrafos são detectados automaticamente durante o reconhecimento. Uma lista de estilos é criada e apresentada em uma caixa de seleção à esquerda da caixa de ferramentas Formatação. Use-a para atribuir um estilo aos parágrafos selecionados. Use a caixa de diálogo Estilo no menu Formatar para renomear ou modificar um estilo e para definir um novo estilo. Quando você salva um documento em um arquivo, pode escolher se deseja exportar os estilos de parágrafo com o documento ou não. Isto é válido somente se o aplicativo de destino for compatível com estilos de parágrafos. Imagens gráficas Você pode editar o conteúdo de uma imagem gráfica selecionada se tiver um editor de imagens no computador. Clique em Editar imagem no menu Ferramentas. Isto ativará o editor de imagem associado aos arquivos BMP no sistema Windows e carregará uma imagem gráfica. Edite a imagem gráfica e, em seguida, feche o editor para que ela seja reincorporada ao Editor de texto. Não Edição de texto e de imagem 75
  • 76. altere o tamanho, a resolução ou o tipo da imagem gráfica, porque isto impedirá a sua reincorporação. Tabelas As tabelas são exibidas no Editor de texto em grades. Mova o cursor para uma área da tabela. Ele muda de aparência, permitindo que você mova as linhas de grade. Você também pode usar as réguas do Editor de texto para modificar uma tabela. Modifique a colocação de texto em células de tabela com os botões de alinhamento na barra de ferramentas Formatação e os controles de tabulação na régua. Ao salvar o documento em alguns tipos de arquivo, você pode escolher se quer tabelas exportadas em grades ou como colunas separadas por tabulação ou espaços. Hyperlinks Endereços de correio eletrônico e de páginas da Web podem ser detectados e inseridos como links no texto reconhecido. Escolha Hyperlink ... no menu Formatar para editar um link existente ou criar um novo. Um novo link pode apontar para uma página da Web ou um arquivo. Use um menu de atalho para excluir um link. Editar no modo True Page Os elementos da página estão contidos em caixas de texto, caixas de tabela e caixas de imagem. Normalmente eles correspondem a zonas de texto, tabela e imagens gráficas na imagem. Clique dentro de um elemento para ver a moldura da caixa; elas possuem a mesma cor da zona correspondente. O tópico True Page da Ajuda on-line fornece detalhes sobre as operações resumidas aqui. Quadros têm molduras cinza e delimitam uma ou mais caixas. Eles são inseridos quando uma moldura visível é detectada em uma imagem. Formate moldura de quadros e tabelas e sombreamento com um menu de atalho ou escolhendo Tabela ... no menu Formatar. O sombreamento de uma caixa de texto pode ser especificado em seu menu de atalho. Para ativar um menu de atalho, clique com o botão direito dentro de um elemento afastado de uma palavra marcada. Áreas com várias colunas têm molduras cor-de-rosa e delimitam uma ou mais caixas. Elas são detectadas automaticamente e exibem qual texto será tratado como colunas quando exportado. Use menus de atalho para desagrupar áreas com várias colunas e quadros, permitindo que seus elementos sejam modificados. Você também pode agrupar elementos em quadros ou áreas com várias colunas. A ordem de leitura pode ser exibida e alterada. Clique na ferramenta Exibir ordem de leitura na barra de ferramentas Formatação para que ordem seja exibida por setas. Clique novamente para remover as setas. Clique na ferramenta Alterar ordem de leitura para obter um conjunto de botões de reorganização ao invés da barra de ferramentas Formatação. A ajuda sensível ao contexto explica seu uso, assim como o tópico Ordem de leitura da Ajuda on-line. Uma ordem alterada é aplicada em visualizações NF e RFP. Ela modifica o modo como o cursor se move pela página quando ela é exportada como True Page. 76 Correção e edição
  • 77. Capítulo 4 Edição em tempo real Permite que você modifique uma página reconhecida por meio de novo zoneamento, sem a necessidade de processar a página inteira novamente. Quando a edição em tempo real estiver ativada, alterações de zona (exclusão, desenho, redimensionamento, mudança de tipo) provocam imediatamente mudanças na página reconhecida. De modo oposto, quando você modifica elementos na visualização True Page no Editor de texto, isto muda as zonas naquela página. O zoneamento em tempo real também pode ser usado com páginas não reconhecidas. Duas ferramentas vinculadas na barra de ferramentas Imagem controlam o zoneamento em tempo real. Uma dessas ferramentas está ativa sempre que não há reconhecimento em andamento. Clique nisto para ativar a edição em tempo real. O sinal vermelho indica que não existem alterações de zoneamento armazenadas. Clique nisto para desativar a edição em tempo real. Suas alterações de zoneamento são armazenadas; a ferramenta On-the-fly exibe um sinal verde para indicar que existem alterações armazenadas. Para ativar essas alterações, siga um dos procedimentos abaixo: Clique na ferramenta On-the-fly com o sinal verde. As alterações de zoneamento causarão mudanças no Editor de texto. Clique no botão Executar OCR para que a página inteira seja reconhecida novamente, incluindo suas alterações de zona. Para obter detalhes sobre como as alterações são tratadas no zoneamento em tempo real e seus efeitos nas visualizações do Editor de texto, consulte o tópico Processamento em tempo real da Ajuda on-line. Edição em tempo real 77
  • 78. Leitura de texto em voz alta O recurso Texto para fala não foi incluído no OmniPage SE. Ele está disponível no OmniPage Pro 12. Este recurso de fala é designado aos que possuem deficiência visual, mas também pode ser útil para qualquer pessoa durante a verificação de texto. A fala é controlada por movimentos do ponto de inserção no Editor de texto, que podem ser controlados pelo mouse ou pelo teclado. Para ouvir texto: Use estas teclas: Seta para direita ou para esquerda. Carac- Um caractere por vez, para frente ou para teres de pontuação, números ou letras são trás falados. Palavra atual Ctrl + ´1´ do teclado numérico Uma palavra para a direita Ctrl + seta para direita Uma palavra para a esquerda Ctrl + seta para esquerda Uma única linha Coloque o ponto de inserção na linha Próxima linha Seta para baixo Linha anterior Seta para cima Frase atual Ctrl + ´2´ do teclado numérico Do ponto de inserção ao fim da frase Ctrl + ´6´ do teclado numérico Do ponto inicial da frase ao ponto de Ctrl + ´4´ do teclado numérico inserção Página atual Ctrl + ´3´ do teclado numérico Do início da página atual ao ponto de Ctrl + Home inserção Do ponto de inserção ao fim da página atual Ctrl + End Ctrl + PgUp, PgDown ou botões de nave- Página anterior, próxima ou qualquer página gação Cada caractere digitado é pronunciado, um Caracteres digitados a um, incluindo pontuação. O recurso de conversão de texto em fala é ativado ou desativado com o item Modo de fala do menu Ferramentas ou com a tecla F5. Um segundo item de menu Configurações de fala... permite que você selecione uma voz (por exemplo, de homem ou mulher, para um certo idioma), velocidade de leitura e o volume. As três teclas de fala básicas são agrupadas no teclado numérico. 78 Correção e edição
  • 79. Capítulo 4 + 1 2 3 Falar a Falar a Falar a palavra frase atual página atual atual Você também tem os seguintes controles do teclado: Para fazer isso: Use isso: Pausar/Continuar Ctrl + ´5´ do teclado numérico Ctrl + sinal de mais do teclado numérico Definir a velocidade mais alta (+) Ctrl + sinal de menos do teclado numérico Definir a velocidade mais baixa (–) Ctrl + sinal de asterisco do teclado Restaurar velocidade numérico (*) Existem planos para oferecer programas de fala para os seguintes idiomas: Inglês, francês, alemão, italiano, português e espanhol. Consulte o arquivo Leiame para obter as últimas informações. Somente um sistema de fala será instalado com o OmniPage Pro, dependendo da escolha de idioma no início da instalação. Se você especificar um idioma sem sistema de fala disponível, será instalado o inglês. Se você tiver sistemas de fala compatíveis com SAPI para outros idiomas em seu computador, eles serão detectados e disponibilizados. As vozes deles serão oferecidas na caixa de diálogo Configurações de fala. Uma vez que você tiver associado uma voz a um idioma, o OmniPage Pro se lembrará disso e alternará as vozes de acordo com o idioma de reconhecimento de seu documento. Leitura de texto em voz alta 79
  • 80. 80 Correção e edição
  • 81. Capítulo 5 Gravação e exportação Uma vez que você tenha adquirido pelo menos uma imagem para um documento, você pode exportá-la para um arquivo. Uma vez que você tenha reconhecido pelo menos uma página, você pode exportar os resultados do reconhecimento – uma página única, páginas selecionadas ou o documento inteiro – para um aplicativo de destino salvando em arquivo, copiando para a Área de transferência ou enviando para uma aplicação de correio eletrônico. Sempre é possível salvar como um Documento do OmniPage. Este capítulo apresenta os seguintes tópicos: x Gravação de imagens originais x Gravação dos resultados de reconhecimento • Salvar um documento enquanto você trabalha • Selecionar um nível de formatação • Selecionar opções avançadas de salvamento • Salvar como PDF x Copiar páginas para a Área de transferência x Enviar páginas via correio Um documento continua no OmniPage SE após a exportação. Isto permite que você salve, copie ou envie suas páginas repetidamente, por exemplo com níveis diferentes de formatação, usando tipos de arquivos, nomes ou locais diferentes. Você também pode adicionar ou reconhecer novamente páginas ou modificar o texto reconhecido. Com processamento automático e usando o Assistente de OCR, você especifica o primeiro destino de gravação antes do processamento iniciar. Quando a última OmniPage SE Manual do usuário 81
  • 82. página disponível é reconhecida (ou corrigida, se isto foi solicitado), surge uma caixa de diálogo de exportação. Você pode especificar a exportação a qualquer momento que o programa não estiver ocupado. Se você pedir para exportar um documento com páginas não reconhecidas, será perguntado se elas devem ser reconhecidas antes. Se você responder Não, somente os resultados das páginas reconhecidas serão exportados. Se as zonas tiverem sido modificadas em páginas reconhecidas, você será convidado a reconhecer novamente as páginas antes de exportar. Gravação de imagens originais Você pode salvar as imagens originais em disco em uma ampla variedade de tipos de arquivos. Consulte “Tipos de arquivo para abrir e salvar imagens” na página 98. 1. Escolha Salvar imagem... no menu Arquivo. Na caixa de diálogo que aparece, selecione um local de pasta e um tipo de arquivo para suas imagens. Digite um nome de arquivo. 2. Selecione para salvar apenas a imagem da zona atual, a imagem da página atual, imagens da página selecionada ou todas as imagens no documento. Nos dois últimos casos, você pode ter todas as imagens em um único arquivo de imagem de várias páginas, contanto que defina o tipo de arquivo TIFF, MAX ou DCX. Caso contrário, cada imagem é colocada em um arquivo separado. O OmniPage SE adiciona sufixos numéricos ao nome de arquivo que você fornece, para gerar nomes de arquivos exclusivos. 3. Clique em OK para salvar as imagens como especificado. As zonas e o texto reconhecido não são salvos com o arquivo. Se possível, o arquivo é salvo como exibido: isto é, em preto e branco, tons de cinza ou em cores. As imagens em preto e branco são salvas com as suas resoluções originais. As imagens coloridas e em tons de cinza são reduzidas a aproximadamente 150 dpi. Para ver o tamanho da imagem e a resolução original de uma imagem, passe o cursor sobre sua miniatura no painel de Imagem. En OmniPage Pro você pode salvar seu documento em cinco variantes do formato PDF. Duas delas salvam as imagens originais, as outras salvam os resultados do reconhecimento. Consulte as seguintes seções. Salvar como PDF não está disponível no OmniPage SE 82 Gravação e exportação
  • 83. Capítulo 5 Gravação dos resultados de reconhecimento Você pode salvar as páginas reconhecidas em disco em uma ampla variedade de tipos de arquivos. Consulte “Tipos de arquivo para salvar resultados de reconhecimento” na página 99. 1. Escolha Salvar como... no menu Arquivo ou clique no botão Exportar resultados na barra de ferramentas do OmniPage com Salvar como arquivo selecionado na lista suspensa. 2. A caixa de diálogo Salvar como aparece, como mostrado em sua forma expandida. Selecione isto para Clique em Avançado abrir para abrir o painel automaticamente o inferior e Básico para arquivo salvo em fechá-lo. seu aplicativo de destino. Clique nisto para visualizar e alterar as opções de saída para o Escolhas possíveis: atual tipo de arquivo. Todas as páginas Página atual Escolhas possíveis: Páginas selecionadas Criar um arquivo para todas as páginas Selecione páginas Criar um arquivo por página com as miniaturas ou Criar um novo arquivo a cada página em no Gerenciador de branco. documentos. Criar um novo arquivo para cada arquivo de imagem. 3. Selecione um local de pasta e um tipo de arquivo para o seu documento. O tipo de arquivo OPD especial é o último na lista de tipo de arquivos. Em seguida selecione um nível de formatação para o documento. Consulte “Selecionar um nível de formatação” na página 85. 4. Digite um nome de arquivo. Clique no botão Avançado se desejar especificar um intervalo de páginas, uma opção de separação de arquivo ou outras opções de salvamento. Selecione-as como desejado. Consulte “Selecionar opções avançadas de salvamento” na página 86. Gravação dos resultados de reconhecimento 83
  • 84. 5. Clique em OK. O documento é salvo em disco como especificado. Se Salvar e iniciar estiver selecionado, o arquivo exportado aparecerá em seu aplicativo de destino; isto é, o aplicativo associado com o tipo de arquivo selecionado no sistema Windows ou nas opções avançadas de salvamento para o conversor do tipo de arquivo. Imagens gráficas, grades de tabela e outras propriedades são salvas no documento apenas se o tipo de arquivo selecionado suportá-las e se elas forem especificadas para retenção nas configurações avançadas (Opções do conversor) para o atual tipo de arquivo. Se mais de um arquivo de exportação for criado, o OmniPage SE associará sufixos numéricos ao seu nome de arquivo para criar nomes exclusivos de arquivo. Se você selecionar Criar um novo arquivo a cada página em branco com entrada de arquivos de imagem, você pode inserir arquivos de imagem vazios no documento. Consulte “Entrada de arquivos de imagem” na página 50. Se você selecionar Criar um novo arquivo para cada arquivo de imagem, não é necessário um nome de arquivo. Cada arquivo de saída obterá seu nome do arquivo de entrada que o gerou, mudando apenas a extensão. Salvar um documento enquanto você trabalha Clique na ferramentas Salvar na barra de ferramentas Padrão ou escolha Salvar no menu Arquivo para salvar as alterações no documento atual conforme você trabalha. Se você fizer isto com um documento sem título, a caixa Salvar como aparece. No caso de um documento com título, o comando Salvar salva-o com o nome e tipo de arquivo de sua última gravação, como exibido na barra de títulos. Isto só é exibido se o documento inteiro foi salvo. Se o documento foi salvo pela última vez como um documento OmniPage, o comando de gravação atualiza este documento: as imagens novas ou alteradas, zoneamento alterado, resultados de reconhecimento e treinamento são todos salvos. Se o documento foi salvo pela última vez como um outro tipo qualquer de arquivo, somente as alterações nos resultados de reconhecimento são salvas. Se você quiser trabalhar com o seu documento novamente no OmniPage SE em uma sessão posterior, salve-o como um documento do OmniPage. Este é um tipo de arquivo de saída especial. Ele salva as imagens originais com os resultados de reconhecimento, configurações e treinamento. Consulte “Documentos do OmniPage” na página 31. As referências a treinamento não se aplicam ao OmniPage SE. 84 Gravação e exportação
  • 85. Capítulo 5 A caixa de diálogo Salvar como lista os tipos de arquivo disponíveis em sua lista suspensa Salvar como tipo. O documento do OmniPage é o último formato na lista. Se você salvar o documento primeiramente como um documento do OmniPage (por exemplo como memo.opd), modificá-lo posteriormente e salvá-lo como arquivo de texto (por exemplo como memo.txt) e, em seguida, modificá-lo novamente e clicar em Salvar, as alterações recentes são salvas no arquivo memo.txt, não no OPD. Ao fechar o documento ou sair do programa, você será avisado para salvar o documento se ele não tiver sido salvo como um documento do OmniPage ou se houver alterações desde a última gravação de OPD. Selecionar um nível de formatação O nível de formatação para exportação é definido no momento da exportação, na caixa de diálogo Salvar como, na caixa de diálogo Copiar para Área de transferência ou na caixa de diálogo Enviar como correio. Três desses níveis correspondem às visualizações de formatação do mesmo nome no Editor de texto. Entretanto, o nível a ser aplicado na hora de salvar é independente da visualização de formatação exibida no Editor de texto. Ao exportar para arquivo ou correio, primeiro especifique um tipo de arquivo. Isso determina quais níveis de formatação estão disponíveis. Uma tabela no Capítulo 6 resume estas informações. Consulte “Tipos de arquivo para salvar resultados de reconhecimento” na página 99. Os níveis de formatação são: Sem formatação (NF) Exporta texto simples sem colunas e alinhado à esquerda em uma única fonte e único tamanho de fonte. Ao exportar para os tipos de arquivo Texto ou Unicode, as imagens gráficas e tabelas não são suportadas. Você pode exportar texto simples para quase todos os tipos de arquivo e aplicativos de destino; nestes casos as imagens gráficas, tabelas e marcadores podem ser mantidos. Visualização Preservar fontes e parágrafos (RFP) Exporta texto sem colunas com estilo de fonte e parágrafo, juntamente com imagens gráficas e tabelas. Isto está disponível para quase todos os tipos de arquivo. Visualização de Página ligada (FP) Mantém o layout original das páginas, incluindo colunas. Isto é feito sempre que possível com as configurações de coluna e recuo, não com quadros ou caixas de texto. O texto fluirá de uma coluna para outra, o que não acontece quando são usadas caixas de texto. O OmniPage SE não oferece o recurso de saída de página ligada. Esse recurso está disponível somente no OmniPage Pro. Gravação dos resultados de reconhecimento 85
  • 86. True Page (TP) Mantém o layout original das páginas, incluindo colunas. Isto é feito com texto, imagens, caixas de tabelas e quadros. Isto é oferecido apenas para aplicativos de destino capazes de tratar esses elementos. Planilha Exporta resultados de reconhecimento em formato tabular, adequado para uso em aplicativos de planilha. A quebra de colunas das exportações NF e RFP é executada da esquerda para a direita e de cima para baixo: Página Resultado sem original colunas Antes de exportar, verifique nas visualizações NF e RFP se a ordem dos elementos sem colunas está correta. Caso contrário, alterne para a visualização True Page e clique na ferramenta Exibir ordem de leitura para que a ordem seja exibida por setas. Use a ferramenta Alterar ordem de leitura para especificar uma ordem diferente. Áreas com várias colunas mostram quais colunas estão vinculadas. Se esta vinculação não for adequada, desagrupe a área e mude a ordem dos elementos dentro dela. Selecionar opções avançadas de salvamento Clique no botão Opções do conversor na parte avançada da caixa de diálogo Salvar como para ter um controle preciso sobre a exportação. Isso faz surgir uma caixa de diálogo com o nome do tipo atual de arquivo. Ela apresenta uma série de opções adaptadas para este tipo de arquivo. Primeiro, confirme ou altere o nível de formatação, pois ele influencia quais outras opções serão apresentadas. Selecione as opções como desejar. A Ajuda on-line fornece detalhes sobre como fazê-lo. Clique em Aplicar para que as configurações alteradas sejam aplicadas apenas ao atual salvamento. Clique em Valores padrão para que todas as configurações voltem aos valores padrão para o atual tipo de arquivo. 86 Gravação e exportação
  • 87. Capítulo 5 Clique em Salvar para que as configurações alteradas sejam aplicadas ao salvamento atual e também armazenadas como configurações que serão aplicadas no futuro sempre que este tipo de arquivo for selecionado novamente para salvamento. O programa atualmente associado ao tipo de arquivo escolhido para o recurso Salvar e iniciar é exibido na parte inferior da caixa de diálogo. Clique no botão dos três pontos para especificar um programa diferente. Para criar seu próprio conversor personalizado, prepare suas configurações, clique em Novo conversor, forneça um nome e então clique em OK. Outra alternativa é primeiro nomear o conversor, alterar as configurações e depois clicar em Salvar. Conversores personalizados são úteis para tarefas repetitivas, como a publicação de uma revista semanal. Desta forma todas as páginas reconhecidas podem ser exportadas com sua formatação adaptada para o uso pretendido. Você também pode criar um conjunto de conversores personalizados para um determinado tipo de arquivo definindo as opções de salvamento para cada nível de formatação de saída, por exemplo: RTF Sem formatação, RTF Manter fontes e parágrafos e RTF True Page. Você pode mudar as opções do conversor sem salvar nada em arquivo. Inicie a caixa de diálogo Conversores de exportação no menu Ferramentas. Selecione o conversor desejado e clique no botão Opções. Neste caso, o botão Aplicar não está disponível. Gravação dos resultados de reconhecimento 87
  • 88. Salvar como PDF Isso não se aplica ao OmniPage SE. No OmniPage Pro 12 você tem cinco opções ao salvar para arquivos PDF (Portable Document Format). PDF (Normal): As páginas são exportadas conforme aparecem no Editor de texto na visualização True Page. O arquivo PDF pode ser visualizado e pesquisado em um visualizador de PDF e editado em um editor de PDF. PDF Editado: Use este formato se você fez mudanças significativas de edição nos resultados do reconhecimento. Você vê três opções de nível de formatação, incluindo True Page. O arquivo PDF pode ser visualizado, pesquisado e editado. PDF com imagens em texto: O arquivo PDF é somente visualizável e não pode ser modificado em um editor de PDF. As imagens originais são exportadas, mas há um arquivo de texto vinculado atrás de cada imagem, assim o texto pode ser procurado. Uma palavra encontrada fica em destaque na imagem. PDF com substitutos de imagem: Como no caso de PDF (Normal), mas as palavras contendo caracteres rejeitados e suspeitos possuem sobreposições de imagem, assim estas palavras incertas são exibidas como no documento original. O arquivo PDF pode ser visualizado, pesquisado e editado. PDF, somente imagem: As imagens originais são exportadas. O arquivo PDF só pode ser visualizado e não pode ser modificado em um editor de PDF e o texto não pode ser procurado. Copiar páginas para a Área de transferência Você pode copiar os resultados do reconhecimento da página atual, de páginas selecionadas ou de todas as páginas do documento para a Área de transferencia. A cópia é acompanhada por um monitor de progresso. Em seguida, você pode colar o conteúdo da Área da transferência em outro aplicativo. A formatação de texto, como negrito e itálico, é mantida quando você cola em um aplicativo compatível com informações de RTF 6.0/95. Caso contrário, somente texto simples ou texto Unicode serão colados. As imagens gráficas são mantidas se o aplicativo oferecer suporte para inserção de imagens. 88 Gravação e exportação
  • 89. Capítulo 5 w Para copiar páginas para a Área de transferência: • Com o processamento automático, selecione Copiar para Área de transferência como o comando na lista suspensa Exportar resultados na barra de ferramentas do OmniPage ou no Assistente de OCR. A caixa de diálogo Copiar para Área de transferência aparece logo que a última página disponível tiver sido reconhecida ou corrigida. • Com processamento manual, selecione Copiar para Área de transferência na lista suspensa Exportar resultados e, em seguida, clique em seu botão. Surge imediatamente a caixa de diálogo Copiar para Área de transferência. • Especifique um intervalo de páginas e um nível de formatação a serem usados e então clique em OK para iniciar a cópia. Você pode executar uma operação de copiar e colar para a página atual usando o recurso arrastar e soltar. Pressione e mantenha pressionadas as teclas Ctrl+Tab enquanto clica na página atual no painel de Imagem e arrasta o cursor para um aplicativo de destino com um documento aberto. O conteúdo da página será colado na posição do cursor. O OCR será executado caso necessário. Enviar páginas via correio Você pode enviar resultados de reconhecimento como um ou mais arquivos anexados a uma mensagem de correio se tiver instalado um aplicativo compatível com MAPI, como o Microsoft Outlook. w Para enviar um documento por correio eletrônico: • Com o processamento automático, selecione Enviar como correio como configuração na lista suspensa Exportar resultados na barra de ferramentas do OmniPage. A caixa de diálogo Enviar correio aparece assim que a última página disponível no documento for reconhecida ou corrigida. • Com processamento manual, selecione Enviar como correio na lista suspensa Exportar resultados e, em seguida, clique em seu botão. A caixa de diálogo Enviar como correio aparece imediatamente. A qualquer momento que o programa não estiver ocupado, escolha Enviar como correio no menu Arquivo para chamar a caixa de diálogo Enviar como correio. Enviar páginas via correio 89
  • 90. 1. Esta caixa de diálogo permite que você especifique um tipo de arquivo, um intervalo de página, um nível de formatação e opções de anexo: um anexo para todas as páginas, um anexo por página, anexo novo a cada página em branco ou um anexo para cada arquivo de entrada. Defina todas as opções e clique em OK. 2. Faça o login no seu aplicativo de correio se você for solicitado a fazê-lo. 3. O aplicativo de correio aparece com os anexos em uma nova mensagem vazia. Os anexos assumem o nome usado na última gravação do documento em OmniPage SE ou ‘Sem título de OmniPage’. A extensão de arquivo adequada é adicionada e sufixos numéricos são usados para vários anexos. 4. Coloque o destinatário na mensagem de correio, adicione o texto da mensagem como desejado e clique no botão Enviar. O programa pode detectar endereços de email enquanto reconhece páginas e transmite-as para o Editor de texto. Se você clicar em um endereço, seu aplicativo de correio aparece com uma nova mensagem vazia contendo apenas o endereço de email. 90 Gravação e exportação
  • 91. Capítulo 6 Informações técnicas Este capítulo fornece informações sobre solução de problemas e outras informações técnicas sobre o uso do OmniPage SE. Leia o arquivo Leiame on- line e outros tópicos de ajuda ou visite as páginas da ScanSoft na Web. Sua seção sobre scanner contém informações detalhadas e regularmente atualizadas sobre configuração e suporte de scanner. O arquivo Leiame contém informações de última hora relativas ao OmniPage SE. O acesso ao arquivo Leiame e às páginas da ScanSoft na Web é fornecido no menu Ajuda. Este capítulo contém as seguintes informações: x Solução de problemas • Soluções para tentar primeiro • Teste do OmniPage SE • Aumentar recursos de memória • Aumentar espaço em disco • O texto não é reconhecido corretamente • Problemas com reconhecimento de fax • Problemas de desempenho ou de sistema durante o OCR x Suporte a ODMA x Recursos avançados em Programar OCR x Tipos de arquivo compatíveis • Tipos de arquivo para abrir e salvar imagens • Tipos de arquivo para salvar resultados de reconhecimento x Desinstalação do software OmniPage SE Manual do usuário 91
  • 92. Solução de problemas Apesar do OmniPage SE ser projetado para ser fácil de usar, algumas vezes ocorrem problemas. Muitas das mensagens de erro contêm descrições auto- explicativas sobre o que fazer – verificar conexões, fechar outros aplicativos para liberar memória etc. Algumas vezes, isto é tudo que a solução de problemas lhe ajuda a fazer. Consulte a documentação do Windows para obter informações sobre como otimizar o desempenho do seu sistema e de seu aplicativo. Soluções para tentar primeiro Experimente estas soluções se você estiver tendo problemas ao iniciar ou ao usar o OmniPage SE: x Certifique-se de que seu sistema atenda a todos os requisitos listados. Consulte “Requisitos do sistema” na página 12. x Certifique-se de que o scanner está conectado e que todas as conexões de cabo estão seguras. x Visite a seção de suporte do site da ScanSoft na Web em www.scansoft.com. Ela contém notas técnicas sobre questões relatadas freqüentemente sobre uso do OmniPage. As nossas páginas na Web também podem oferecer assistência sobre o processo de instalação e solução de problemas. x Desligue o computador e o scanner, ligue o scanner novamente e, em seguida, reinicie o computador. Certifique-se de que os aplicativos estão funcionando adequadamente. x Use o software que veio com o scanner para verificar se o scanner funciona adequadamente antes de usá-lo com o OmniPage SE. x Certifique-se de que você possui os drivers corretos para o scanner, impressora e placa de vídeo. Visite a página da Scansoft na Web através do menu Ajuda e consulte sua seção sobre scanner para obter mais informações. x Execute ScanDisk para Windows 98 ou ME ou Check Disk para Windows NT, 2000 e XP para verificar se há erros no disco rígido. Consulte a ajuda on-line do Windows para obter mais informações. x Desfragmente o seu disco rígido. Consulte a ajuda on-line do Windows para obter mais informações. x Desinstale e reinstale o OmniPage SE, como descrito na última seção, ”Desinstalação do software” na página 100. 92 Informações técnicas
  • 93. Capítulo 6 Teste do OmniPage SE Reiniciar o Windows 98, Me, 2000 ou XP no modo seguro ou o Windows NT no modo VGA permite que você teste o OmniPage SE em um sistema simplificado. Isto é recomendado quando você não consegue resolver problemas de queda do sistema ou se o OmniPage SE tem a execução interrompida. Consulte a ajuda on-line do Windows para obter mais informações. O scanner não funcionará com o OmniPage SE no modo seguro ou em modo VGA, portanto, não teste problemas de scanner nesta configuração. w Para testar o OmniPage SE no modo seguro (Windows 98, 2000, Me ou XP): 1. Reinicie o computador no modo de segurança pressionando F8 imediatamente depois de ver a mensagem ‘Iniciando Windows’. 2. Inicie o OmniPage SE e tente efetuar OCR em uma imagem. Use um arquivo conhecido de imagem, por exemplo, um dos arquivos de amostra de imagem fornecidos. • Se o OmniPage SE não iniciar ou executar adequadamente no modo seguro, pode haver um problema com a instalação. Desinstale e reinstale o OmniPage SE (consulte o final deste capítulo) e, em seguida, execute-o no modo seguro do Windows. • Se o OmniPage SE funcionar no modo seguro, um driver de dispositivo no seu sistema pode estar interferindo na operação do OmniPage SE. Solucione o problema reiniciando o Windows no modo de confirmação passo a passo. Consulte a ajuda on-line do Windows para obter mais informações. w Para testar o OmniPage SE no modo VGA (Windows NT): 1. Reinicie o computador. 2. Selecione a estação de trabalho do Windows NT, versão 4.00 [modo VGA] e pressione Enter. 3. Pressione Ctrl+Alt+Del e selecione o Gerenciador de tarefas. 4. Na caixa de diálogo Gerenciador de tarefas, selecione todos os aplicativos em segundo plano e clique em Finalizar tarefa. Consulte a ajuda on-line do Windows para obter mais informações. 5. Inicie o OmniPage SE e tente efetuar OCR em uma imagem. Use um arquivo de imagem conhecido, como um dos arquivos de amostra fornecidos. Solução de problemas 93
  • 94. Você também pode executar o OmniPage SE a partir de uma linha de comando em seu próprio modo seguro. Escolha IniciarExecutar, procure pelo arquivo OmniPage.exe e adicione a opção de linha de comando /safe. Isto inicia o programa, mas ignora as configurações armazenadas anteriormente e não tenta recuperar um documento que tenha sofrido um término anormal. Aumentar recursos de memória O OmniPage SE pode funcionar mal sob as condições de pouca memória. Isto pode ser indicado por várias mensagens de erro ou se o OmniPage SE funciona lentamente e acessa o disco rígido freqüentemente. Experimente estas soluções para condições de pouca memória: x Reinicie o computador. x Feche os outros aplicativos abertos para liberar memória. x Feche os aplicativos do OmniPage desnecessários. x Desfragmente o disco rígido para liberar blocos contíguos de espaço em disco. Consulte a ajuda on-line do Windows para obter instruções. x Aumente a quantidade de espaço em disco rígido disponível. x Aumente a memória física do computador (RAM). Mais memória otimiza o desempenho de OCR. Consulte “Requisitos do sistema” na página 12. Aumentar espaço em disco Podem ocorrer problemas se o seu sistema ficar com pouco ou nenhum espaço em disco. Experimente estas soluções para problemas de pouco espaço em disco: x Esvazie a lixeira do Windows. x Feche todos os aplicativos abertos e exclua os arquivos *.tmp da pasta Temp. Normalmente, esta pasta está localizada na pasta Windows. x Execute o ScanDisk ou o Check Disk x Faça backup de arquivos desnecessários em discos flexíveis ou outra mídia e exclua-os do disco rígido. x Remova os aplicativos do Windows que você não usa. x Desfragmente o seu disco rígido. x Limpe a cache do seu navegador de Web e limite o seu tamanho. 94 Informações técnicas
  • 95. Capítulo 6 O texto não é reconhecido corretamente Tente estas soluções se uma parte do documento original não for convertida para texto adequadamente durante o OCR. x Olhe na imagem da página original e assegure-se de que todas as áreas de texto estão associadas a zonas de texto. Se uma área não estiver dentro de uma zona, ela geralmente é ignorada durante OCR. Consulte a seção sobre como criar e modificar as zonas, ”Trabalho com zonas” na página 59. x Certifique-se de que as zonas de texto são identificadas corretamente. Identifique novamente os tipos de zona e o conteúdo, se necessário, e efetue OCR no documento novamente. Consulte “Tipos de zona e propriedades” na página 57. x Certifique-se de que você não carregou um gabarito inadequado por engano. Se as bordas de zona cortarem o texto, o reconhecimento é prejudicado. x Ajuste os controles deslizantes de brilho e contraste no painel Scanner da caixa de diálogo Opções. Talvez você precise experimentar combinações de configurações diferentes para chegar aos resultados desejados. x Verifique a resolução na imagem original. Passe o cursor sobre uma miniatura de página para obter uma janela popup. Se a resolução estiver significativamente acima ou abaixo de 300 dpi, provavelmente o reconhecimento será afetado. x Certifique-se de que os idiomas corretos do documento estão selecionados no painel OCR na caixa de diálogo Opções. Somente os idiomas incluídos no documento devem ser selecionados. x Ative o IntelliTrain e faça algumas correções. Provavelmente, isto ajudará com as fontes com estilo ou com documentos degradados uniformemente. Se o IntelliTrain estava funcionando, experimente desativá-lo – em alguns tipos de documentos degradados, ele pode não ajudar. As referências a treinamento não se aplicam ao OmniPage SE. x Execute treinamento manual ou edite o treinamento existente para remover treinamentos mal sucedidos. x Se você usa True Page como a visualização do Editor de texto ou para exportação, o texto reconhecido é disposto em caixas de texto ou quadros. Pode haver texto oculto se houver uma caixa de texto muito pequena. Para visualizar o texto, coloque o cursor na caixa de texto e use as teclas de seta no seu teclado para rolar para a parte superior, inferior, esquerda ou direita do quadro. x Verifique se há poeira, sujeira ou arranhões no vidro, nos espelhos e nas lentes de seu scanner. Limpe-os se necessário. Solução de problemas 95
  • 96. O OmniPage SE reconhece apenas caracteres impressos por máquinas, como impressão a laser ou texto escrito por máquina de escrever. Ele pode lidar com caracteres matriciais, apesar de que a precisão pode ser inferior em textos de qualidade baixa. Ele não pode ler texto escrito a mão. Entretanto, pode reter assinaturas e outros textos escritos à mão como uma imagem gráfica. Problemas com reconhecimento de fax Tente estas soluções para melhorar a precisão de OCR sobre imagens de fax: x Peça aos remetentes para usarem documentos originais e limpos se possível. x Peça aos remetentes para selecionarem o modo Melhor ou Otimizado quando enviarem um fax. Isto produz uma resolução de 200 x 200 dpi. x Peça aos remetentes para transmitirem arquivos diretamente para seu computador via fax-modem se vocês dois o tiverem. Você pode salvar as imagens de fax como arquivos de imagem e, em seguida, carregá-los no OmniPage SE. Consulte “Entrada de arquivos de imagem” na página 50. Problemas de desempenho ou de sistema durante o OCR Tente estas soluções se uma falha no sistema ocorrer durante o OCR ou se o processamento demorar muito tempo: x Resolva os problemas de falta de memória e espaço em disco. Consulte “Teste do OmniPage SE” na página 93. x Minimize todos os aplicativos ou clique em Alt+Tab para verificar se há mensagens de erro do Windows. x Verifique a qualidade da imagem. Consulte a documentação do scanner sobre as formas para melhorar a qualidade das imagens digitalizadas. x Divida páginas complexas (com muito texto e imagens gráficas ou com formatação elaborada) em tarefas menores. Delimite as zonas manualmente ou modifique as zonas criadas automaticamente para efetuar OCR em uma área de página por vez. Veja ”Trabalho com zonas” na página 59. x Reinicie o Windows 98, Me, 2000 ou XP no modo seguro ou Windows NT no modo VGA e teste o OmniPage SE efetuando OCR nos arquivos de amostra incluídos. Se você estiver realizando várias tarefas no mesmo momento, como reconhecimento e impressão, o OCR pode demorar mais. 96 Informações técnicas
  • 97. Capítulo 6 Suporte a ODMA Isso não se aplica ao OmniPage SE. Se sua rede local inclui um Sistema de Gerenciamento de Documentos (DMS) que suporta clientes ODMA, o OmniPage Pro poderá trabalhar com ele. No OmniPage Pro surgirá então um painel ODMA na caixa de diálogo Opções permitindo que você especifique tipos de arquivos permitidos e outras configurações. Uma interface ODMA substituirá as caixas de diálogo Carregar arquivo de imagem e Abrir documento do OmniPage (OPD). Isso permite carregar arquivos de imagem e OPDs, um por vez, do sistema de arquivos de rede ou de seu computador local. A caixa de diálogo Salvar como fornecerá um botão Salvar para DMS para salvar documentos reconhecidos neste sistema. Para obter detalhes, consulte a Ajuda on-line. Recursos avançados em Programar OCR Isso não se aplica ao OmniPage SE. Programar OCR permite que você especifique arquivos de entrada para uma tarefa. Algumas edições do OmniPage Pro permitem que você especifique que todos os arquivos de um certo tipo em uma ou mais páginas sejam processados. Essas edições também oferecem tarefas de pasta observada. A primeira tela do Assistente de nova tarefa tem dois botões: Arquivos e pastas. Ela também exibe uma opção Observar pastas para verificar arquivos de entrada. Selecione esta opção e especifique uma ou mais pastas. Todos os arquivos do(s) tipo(s) especificado(s) que entrarem na(s) pasta(s) serão processados na chegada. No quinto painel do Assistente você pode especificar tanto uma hora inicial quanto uma hora final para a tarefa de observação. Você pode optar por não especificar uma hora final quando configurar a tarefa. Neste caso, use o botão Modificar do Programar OCR para especificar uma hora final posteriormente. Também é possível interromper e retomar tarefas. O botão Visualizar permite que você veja um registro, arquivo por arquivo, de todo o processamento concluído dentro de uma tarefa selecionada. Quando uma tarefa está sendo executada, uma janela de registro da tarefa fica disponível, exibindo o progresso, arquivo por arquivo, e relatando quaisquer problemas de processamento. O quarto painel do Assistente de nova tarefa permite que você especifique um tipo de arquivo e escolha opções de separação de arquivo. Se você escolher Um novo arquivo de saída para cada arquivo de entrada, você precisa especificar apenas uma pasta, os arquivos de saída mantém os nomes dos arquivos de entrada com as extensões modificadas. Se você escolher uma opção que requeira vários arquivos de saída, você deve especificar um nome de arquivo e o programa adiciona sufixos numéricos para gerar nomes de arquivos únicos. Se você especificar a entrada de um conjunto de pastas, é possível especificar uma pasta de saída diferente para cada pasta de entrada. Suporte a ODMA 97
  • 98. Tipos de arquivo compatíveis O programa é compatível com uma ampla gama de tipos de arquivo para imagem e texto. Tipos de arquivo para abrir e salvar imagens PB, tons de Tipo de arquivo Extensão Várias páginas Abrir / Salvar cinza, cores BMP, Bitmap bmp Não Abrir e Salvar Todos DCX dcx Sim Abrir e Salvar Todos GIF gif n/a n/a n/a Tons de cinza, JPEG jpg Não Abrir e Salvar cores MAX max Sim Abrir e Salvar Todos PCX pcx Não Abrir e Salvar Todos n/a PDF pdf n/a n/a (consulte a nota) PNG png Não Abrir e Salvar Todos TIFF compactado com G3 tif Sim Abrir e Salvar PB TIFF compactado com G4 tif Sim Abrir e Salvar PB TIFF compactado com tif n/a n/a n/a LZW TIFF FX xif Sim Abrir Todos TIFF PackBits tif Sim Abrir e Salvar Todos TIFF não compactado tif Sim Abrir e Salvar Todos Os arquivos de imagem de entrada podem ter resoluções de até 600 dpi, mas recomenda-se 300 dpi (horizontalmente e verticalmente) para fornecer ótima precisão de OCR. O programa armazena imagens em preto e branco em sua resolução original, mas as imagens em cores e em tons de cinza normalmente não são salvas com mais de 150 dpi. Isto significa que estes não são bons candidatos para futuros processamentos OCR. Passe o cursor sobre uma miniatura da imagem para obter uma janela instantânea mostrando o tamanho e a resolução da imagem original. Se você tenta salvar uma imagem em preto e branco no formato JPEG, o programa oferecerá conversão para tons de cinza. Com TIFF G3 e G4, ele oferecerá conversão para preto e branco. No OmniPage Pro 12, há cinco opções para salvar em formato PDF. Duas delas, Apenas imagem e Imagem em texto, exportam imagens originais. Isto é feito na caixa de diálogo Salvar como. Esse recurso não está disponível no OmniPage SE. Além disso, o OmniPage SE não pode gerenciar arquivos GIF e TIFF LZW. Consulte “Salvar como PDF” na página 88. 98 Informações técnicas
  • 99. Capítulo 6 Tipos de arquivo para salvar resultados de reconhecimento Esta tabela mostra quais níveis de formatação estão disponíveis para cada tipo de arquivo. Sem Página Exten- for- ligada True Pla- Imagens Tipo de arquivo RFP Tabelas são mata- (consulte Page nilha gráficas ção a nota 1) eBook (consulte a nota 1) opf q q qq q Excel 97, 2000 xls q q q qq q Excel 3.0 a 7.0 xls q q q q FrameMaker 5.5.3 mif q q qq qq Freelance Graphics txt q q ❍q Harvard Graphics txt q q ❍q HTML 4.0 (consulte a nota 1,2) htm q q q qq q HTML 3,2 (consulte a nota 2) htm q q q qq q Microsoft PowerPoint 97 rtf q q qq qq Microsoft Publisher 98 rtf q q qq qq Microsoft Word 6.0, 97, 2000, XP doc q q q q qq qq PageMaker 6.5.2 doc q q qq qq Quattro Pro para Windows 4.0, 8 xls q q q q PDF (Normal) (consulte a nota 1) pdf q qq q PDF Editado (consulte a nota 1) pdf q q q qq qq PDF com imagens em texto (1) pdf (q ) q q PDF com substitutos de imagem pdf q q q (consulte a nota 1) PDF, somente imagem (1) pdf (q ) q q RTF Word 2000, 97, 95/6.0 (3) rtf q q q q qq qq Ventura Publisher doc q q q qq WordPad rtf q q qq qq WordPerfect 8, 9, 10 wpd q q q q qq qq WordPerfect 6.0, 6.1 wpd q q q qq qq WordPerfect 5,1, 0,5, 0,2 wp5 q q q qq qq XML (consulte a nota 1) xml q q (q ) Texto e texto com quebras de linha txt q q ❍q (consulte a nota 4) Texto – Separado por vírgula (4) csv q q q Texto – Formatado (4) txt q (q ) Documento do OmniPage (5) opd Salvo conforme exibido q q Tipos de arquivo compatíveis 99
  • 100. Imagens gráficas q Tipo de arquivo suporta imagens gráficas qq Tipo de arquivo suporta imagens gráficas, com opção de exportação para manter ou descartar imagens gráficas. Tabelas q Tipo de arquivo suporta tabelas em grades, não há opções de tratamento de tabela no momento da exportação qq Tipo de arquivo suporta tabelas, escolha entre usar grades ou colunas sepa- radas por tabulação ❍q Tipo de arquivo não suporta grades de tabela, escolha converter para colu- nas separadas por tabulação ou espaço 1 O OmniPage SE não oferece o recurso de saída de página ligada e de esses tipos de arquivo. 2 Ao salvar em HTML, todas as imagens gráficas são salvas em arquivos de imagem separados usando o formato JPEG. 3 Os resultados de reconhecimento são enviados para a Área de transferência no formato RTF 95/6.0 e serão colados neste formato se possível e como texto Unicode ou texto ASCII se não for possível. 4 Todos os formatos de texto estão disponíveis como Texto ou Unicode. O texto Unicode pode tratar a maior gama de caracteres com acento. 5 OmniPage SE pode abrir documentos criados pelo OmniPage SE ou pelo OmniPage Pro 12. Ele também pode abrir arquivos OPD criados pelo OmniPage Pro 10, 11 e sua Edição Especial. Esses arquivos entram no programa como documentos sem nome. Para manter um OPD no formato antigo e também salvá- lo como um novo OPD, escolha um nome diferente para evitar escrever sobre o arquivo antigo. Desinstalação do software Algumas vezes a desinstalação e reinstalação do OmniPage SE resolverá o problema. Você também deve desinstalar o OmniPage SE antes de instalar o OmniPage Pro 12 ou qualquer software OmniPage de avaliação. O programa de desinstalação do OmniPage SE não removerá nenhum dos seguintes arquivos criados pelo usuário: Gabaritos de zona (*.zon) Arquivos de treinamento (*.otd) (Isso não se aplica ao OmniPage SE.) Dicionários do usuário (*.ud) Documentos do OmniPage (*.opd) Para desinstalar do Windows NT, 2000 ou XP, você precisa ter efetuado login em seu computador com privilégios de administrador. 100 Informações técnicas
  • 101. Capítulo 6 w Para reinstalar ou desinstalar o OmniPage SE: x Feche o OmniPage SE. x Clique em Iniciar na barra de tarefas do Windows e escolha Painel de controle e Adicionar/Rremover programas. x Selecione OmniPage SE e clique em Alterar. x Clique em Avançar na caixa de diálogo que aparece. x Selecione Remover todos ou Reparar todas e, em seguida, Avançar. x Siga as instruções até que o processo tenha terminado. Desinstalação do software 101
  • 102. 102 Informações técnicas
  • 103. Í N D I C E R E M I S S I V O A salvar em, 32 marcadores, 68 Assistente Coluna Nota no Gerenciador de A barra de menus, 25 para configuração do scanner, 14 documentos, 30 Abertura de arquivos de imagem, 50, 98 para processamento, 45 Coluna única Acrescentar para Programar OCR, 49, 97 páginas, 53, 57 a zonas, 60 Assistente de nova tarefa, 49, 97 páginas com tabelas, 54 páginas a um documento, 41 Atributos de caracteres, 75 Colunas palavras a um dicionário de usuário, Atualização para o OmniPage Pro, 19 em tabelas, 62 68 Audição de textos lidos em voz alta, 78 no Gerenciador de documentos, 30 treinamento a arquivos de Aumentar espaço em disco, 94 Comparação das palavras reconhecidas treinamento, 74 Aumentar recursos de memória, 94 com as originais, 68 ADF, 33, 50, 52 Aviso para salvar dados de treinamento, 31 Concluir um documento, 41 Agrupar elementos, 76 Configuração do Direct OCR, 47 Ajuda on-line, 9 B Configuração do scanner, 14 Configurações Sensível ao contexto, 9, 25, 33 Barra de ferramentas de acoplamento e efeito das configurações, 34 Ajuda sensível ao contexto, 9, 25, 33 flutuação, 25, 68 na caixa de diálogo Opções, 33 Alimentador automático de documentos Barra de ferramentas de flutuação, 25 no Assistente de OCR, 46 (ADF), 33, 50, 52 Barra de ferramentas de formatação, 24, Obter texto, 47 Alternar entre o processamento manual e 25 para o Direct OCR, 47 automático, 27, 43 Barra de ferramentas de imagem, 24, 25 tipos de zona, 61 Ambiente, 24 Barra de ferramentas padrão, 24, 25 Conselho sobre problemas, 92 Ambiente do OmniPage, 24 Barras de ferramentas de acoplamento, 25 Conteúdo dos documentos do OmniPage, Ampliação de exibições, 24, 68 Botão Efetuar OCR, 40, 43 84 Anexos a mensagens de correio, 89 Botão Exportar resultados, 41, 43, 83 Contraste, 33, 51, 95 Área de transferência, 41, 88 Botão Obter página, 40, 42 Controle sobre o processamento, 42 Áreas com várias colunas, 26, 76 Brilho, 33, 51, 95 Conversão de imagens, 98 Armazenar alterações de zoneamento, 77 Conversores de exportação, 86 Arquivo de saída PDF, 98 Arquivos C Copiar páginas para a Área de Caixa de diálogo Carregar arquivo de transferência, 45, 88 como destino de exportação, 82 Correção como origem da imagem, 50 imagem, 50 Caixa de diálogo Corretor, 67 em futuras sessões, 31 mantido na desinstalação, 100 opções, 34, 67 opções de separação, 83, 90 Caixa de diálogo Enviar correio, 89 Caixa de diálogo Opções, 33 Correção de resultados de OCR, 67 tipos, 83 Correção remota, 31 tipos compatíveis, 98 Caixa de ferramentas do OmniPage, 24, 27, 40 Correio, 41, 89 tipos para exportação, 85, 99 Criação de dados de treinamento, 74 Arquivos de imagem Caixas, 26, 76 abrir, 98 Caixas para texto reconhecido, 95 amostras, 93 Caracteres D entrada, 22, 50 não reconhecidos, 66 Dados de treinamento não salvos, 31 ordem de leitura, 50 suspeitos, 66 Desagrupar elementos, 76 tipos, 98 Caracteres não imprimíveis, 66 Descarregamento de um dicionário de Arquivos de imagem de amostra, 36, 93 Carregar usuário, 70 Arquivos de imagem de várias páginas, 50, arquivos de treinamento, 74 Descarregar arquivos de treinamento, 74 82, 98 Arquivos OPD, 31 Descarregar gabaritos de zona, 63 Arquivos de imagem TIFF, 98 gabaritos de zona, 54, 63 Descrição do layout, 40, 45, 53 Arquivos OPD um dicionário de usuário, 70 Descrição do layout de documento, 40, 53 definição, 31 Colorido Desenhar zonas no Direct OCR, 47 propósito de, 32 digitalizar, 51 Desinstalação do software, 100 imagens, 82 Dicionários, 45, 68 OmniPage SE Manual do usuário 103
  • 104. Dicionários do usuário, 67, 70 tempo real, 77 colorido, 82 acrescentar palavras, 67 texto reconhecido, 75 conversão, 98 carregar, 70 Editor de texto, 24, 26, 34, 66 edição, 76 descarregar, 70 Efeito das configurações, 34 gravação, 82, 98 edição, 70 Entrada obtenção, 23, 42 iniciando, 70 de arquivo de imagem, 50 planos de fundo, 54 Dicionários jurídicos, 68 de arquivos PDF, 50, 98 preto e branco, 82 Dicionários médicos, 68 do scanner, 51 qualidade, 51 Dicionários profissionais, 68 Entrada de arquivo PDF, 50, 98 resolução, 29, 82, 95, 98 Digitalização Entrada de pasta para Programar OCR, 97 substitutos em PDF, 88 Assistente, 14 Enviar páginas via correio, 89 tamanho, 29 brilho, 33, 51 Espaço em disco, 12, 94 tons de cinza, 82 colorido, 51 Etapas básicas de processamento, 23 Imagens gráficas contraste, 33 Excluir edição, 76 entrada de, 51 arquivos de treinamento, 74 em arquivos HTML, 100 figuras, 51 dicionários de usuário, 70 na exportação, 83, 99 livros, 33 gabaritos de zona, 63 Impressão preto e branco, 51 páginas, 28, 30 documentos, 31 tons de cinza, 51 Exemplos de treinamento, 71 páginas reconhecidas, 31 Digitalização de livros, 33 Exportação repetida, 81, 84 Indicadores de cabeçalho/rodapé, 66 Digitalização de página dupla, 33 Exportação True Page, 86 Informações técnicas, 91 Direct OCR, 46 Exportar Iniciando o programa, 14 Painel Opções, 33 imagens gráficas, 83, 100 Iniciar aplicativo de destino, 84 Divisão de zonas, 57 Página ligada, 85 Início de um dicionário de usuário, 70 Documentos para a Área de transferência, 88 Inserção de divisores de tabela, 62 com frente e verso, 53 para aplicativos de destino, 23, 42, Instalação do com layout variado, 53 82 OmniPage SE, 13 concluir, 41 para correio, 89 scanners, 14 copiar para a Área de transferência, para o arquivo, 83, 99 IntelliTrain, 34, 49, 72, 95 45, 88 para PDF, 88, 99 Interromper o processamento automático, descrição do layout, 53 repetido, 81, 84 41 exportar, 23, 40, 43, 81 tipos de arquivo e níveis de Itens de menu Obter texto, 47 fechar, 31 formatação, 99 gerenciamento, 28 gravação, 32, 81 True Page, 86 L Layout de detecção automática, 53 local para novas páginas, 33 não concluído, 31 F Layout personalizado, 34, 54 no OmniPage SE, 23 Fechar documentos, 31 Layout, detecção automática, 53 salvar enquanto trabalha, 84 Finalidade do treinamento, 71 Leitura Documentos do OmniPage ordem dos arquivos de imagem, 50 conteúdo do, 84 G texto em voz alta, 78 Linhas em tabelas, 62 definição, 31 Geração de divisores de tabela, 62 propósito de arquivos OPD, 32 Links para páginas da Web, 76 Gerenciador de documentos, 24, 28, 29 Lista suspensa salvar como, 32, 84 personalizar colunas no, 30 Documentos frente e verso, 52 Obter páginas, 42 Gerenciador de tarefas, 93 Resultados da exportação, 43 Documentos inacabados, 31 Gerenciamento de documentos, 28 Drivers TWAIN para scanners, 14 Lista suspensa Obter páginas, 42 Gravação de imagem original, 82, 98 Local para novas páginas, 33 Gravação de texto, 83 Localizar E Guia de início rápido, 36 palavras ausentes do dicionário, 67 Edição e zoneamento em tempo real, 77 palavras suspeitas, 67 Edição no modo True Page, 76 H Editar arquivos de treinamento, 74 Hyperlinks, 76 M atributos de caracteres, 75 Manter estilos de parágrafos, 83 atributos de parágrafo, 75 I Marcadores, 66, 68 dicionários de usuário, 70 Idioma de interface, 33 Melhoria da precisão, 51, 72, 95 imagens gráficas, 76 Idiomas Menus de atalho, 58 no modo True Page, 76 para interface de usuário, 33 Miniaturas, 24, 26, 28 Saída de PDF, 88 para reconhecimento, 33, 45, 95 Modificar gabaritos de zona, 63 tabelas, 61, 76 Imagens Modo seguro, 93 Modo VGA, 93 104 Índice remissivo
  • 105. Mover Opções de processamento, 33 conversores de exportação, 86 divisores de tabela, 62 Opções de salvamento, 86 Planos de fundo do tipo ignorar, 54 entre páginas, 28 Opções para correção, 34, 67 Planos de fundo do tipo processar, 54 MS Outlook, 89 Ordem de leitura, 76 Planos de fundo para zoneamento, 26, 54 Mudança de linha, 34 Ordem dos elementos da página, 76 Posicionamento da nova página no Mudar Otimizar o brilho, 33, 51 documento, 33 ordem de leitura, 76 Precisão parte de uma página, 77 tipos de zona, 58 P Influência do brilho, 51 influência do modo de digitalização, Página ligada, 85 51 Páginas N arquivos de imagem de várias páginas, influência do treinamento, 71 melhoria, 51, 71, 95 Não completar o processamento 50, 82, 98 Preto e branco automático, 41 Botão Obter página, 40, 42 digitalizar, 51 Níveis de formatação, 49, 66, 99 coluna única, 53, 57 imagens, 82 Níveis de formatação e tipos de arquivo, copiar para a Área de transferência, Problemas com reconhecimento de fax, 96 99 45, 88 Problemas de desempenho durante o Novo arquivo em página vazia, 50 corrigidas, 28 OCR, 96 Novos recursos, 17 enviar como correio, 89 Problemas de desempenho ou de sistema excluir, 28, 30 durante o OCR, 96 O localização no documento, 33 modificadas, 28 Processamento O guia do teclado para audição de textos, alternar entre o processamento mover entre, 28 manual e automático, 27, 43 78 navegação, 24, 78 Obtenção de Ajuda on-line, 9 automático, 27, 40 novo arquivo em página vazia, 50 com o Assistente de OCR, 45 Obtenção de imagens, 23, 42 obtidas, 28 OCR combinado, 27, 43 páginas com coluna única e com de outros aplicativos, 46 Assistente, 39, 45, 46 tabelas, 53 configurações, 33 documentos em futuras sessões, 31 páginas de planilha, 53 etapas básicas do, 23 configurações do Direct OCR, 46 pendentes, 28 definição, 22 etapas, visão geral, 23, 38 reconhecer tudo novamente, 41 interromper o processamento desempenho fraco durante, 96 reconhecidas, 28 Direct OCR, 33, 46 automático, 41 reorganização, 28 manual, 27, 42 processamento automático, 27, 40 salvas, 28 processamento manual, 27, 42 parar o processamento automático, selecionar várias, 28, 29 41 Programar OCR, 49 status, 28 realizar OCR, 23 passo a passo, 42 várias colunas, 53 processamento automático resultados das correção, 67 zoneada, 28 tarefas em Programar OCR, 49 incompleto, 41 Páginas com várias colunas, 54 reiniciar o processamento verificação dos resultados de OCR, Páginas corrigidas, 28 68 automático, 41 Páginas de planilha, 54 Processamento automático, 27, 40 Ocultar ou mostrar marcadores, 66 Páginas modificadas, 28 OmniPage Pro Processamento combinado, 27, 43 Páginas obtidas, 28 Processamento manual, 27, 42 atualizando para, 19 Páginas pendentes, 28, 77 novos recursos do, 17 Processamento passo a passo, 23, 42 Páginas reconhecidas, 28 Processamento preterido, 31 OmniPage SE Páginas salvas, 28 desinstalação, 100 Procura de saída de PDF, 88 Painel de imagem, 24, 26 Programar OCR, 49 documentos no, 23 Palavras ausentes do dicionário, 66 iniciando, 14 entrada de pastas, 97 Palavras marcadas no Editor de texto, 66 pastas observadas, 97 Instalação do, 13 Palavras suspeitas, 66 recursos, 19 Propósito de arquivos OPD, 32 PaperPort, 48 Propriedades de zonas, 57 recursos do OmniPage SE Parágrafo comparados com os do editar atributos, 75 OmniPage Pro, 8, 10, 19 estilos, 75, 83 Q registrando, 17 manter estilos de parágrafos, 84 Quadros, 26, 76, 86, 95 reinstalação, 100 Parar o processamento automático, 41 Qualidade de imagens, 51 testes, 93 Pastas observadas, 97 versões anteriores, 13 On-line Personalizar barras de ferramentas, 25 R Ajuda HTML, 9 Colunas do Gerenciador de Reconhecer páginas novamente, 43 registro, 17 documentos, 30 Reconhecimento Opções avançadas de salvamento, 86 acelerar, 96 OmniPage SE Manual do usuário 105
  • 106. executar, 42 idiomas, 33, 45, 95 T das etapas de processamento, 23 do documento, 28 precisão, 51, 71, 95 Tabelas do processamento, 38 problemas com reconhecimento de colunas em, 62 Visão geral do processamento, 36 fax, 96 edição, 76 Visualização Preservar fontes e parágrafos, salvar resultados, 83 editar divisores, 61 66, 85 Reconhecimento de fax, 96 em páginas com coluna única, 54 Visualização Sem formatação, 66, 85 Reconhecimento lento, 96 gerar divisores, 62 Visualização True Page, 67 Reconhecimento óptico de caracteres, 22 inserir divisores, 62 Visualizações Recurso de conversão de texto em fala, 13, linhas em, 61 Manter fontes e parágrafos, 66 78 mover divisores, 62 Sem formatação, 66 Recursos, novos, 17 remover divisores, 61 True Page, 67 Redimensionamento de zonas, 59 tratamento de tabela no Editor de Visualizações do Editor de texto, 26, 66 Registro texto, 76 zonas, 58, 61 aplicativos para Direct OCR, 47 OmniPage SE, 17 Tarefas em Programar OCR, 49 Z Reiniciar o processamento automático, 41 Testes do OmniPage SE, 93 Zona alfanumérica, 57 Reinstalação do OmniPage SE, 100 Texto em itálico, 75 Zona de texto, 58 Remoção de divisores de tabela, 62 Texto em negrito, 75 Zona gráfica, 58 Reordenar páginas, 28 Texto sublinhado, 75 Zona numérica, 57 Requisitos de memória, 12, 94 Textos impressos por impressora matricial, Zonas, 26 Requisitos do sistema, 12 96 adicionar a, 60 Requisitos mínimos do sistema, 12 Tipos de arquivo compatíveis, 98 alfanumérica, 57 Resolução, 29, 82, 95, 98 Tipos de zonas, 57 definir tipos, 62 Retenção de layout, 67 Tons de cinza descarregar gabaritos, 64 Retirar imagens gráficas da exportação, 83 digitalizar, 51 desenhar no Direct OCR, 47 imagens, 82 dividir, 58 Trabalho com zonas, 59 excluir gabaritos, 63 S Treinamento, 71 gabaritos, 54, 63, 95 Salvar arquivos de treinamento, 74 ignorar, 58 arquivos de treinamento, 74 automático, 72 imagens gráficas, 58 como documento OmniPage, 32, 84 aviso para salvar dados, 31 irregulares, 59 dicionários de usuário, 70 carregar arquivos de treinamento, 74 manual, 54, 95, 96 documentos, 81 criação de dados de treinamento, 74 modificar gabaritos, 63 documentos enquanto trabalha, 84 dados de treinamento não salvos, 31 mudar tipos, 58 gabaritos de zona, 63 descarregar arquivos de treinamento, na página, 28 imagens originais, 82, 98 74 numérica, 57 no formato OPD, 32, 83 editar arquivos de treinamento, 74 processar, 58 opções, 86 IntelliTrain, 72 propriedades, 57 para o arquivo, 45, 82 manual, 72 redimensionar, 59 resultados do reconhecimento, 83 salvar arquivos de treinamento, 74 retangulares, 59 Salvar e iniciar, 84 Treinamento automático, 72 salvar gabaritos, 63 texto, 83 Treinamento manual, 72 substituir gabaritos, 63 Scanners, 51, 95 Treinar novamente, 72 subtrair de, 58 configuração, 14 True Page, 26 tabela, 58, 61 drivers, 14 texto, 58 duplex, 52 U tipos, 26, 57, 95 Scanners duplex, 52 trabalhar com, 59 Seleção de várias páginas, 29 União de zonas, 60 unir, 60 Selecionar várias páginas, 29 Unidade de medida, 34 Zonas de gabarito, 54, 63, 95 Solução de problemas, 91, 92 URLs, 76 Zonas do tipo ignorar, 58 Soluções para desempenho baixo, 92 Uso do Direct OCR, 47 Zonas do tipo processar, 58 Substituir gabaritos de zona, 63 Zonas irregulares, 59 Subtração de zonas, 57 V Zonas retangulares, 59 Sugestões durante a correção, 68 Verificação de texto, 68 Zoneamento automático, 26, 34, 40, 53, Suporte a DMS, 97 Verificação dos resultados de OCR, 68 58 Suporte a ODMA, 97 Verificador dinâmico, 68 Zoneamento em tempo real, 77 Visão geral Zoneamento manual, 42, 54 106 Índice remissivo