Como usar o Tesseract OCR em Java

Escrito por jim campbell | Traduzido por pedro lima
  • Compartilhar
  • Tweetar
  • Compartilhar
  • Pin
  • E-mail
Como usar o Tesseract OCR em Java
Bibliotecas Tesseract permitem aos usuários digitalizarem seus documentos (John Foxx/Stockbyte/Getty Images)

As bibliotecas de reconhecimento óptico de caracteres Tesseract oferecerem aos desenvolvedores um método para escanear documentos e textos em uma imagem. Elas são usadas para armazenar imagens de documentos que você não precisa mais em papel. Você pode utilizá-las em Java, criando laços de controle para cada caractere e escrevendo cada um em um arquivo. Para usar as bibliotecas Tesseract, você deve incluir o "namespace" Java para as funções OCR.

Nível de dificuldade:
Moderado

Outras pessoas estão lendo

Instruções

  1. 1

    Clique com o botão direito no arquivo Java que você deseja usar para criar o documento OCR. Clique em "Abrir com" e selecione o editor Java de sua preferência.

  2. 2

    Adicione o "namespace" da biblioteca OCR no topo do arquivo. Copie e cole o seguinte código ao seu arquivo de código-fonte:

    com.tplan.robot.imagecomparison.tesseractocr

  3. 3

    Crie o código responsável por escanear caracteres para um arquivo. Por exemplo, o seguinte código cria laços através de cada caractere em um arquivo e os escreve em um arquivo de imagem:

    Var lines=0 Compareto method="tocr" cmparea="x:33,y:2,w:200,h:22" for (i=1; {i}<{lines}+1; i={i}+1) { Typeline "{_TOCR_LINE{i}}" }

  4. 4

    Clique no botão "Save" (Salvar) do editor e clique em "Run" (Executar) para executar o código num compilador Java.

Não perca

Filtro:
  • Geral
  • Artigos
  • Slides
  • Vídeos
Mostrar:
  • Mais relevantes
  • Mais lidos
  • Mais recentes

Nenhum artigo disponível

Nenhum slide disponível

Nenhum vídeo disponível