Como ler arquivos HTML usando o Java

Escrito por lysis | Traduzido por ritaciro cavalcante
  • Compartilhar
  • Tweetar
  • Compartilhar
  • Pin
  • E-mail
Como ler arquivos HTML usando o Java
Programar em Java é tão fácil quanto fazer um café java! (java hot and black image by Pix by Marti from Fotolia.com)

Ler arquivos HTML no Java não é diferente de ler arquivos de texto. A não ser que o formato do arquivo seja XML, é possível ler um arquivo HTML usando um objeto arquivo Java. Ele importa o texto do arquivo e o lê, linha por linha. Você pode manipular o texto, ou mostrá-lo na tela. Usar o objeto arquivo para ler HTML é possível usando apenas algumas linhas de código.

Nível de dificuldade:
Moderado

Outras pessoas estão lendo

Instruções

  1. 1

    Importe as bibliotecas necessárias. O uso do objeto arquivo requer o uso de bibliotecas além das importadas automaticamente quando você cria uma nova classe ou projeto. O código a seguir mostra quais bibliotecas você irá precisar:

    import java.io.BufferedInputStream; import java.io.DataInputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException;

  2. 2

    Abra o arquivo e prepare os buffers. O objeto precisa da localização do arquivo HTML dentro do computador. Ele pode também estar em um servidor web. O código a seguir estabelece uma variável para abrir o arquivo e cria outras para o fluxo de dados.

    File myhtml = new File(\"C:\\myHTML.html\"); FileInputStream fileinput = null; BufferedInputStream mybuffer = null; DataInputStream datainput = null;

  3. 3

    Atribua as informações sobre o arquivo nas variáveis criadas. As variáveis de buffer carregam a informação para a memória para serem lidas mais rapidamente.

    fileinput = new FileInputStream(myhtml); mybuffer = new BufferedInputStream(fileinput); datainput = new DataInputStream(mybuffer);

  4. 4

    Crie um loop que lê o arquivo linha por linha e o imprime para o console. O código a seguir lê os dados até chegar ao fim do fluxo:

    while (datainput.available() != 0) { System.out.println(datainput.readLine()) GO }

  5. 5

    Feche o fluxo de arquivo. Para liberar memória, é importante fechar os fluxos de arquivos e de dados:

    myHTML.close(); mybuffer.close(); datainput.close();

Não perca

Referências

Filtro:
  • Geral
  • Artigos
  • Slides
  • Vídeos
Mostrar:
  • Mais relevantes
  • Mais lidos
  • Mais recentes

Nenhum artigo disponível

Nenhum slide disponível

Nenhum vídeo disponível