Mais
×

Como ler arquivos HTML usando o Java

Atualizado em 02 junho, 2017

Ler arquivos HTML no Java não é diferente de ler arquivos de texto. A não ser que o formato do arquivo seja XML, é possível ler um arquivo HTML usando um objeto arquivo Java. Ele importa o texto do arquivo e o lê, linha por linha. Você pode manipular o texto, ou mostrá-lo na tela. Usar o objeto arquivo para ler HTML é possível usando apenas algumas linhas de código.

Instruções

Programar em Java é tão fácil quanto fazer um café java! (java hot and black image by Pix by Marti from Fotolia.com)
  1. Importe as bibliotecas necessárias. O uso do objeto arquivo requer o uso de bibliotecas além das importadas automaticamente quando você cria uma nova classe ou projeto. O código a seguir mostra quais bibliotecas você irá precisar:

    import java.io.BufferedInputStream; import java.io.DataInputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException;

  2. Abra o arquivo e prepare os buffers. O objeto precisa da localização do arquivo HTML dentro do computador. Ele pode também estar em um servidor web. O código a seguir estabelece uma variável para abrir o arquivo e cria outras para o fluxo de dados.

    File myhtml = new File(\"C:\\myHTML.html\"); FileInputStream fileinput = null; BufferedInputStream mybuffer = null; DataInputStream datainput = null;

  3. Atribua as informações sobre o arquivo nas variáveis criadas. As variáveis de buffer carregam a informação para a memória para serem lidas mais rapidamente.

    fileinput = new FileInputStream(myhtml); mybuffer = new BufferedInputStream(fileinput); datainput = new DataInputStream(mybuffer);

  4. Crie um loop que lê o arquivo linha por linha e o imprime para o console. O código a seguir lê os dados até chegar ao fim do fluxo:

    while (datainput.available() != 0) { System.out.println(datainput.readLine()) GO }

  5. Feche o fluxo de arquivo. Para liberar memória, é importante fechar os fluxos de arquivos e de dados:

    myHTML.close(); mybuffer.close(); datainput.close();

Referências

Cite this Article A tool to create a citation to reference this article Cite this Article