Webseiteninhalt auslesen.

Felipe96 · 16. Oktober 2019

Hallo Forum. Ich versuche die Daten einer Webseite auszulesen. Doch aus irgend einem Grund bekomme ich den HTML code nicht ausgelesn.
Ich würde mich über etwas Hilfe sehr freuen. Im Anschluss noch der Code soweit ih gekommen bin.

MFG

Code:

import java.io.IOException;
import java.net.URL;
import java.nio.charset.StandardCharsets;
import java.util.Scanner;



public class Main {


    public static void main(String[] args) {

        try {
            Scanner scanner = new Scanner(new URL("https://www.mytischtennis.de/clicktt/TTVWH/19-20/ligen/Jungen-18-Kreisliga-Vorrunde/gruppe/357797/mannschaft/2254750/SV-Marschalkenzimmern-II/spielerbilanzen/vr/index.html").openStream(), StandardCharsets.UTF_8);
            while(scanner.hasNextLine()) {
                System.out.println(scanner.nextLine());
            }
            scanner.close();

        } catch (IOException e) {
            e.printStackTrace();
        }

    }

}

Bratkartoffel · 17. Oktober 2019

Hallo Felipe96,

da du ja mit Java 12 unterwegs bist, probier bitte den HttpClient von Java:
Introduction to the Java HTTP Client
Java HTTP Client - Examples and Recipes

Das Arbeiten mit Scanner + URL mag zwar in der Regel funktionieren, jedoch sind hier die Analysemöglichkeiten bei Fehlern sehr begrenzt. Ich vermute, dass die Seite einen 300er Status mit Weiterleitung liefert, womit der Scanner / URL nicht richtig umgehen kann.

Grüsse,
BK

Webseiteninhalt auslesen.

Felipe96

Grünschnabel

Bratkartoffel

gebratene Kartoffel

Neue Beiträge