Guten Abend!
Ich habe folgende Frage... Ich will eine "zugestreamte" Website auslesen und gewisse Tags herausfiltern (mittels regex, wenn möglich). Folgender Thread beschreibt das Ganze schon ganz gut:
http://www.tutorials.de/forum/java/...n-zugestreamte-html-quelltexte-auswerten.html
Folgender Code:
funktioniert ganz gut, ABER leider nur, wenn der zu findende Tag-Bereich in einer Zeile steht. Wenn ich zB ein
<tr>
ich bin eine zeile
<tr>
auslesen möchte, würde das nicht klappen. Wie würdet ihr das machen, wenn eben solche Bereiche auch ausgelesen werden sollen können?
Vielen Dank im Vorhinein
Gruß, Wolfclaw
Ich habe folgende Frage... Ich will eine "zugestreamte" Website auslesen und gewisse Tags herausfiltern (mittels regex, wenn möglich). Folgender Thread beschreibt das Ganze schon ganz gut:
http://www.tutorials.de/forum/java/...n-zugestreamte-html-quelltexte-auswerten.html
Folgender Code:
Code:
String line;
Matcher matcher
while ((line = br.readLine()) != null) {
matcher = PATTERN_TEXT.matcher(line);
if (matcher.matches())
System.out.println("Filtertext: " + line);
}
funktioniert ganz gut, ABER leider nur, wenn der zu findende Tag-Bereich in einer Zeile steht. Wenn ich zB ein
<tr>
ich bin eine zeile
<tr>
auslesen möchte, würde das nicht klappen. Wie würdet ihr das machen, wenn eben solche Bereiche auch ausgelesen werden sollen können?
Vielen Dank im Vorhinein
Gruß, Wolfclaw