metacortex
Grünschnabel
Hallo, ich habe folgendes Problem:
Ich lasse mir ein HTML-Dokument zuschicken (funktioniert auch)
und möchte im eintreffenden Stream verschiedene Angaben rausfiltern. D.h. ich möchte beispielweise alle Zeilen haben, wo <table><tr><td>ich bin cool</td></tr></table> (nur als Beispiel) drinsteht bzw die mit <img width=" anfangen. Weiterhin möchte ich dann bei den rausgefilterten Zeilen, dann konkrete Angaben, z.b. das cool von "ich bin cool" (siehe Beispiel von oben) oder die width-Zahl bei img in entsprechenden Dateien speichern.
Irgendwie geht das mit reg-expressions!?
Ich lasse mir ein HTML-Dokument zuschicken (funktioniert auch)
Code:
URL url = new URL("http://www.cool.de/);
InputStream in_html = url.openStream();
OutputStream out_html = System.out;
byte[] buffer = new byte[4096];
int bytes_read;
while((bytes_read = in_html.read(buffer)) != -1) {
out_html.write(buffer, 0, bytes_read); // Stream zeilenweise anzeigen
}
und möchte im eintreffenden Stream verschiedene Angaben rausfiltern. D.h. ich möchte beispielweise alle Zeilen haben, wo <table><tr><td>ich bin cool</td></tr></table> (nur als Beispiel) drinsteht bzw die mit <img width=" anfangen. Weiterhin möchte ich dann bei den rausgefilterten Zeilen, dann konkrete Angaben, z.b. das cool von "ich bin cool" (siehe Beispiel von oben) oder die width-Zahl bei img in entsprechenden Dateien speichern.
Irgendwie geht das mit reg-expressions!?