Inhalt zwischen html Tag auslesen

MR_CATDRIVER

Grünschnabel
Hallo,

ich würde gerne den Inhalt von der Webseite http://kurse.teleboerse.de/DE/Showpage.aspx?pageID=47&isin=DE0008404005 auslesen.
Der Teil der mich interessiert befindet sich zwischen den tags <div id="Quotation">......</div>.
Würdet ihr das in dem Beispiel mit einem xml Parser oder htmlParser (z.B. HtmlEditorKit) machen oder gibt es dafür geeignetere Lösungen in Java.
Habe das mit php schon hinbekommen. Da habe ich die Webseite in einen String gelesen und dann entsprechend durchsucht (reguläre Ausdrücke).
Gefällt mir aber irgendwie nicht so richtig die Lösung und ich denke dafür gibt es was geeigneteres.

Vielleicht hat ja irgendeiner einen Hinweis für mich....


Grüße aus Bärlin
 
Ich habs jetzt so gelöst

Code:
suchstring=suchstring.substring(suchstring.indexOf("id=\"Quotation\""),suchstring.indexOf(usw.)

und funktioniert.........

ob es effektiv ist sei dahingestellt
 
sowas würde mich auch interessieren.
ich habe in meiner anwendung zum beispiel auch werte einer seite mit XPath ausdrücken ausgelesen.gibt es sowas in der art nicht auch für html?

die stelle die ich zB auslesen möchte sieht ungefähr so aus

Code:
 <div class="postbody"><div>beispiel text /> text text text <br /><br />test .</div>
 
Ist schon eine Weile her, aber damals habe ich mich mit tagsoup auf grausames HTML gestürzt - und bin damit recht gut gefahren. XPath ist dann auch kein Problem mehr.
 
Code:
import org.eclipse.swt.*;
import org.eclipse.swt.browser.*;
import org.eclipse.swt.layout.*;
import org.eclipse.swt.widgets.*;

public class Snippet308 {
	public static void main(String [] args) {
		final String html = "<html><title>Snippet</title><body><p id='myid'>Best Friends</p><p id='myid2'>Cat and Dog</p></body></html>";
		Display display = new Display();
		final Shell shell = new Shell(display);
		shell.setLayout(new FillLayout());
		final Browser browser;
		try {
			browser = new Browser(shell, SWT.NONE);
		} catch (SWTError e) {
			System.out.println("Could not instantiate Browser: " + e.getMessage());
			display.dispose();
			return;
		}
		browser.addProgressListener(new ProgressListener() {
			public void changed(ProgressEvent event) {
			}
			public void completed(ProgressEvent event) {
				String value = (String)browser.evaluate("return document.getElementById('myid').childNodes[0].nodeValue;");
				System.out.println("Node value: "+value);
			}
		});
		/* Load an HTML document */
		browser.setText(html);
		shell.open();
		while (!shell.isDisposed()) {
			if (!display.readAndDispatch())
				display.sleep();
		}
		display.dispose();
	}
}

http://www.eclipse.org/swt/snippets/

Gruß

Sebastian
 
Zurück