HTML auslesen (XPath)

Status
Nicht offen für weitere Antworten.

Malaxo

Erfahrenes Mitglied
Weiss nicht ob das hier hin kommt, aber mit meiner Zusatzfrage, kann ich es in die richtige Richtung lenken.

XPath ist ein XML Parser, hab ich das richtig verstanden?

Kann ich mit XPath auch ein HTML Dokument parsen?

Beispiel:
HTML:
<html>
<head></head>
<body>
<ul>
 <li>
   Diesen Text will ich haben
 </li>
</ul>
</body>
</html>

XPath:
/body/li[1]

Damit es mir "Diesen Text will ich haben" rausliest?

Jetzt die Zusatzfrage: Wie geht es sonst, das ich aus einem HTML irgend was rauslesen kann?

Bin darauf gestossen durch das Firefox Extension R.I.P. ;) Bei dem man Elemente aus einer Homepage "töten" kann, so das sie beim nächsten aufruf der Seite nicht wieder erscheinen. (z.b. Werbung oder unnötige IFrames etc.) Dieses Extension arbeitet mit XPath.


//edit

Ok... habs mitlerweile rausgefunden.

Es klappt XPath wäre aber so:

/html/body/ul/li[1]
 
Status
Nicht offen für weitere Antworten.
Zurück