Hi,
ich arbeite derzeit an einem etwas größeren Projekt.
Es tut sich nun folgende komplexe Frage auf:
Wie komme ich an den REINEN Text einer Webseite?
Zur Erläuterung:
Wenn ich mit FireFox oder IExp eine Website durchsuche, färbt dieser die Treffer auf der Webseite in einer Farbe ein.
Wie das funktioniert ist mir klar. Der QuellText der Website wird durchsucht, und das zu suchende Wort wird ersetzt.
Wenn ich jedoch das zu suchende Wort überall ersetze, wird es auch in Anweisungen, Links, Funktionen usw. ersetzt.
Ein Beispiel:
gesucht wird nach "Bilder"
Nun wird im Quelltext zB auch:
der Link bearbeitet. Oder hier:
der Klassen-Name. Ich möchte aber nur den REINEN Text ersetzen. Doch dafür brauch ich ihn erstmal! Hat jemand eine Idee?
Hoffe ich hab mich verständlich ausgedrückt. Etwas doof zu erklären wenn man die Fremdwörter nicht kennt..
Viele Grüße,
Michi
ich arbeite derzeit an einem etwas größeren Projekt.
Es tut sich nun folgende komplexe Frage auf:
Wie komme ich an den REINEN Text einer Webseite?
Zur Erläuterung:
Wenn ich mit FireFox oder IExp eine Website durchsuche, färbt dieser die Treffer auf der Webseite in einer Farbe ein.
Wie das funktioniert ist mir klar. Der QuellText der Website wird durchsucht, und das zu suchende Wort wird ersetzt.
Wenn ich jedoch das zu suchende Wort überall ersetze, wird es auch in Anweisungen, Links, Funktionen usw. ersetzt.
Ein Beispiel:
gesucht wird nach "Bilder"
Nun wird im Quelltext zB auch:
Code:
<a href="http://www.google.de/Bilder>Test</a>
der Link bearbeitet. Oder hier:
Code:
class="Bilder"
der Klassen-Name. Ich möchte aber nur den REINEN Text ersetzen. Doch dafür brauch ich ihn erstmal! Hat jemand eine Idee?
Hoffe ich hab mich verständlich ausgedrückt. Etwas doof zu erklären wenn man die Fremdwörter nicht kennt..
Viele Grüße,
Michi