Javascript im Quelltext ignorieren...

jimboo

Mitglied
Hallo,

ich lasse mir den Quelltext einiger Seiten ausgeben und suche dann nach bestimmten Inhalten (bspw. Links). Allerdings tritt gelegentlich bei einigen Seiten ein Laufzeitfehler auf der etwas mit Javascript zu tun hat.
Jedenfalls beim Versuch dies zu Debuggen schickt er mich in den Java-Quellcode der jeweiligen Seite, wo der Fehler aufgetreten ist.
Kann man deshalb dies irgendwie umgehen? Z.B. in dem man festlegt, dass er keine Java-Inhalte untersuchen soll?! :eek:
(Sprache: VB.NET)
 
Hallo.

Wenn du beim nächsten Mal etwas besser verdeutlichst wie du das ganze machst, ist dir einfacher zu helfen.

So nach deiner Beschreibung nach, dürftest du das WebBrowser-Control verwenden, sonst wirst wohl kaum den JavaScript-Fehler bekommen.

Wenn du nur den Quelltest einer Website brauchst, würde sich die HttpWebRequest / HttpWebResponse Klasse doch viel besser eignen, oder benötigst du auch die Darstellung des gerenderten Html?

lg, Alex
 
Erst einmal sorry, ich ärgere mich selbst wenn die Leute ungenaue Infos geben.
Desweiteren verstehe ich noch nicht vieles, folglich scanne ich den Quellcode tatsächlich mit dem WebBrowser-Control ab.
Deine Lösung scheint edler zu sein, werde mir das mal ansehen. Trotzdem kannst Du mir bitte vielleicht einen Tipp geben, wie ich nun Java-Script umgehe bzw. tritt dies bei deiner Lösung gar nicht erst auf?! Das wäre sonst super

Alexander Du bist ein "Schat"....sagen wir einfach mal ein spitzen Typ! ^^
 
Habe mal testhalber folgendes mir zusammengebraut: ;)

Code:
    Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
        Dim IOStream As System.IO.Stream
        Dim strread As System.IO.StreamReader
        Dim text1 As String
        Dim URL As String = "http://www.google.de"

        Dim request As System.Net.WebRequest = System.Net.WebRequest.Create(URL)

        IOStream = request.GetResponse.GetResponseStream
        strread = New System.IO.StreamReader(IOStream)

        text1 = strread.ReadToEnd

        strread.Close()
        IOStream.Close()
        MsgBox(text1)
    End Sub

Nein ganz im Gegenteil, möchte auf den verzichten (WebBrowser-Control). Das ist doch sonst ein unschöner Code, der darüberhinaus zu solchen bösen Fehlern führt.
 
Zuletzt bearbeitet:
Jedoch tritt bei deiner Methode eine kleine Unannehmlichkeit auf.
Wenn ich den Quelltext mit WebRequest extrahiere und den Quelltext ausgebe bekomme ich teilweise sehr viele Leerzeichen mitgeschickt. :confused:
Bsp.:
Dies ist ein

schöner Tag</a><br>


Danke für Deine/ Eure Help.
 
Gibt es eine Möglichkeit diesen Text anders formatiert zu erhalten, d.h. ohne Leer- und Sonderzeichen (=Symbole) ? :suspekt:
 
Wie oben schon angesprochen filtere ich Strings, genauer gesagt Links inkl. Linktexte, aus dem Quelltext. Folglich will ich keine komischen Symbole in meiner Anwendung erhalten.
Vielen Dank für deine schnellen Antworten!
 
Zurück