Mit Java XHTML auslesen und nach spezifischen Tags suchen

basti1284

Grünschnabel
Hi,

ich bin neu hier, ich habe auch schon die Suchen Funktion genutzt, aber nicht wirklich das gefunden, was ich tatsächlich gesucht habe, ich schließe dabei aber auch nicht aus, dass es sich dabei um ein Problem handelt, dass vor dem Rechner sitzt.

Worum es geht: Ich muss ein kleines Tool basteln, dass durch xhtml-Dateien schaut und bestimmt Teile raussucht und davon einen Teil davon in einer Liste speichert. Was ich gesehen habe ist, dass es recht komfortabel funktioniert, wenn man aus einer HTML Datei Links rauslesen möchte. Wenn das so in etwa in meinen xhtml-Datein auch gibt, das wäre wunderbar.

Dabei gibt es in meinem Fall zwei Schreibweisen: (1) metaSystemID="(DIESWIRDBENÖTIGT)" und alternativ dazu (2)
#{message.DIESWIRDBENÖTIGT} (ein kleines Beispiel, wie es im Code aussehen kann, steht unten, in diesem Fall lautet der Tag
#{messages.btnStart}, ich brauche daraus nur btnStart, das in eine Liste gespeichert wird. Es ist aber nicht zwangsläufig so, dass dies in eine variable geschrieben wird, es kann auch sein, dass unter anderem eine Überschrift dadurch definiert wird,
wie zum Beispiel <h1>#{messages.lblHeadline}</h1>.



Code:
<ice:form id="sebastianForm">
                   <div class="content"> 
                        <div class="buttonPanel">  
                            <ice:messages/>   
                            <ice:commandButton id="startButton"   
                                               title="Start"
                                               value="#{messages.btnStart}"
                                               action="#{sebastianTestAction.showPopup}"/>
                        </div>
                    </div>
                </ice:form>
Mein aktueller Plan war die Seiten einzulesen, dadurch zu iterieren und die Zeichenfolge #{Messages. zu suchen, mir die Position des Zeichens zu merken, die Position von der geschlossenen Klammer (}) zu detektieren und einen String aus den Zeichen dazwischen zu basteln. Dementsprechend würde ich es dann auch für die andere Zeichenkette (metaSystemID="() machen. Ist das der richtige Ansatz, geht das überhaupt und wenn ja, ist das vielleicht mit Kanonen auf Spatzen geschossen, da es vielleicht eine viel einfachere Möglichkeit gibt? Für eine Hilfe wäre ich sehr dankbar.

Viele Grüße!
Basti
 
Hi und Willkommen bei tutorials.de,

theoretisch könnte man das so machen, aber ist einiger Aufwand,
den man sich mit einer fertigen Library sparen könnte.
Siehe JSoup und Beispiele dazu.
Vor allem, wenn man mit Javascript/JQuery schon was gemacht hat
bekommt man damit sehr schnell Ergebnisse.

PS: Auch Zeitsparend ist es, Codetags statt so vieler Indent zu verwenden. :)
 

Neue Beiträge

Zurück