Moin die Herrschaften,
hat sich Jemand von Euch schon mit der XBMC-Plugin-Schnittstelle beschäftigt ?
Wie dem auch sei, das Problem basiert auf Python und primär auf der Erkennung eines bestimmten Abschnitts. Ich habe einfach zu selten mit Regex zu tun.
Gegeben : Eine HTML-Seite, auf welcher mehrere dieser Teile vorkommen..
Gesucht : Ein Regex, der alle diese HTML-Teile rausmatcht. Essentiell ist es, sich an dem Begriff kostenlos im div buy zu orientieren. Gebraucht werden title, time, number und natürlich die href ( egal welche, die id's sind anders, führen aber zum gleichen Playercontent).
line even darf als Erkenner nicht benutzt werden, da die Zeilen sich mit even und odd abwechseln und kostenpflichtiger Content genauso definiert ist.
Mein Ansatz zu matchen wäre nach folgender schriftlicher Anweisung :
Wenn kostenlos, dann den Text davor bis title.
Danach kann ich mir ja noch ne Regex schreiben, die die mir gewünschten Einzelteile rausmatcht.
Danke für jede Hilfe..
mfg chmee
Ach ja, wie benutze ich die Python-Regex, damit Zeilenumbruch auch gestattet ist ? DOTALL ? Oder davor alle \n rauslöschen ?
hat sich Jemand von Euch schon mit der XBMC-Plugin-Schnittstelle beschäftigt ?
Wie dem auch sei, das Problem basiert auf Python und primär auf der Erkennung eines bestimmten Abschnitts. Ich habe einfach zu selten mit Regex zu tun.
Gegeben : Eine HTML-Seite, auf welcher mehrere dieser Teile vorkommen..
HTML:
..
<div class="line even">
<div class="title">
<a href="awz.php?film_id=12687&player=1">Lars und Stella wolllen ihr Versteckspiel beenden</a>
</div>
<div class="season">0.</div>
<div class="number">686.</div>
<div class="time">29.05.2009 19:05</div>
<div class="buy">
<a href="awz.php?container_id=24307&player=1">kostenlos</a>
</div>
<div class="vote"></div>
<div class="favorite"></div>
</div>
..
Gesucht : Ein Regex, der alle diese HTML-Teile rausmatcht. Essentiell ist es, sich an dem Begriff kostenlos im div buy zu orientieren. Gebraucht werden title, time, number und natürlich die href ( egal welche, die id's sind anders, führen aber zum gleichen Playercontent).
line even darf als Erkenner nicht benutzt werden, da die Zeilen sich mit even und odd abwechseln und kostenpflichtiger Content genauso definiert ist.
Mein Ansatz zu matchen wäre nach folgender schriftlicher Anweisung :
Wenn kostenlos, dann den Text davor bis title.
Danach kann ich mir ja noch ne Regex schreiben, die die mir gewünschten Einzelteile rausmatcht.
Danke für jede Hilfe..
mfg chmee
Ach ja, wie benutze ich die Python-Regex, damit Zeilenumbruch auch gestattet ist ? DOTALL ? Oder davor alle \n rauslöschen ?