RegEx: (Um-)formulieren eines Pattern zur Identifizierung komplexer URLs

bierbauchhase

Grünschnabel
Guten Morgen,

hier im Forum/im Internet gab es schon einige Ansätze Pattern zu definieren, um aus einem String URLs rauszufiltern. Da die Lösungen für mich nicht zufriedenstellend waren und gerade auch weil ich hier und hier zwei Blogeinträge gefunden habe, von Menschen die behaupten gute Pattern generiert zu haben würde ich das Forum bitten mir zu helfen diese JAVA-Konform umzuformulieren, da sie entsprechend der C-Notation formuliert wurden und ich das leider auch nach dem Studieren diverser Internetseiten nicht umgesetzt bekomme.

Viele Grüße und vielen Dank schonmal vorab,
bbh

PS: Ich habe den selben Thread bereits im java-forum.org gestartet, leider konnte man mir dort bisher nicht helfen
 
Java:
String regex =  "(?i)\\b((?:https?://|www[0-9]{0,3}[.]|[a-z0-9.\\-]+[.][a-z]{2,4}/)(?:[^\\s()"+
    		      "<>]+|\\(([^\\s()<>]+|(\\([^\\s()<>]+\\)))*\\))+(?:\\(([^\\s()<>]+|(\\([^\\s()"+	
    	              "<>]+\\)))*\\)|[^\\s`!()\\[\\]{};:'\".,<>?«»“”‘’]))";

OK, hab wohl etwas voreilig gepostet, so siehts jetzt aus - dummerweise geht dabei der Linkbestandteil der nach einem Zeilenumbruch kommt verloren. Im Original scheints aber zu gehen.
Pattern.MULTILINE - hilft leider nicht. Aus ^\\s -> ^\\s\\r\\n zu machen leider auch nicht.

Viele Grüße,
bbh
 
Zuletzt bearbeitet:
Zurück