Text-mining

Kangaxx

Mitglied
Hallo zusammen,

ich hab mich jetzt mal hingesetzt und dafür gesorgt das das Informatik-Projekt unserer Schule vorankommt. Begeisterung is da, Kompetenz (hoffe ich :p ) au und ne Idee ham wir auch. So, klingt ja schonmal sehr vielversprechend aber bevor wir uns ins Gefecht stürzen wollte ich mal bissle recherchieren.

Unsere Idee: Ein Programm das Textanalysen mit historischen/geschichtlichen Texten durchführt und wichtige Informationen herausfiltert und sie optisch darstellt.
Unter "optisch darstellen" versteh ich z.b Zeitstrahl mit den im Text angegebenen Daten, Stichwortzusammenfassungen und Stichwort-bezogenes Suchen nach Informationen. Evtl auch MindMaps.

Da wir dabei mit "unformatierten" Texten arbeiten müssen wir den Text erst zerlegen und filtern. Das hierfür verwendete Verfahren heißt "Text-mining". http://de.wikipedia.org/wiki/Text-Mining

Wir bauen uns gerade Wortlisten, Ontologien, etc auf, aber da noch keiner von uns mit dem Text-Mining-Verfahren gearbeitet hat wollte ich mich mal erkundigen ob jemand schon mit dem Thema vertraut ist und Tips hat.

Danke und Gruß,

Kangaxx
 
Habt Ihr schon eine konkrete Vorstellung, wie Ihr den Text zerlegen und filtern wollt?

So weit ich weiß versuchen Heerscharen von Wissenschaftlern schon seit Jahren mit guten Budges entsprechende brauchbare Suchmaschinen für das Web zu erschaffen.

Ich sehe einen Riesenberg an Arbeit und Problemen bei der Analyse, bin sehr sehr skeptisch und zweifle an der Durchführbarkeit... Aber ich lasse mich gern von Euch belehren :)
 

Neue Beiträge

Zurück