Viele Informationen aus zwei Collections vergleichen

chriss_2oo4

Erfahrenes Mitglied
Hi,

ich habe einen Vector Wörter und einen Vector Sätze. Nun möchte ich herausfinden welche zwei Wörter (Wortpaare) min. 3x zusammen in einem Satz auftreten.

Alle einzelnen Wörter stehen im Vector Wörterund alle Sätze stehen im Vector Sätze, die Relation zwischen beiden Vectoren steht im Vector WortInSatz

Also z. B.:

Sätze:
-----------------------------------------------------------------
0 | Die Ampel ist grün...
1 | Wenn die Ampel grün ist...
2 | Die Ampel kennt folgende Zustände: grün, orange...
...
------------------------------------------------------------------

Wörter:
-----------------------------------------------------------------
0 | Die
1 | Ampel
2 | ist
...
------------------------------------------------------------------

WortInSatz (Wort-Id | Satz-Id):
------------------------------------------------------------------
0 | 0
1 | 0
2 | 0
...
------------------------------------------------------------------

Als ergebnis möchte ich jetzt die Wörter "Die" und "Ampel".

Nun weiß ich nicht ganz wie ich das realisieren soll, ich müsste ja jedes Wort miteinander vergleichen und mir das Vorkommen in einem Satz merken, und wo soll ich mir die ganzen Informationen merken -> evtl Hash-Map mit Id als Key und Anzahl als Value?

Hat vielleicht jemand eine bessere Idee wie man soetwas lösen könnte?


Lg Chriss
 
Zurück