Problem beim Parsen von XML mit SAX

S

Static_Vengeance

Hallo zusammen,

Im Rahmen eines Software-Praktikums sollen XML Dateien ausgewertet, als Histogramm visualisiert und anschliessend als .jpeg oder .png gespeichert werden.

Auswerten bedeutet: Es soll geprueft werden, welches Tag mit welcher Haufigkeit auf einer bestimmten Verschachtelungstiefe auftritt.

Die zugehoerige XML-Datei kann man sich unter http://dblp.uni-trier.de/xml/dblp.xml runterladen.

Nun mein Problem:
Ich habe mit Sax die Datei geparst und die notwendigen Tagnamen in eine eigens defienierte Datenstruktur eingefuegt.
Wenn ich "kleinere" Dateien parse ist alles in Ordnung, aber sobald ich die oben genannte Datei dblp.xml (Groesse > 120 MB) parse, bekomme ich folgende SAXParseException:

"Der von der Anwendung festgesetzte Grenzwert "64.000" fuer die Erweiterung der Entitaet wurde erreicht " (... oder so aehnlich)

Wo liegt hier das Problem ?

Wer kann mir ausserdem Tipps zum "anstaendigen" Visualisieren (Histogramme) von XML Dateien geben ?

Vielen dank schon mal im Voraus.
 
hi.


ich glaube, das liegt daran, dass die java-umgebung standartmässig nur 64mb arbeitspeicher für ihre arbeit hat.

du kannst beim aufruf von java diesen:
-Xmx256m

paramenter mitgeben. damit kannst du den arbeitsspeicher für java erhöhen. in diesem beispiel also auf 256 megabyte.
 
Zurück