Hallo,
habe folgendes Problem:
ich habe eine CSV-Datei mit ca 200 Spalten. Die Spaltennamen sind meistens identisch, aber es können auch weitere Spalten hinzugefügt werden.
ca 25% der Spalten haben Daten, der Rest ist eigentlich leer oder NULL.
jeder Datensatz in der CSV-Datei muss mit einem Status, Bearbeitungsdatum etc versehen werden können.
Im Monat werden so ca 20-50Tausend Datensätze verarbeitet.
Jetzt könnte ich natürlich einfach eine Datenbanktabelle für den Status etc. und eine für die Datensätze erstellen, die einfach 200 Spalten hat und immer, wenn eine neue Spalte in der CSV-Datei auftaucht, die Tabelle um diese erweitern. Das widerspricht doch aber jeglichem vernünftigen Datenbankdesign oder?
ich könnte auch eine Datenbanktabelle erstellen die alle Spaltennamen als Datensatz gespeichert hat und dann in einer anderen Tabelle auf diese verweisen.
allerdings müsste ich dann für jeden Datensatz ca 200 (bzw. nur die gefüllten Daten) einzeln per insert in die Datenbank importieren. bei 20-50Tausend Datensätzen wären das seeeeeeeeeeeeeeehr viele Werte in der Datenbanktabelle.
wie kann ich das jetzt am besten realisieren?
vielen Dank schonmal!
habe folgendes Problem:
ich habe eine CSV-Datei mit ca 200 Spalten. Die Spaltennamen sind meistens identisch, aber es können auch weitere Spalten hinzugefügt werden.
ca 25% der Spalten haben Daten, der Rest ist eigentlich leer oder NULL.
jeder Datensatz in der CSV-Datei muss mit einem Status, Bearbeitungsdatum etc versehen werden können.
Im Monat werden so ca 20-50Tausend Datensätze verarbeitet.
Jetzt könnte ich natürlich einfach eine Datenbanktabelle für den Status etc. und eine für die Datensätze erstellen, die einfach 200 Spalten hat und immer, wenn eine neue Spalte in der CSV-Datei auftaucht, die Tabelle um diese erweitern. Das widerspricht doch aber jeglichem vernünftigen Datenbankdesign oder?
ich könnte auch eine Datenbanktabelle erstellen die alle Spaltennamen als Datensatz gespeichert hat und dann in einer anderen Tabelle auf diese verweisen.
allerdings müsste ich dann für jeden Datensatz ca 200 (bzw. nur die gefüllten Daten) einzeln per insert in die Datenbank importieren. bei 20-50Tausend Datensätzen wären das seeeeeeeeeeeeeeehr viele Werte in der Datenbanktabelle.
wie kann ich das jetzt am besten realisieren?
vielen Dank schonmal!
Zuletzt bearbeitet: