Frequenzen

OK
Ich habe jetzt eine Möglichkeit Lieder im .mp3 zu laden und den hexadezimalcode auzulesen gefunden. Und zwar mit der Funktion CFile. Das erkennen ob es sich jetzt wirklich um das gleiche Lied handelt dürfte jetzt allerdings ein bisschen schwerer werden.
 
das Thema kann ziemlich kompliziert sein.
Es ist wichtig unter anderem drauf zu achten dass die Lieder unterschiedliche Sampleraten haben können !

Am cleversten ist es wohl "exterme" Stellen zu finden und diese zu vergleichen, ob mit einer Korrelation oder mit anderen Methoden. Dabei können exterem Stellen , etwas wie starke Lautstärkeschwankungen , starke frequenzsprünge oder dergleichen sein.
Vielleicht würde auch die untersuchung einfacher sein wenn man eine geeignete Modulation verwendet.
 
Hallo zusammen!
Ich weiß, dass das Thema schon alt ist, aber es betrifft mich aktuell und ich wollte kein neues Thema aufmachen, wenns schon ein existierendes gibt...

Ich bin auf der suche danach, aus mp3 oder wav dateien die einzelnen Frequenzen, und ihre Länge herauszufinden.

Ist in dem Bereich inzwischen (is ja viel Zeit vergangen, seit letzter Nachricht in dem Thema) jemand weiter gekommen?

Wo fängt man da an?

MfG
LFP
 
Hi,
eigentlich poste ich so etwas ungern, aber in diesem Fall ist das vielleicht nicht schlecht. Auch ich bin an dem Thema interessiert und kenne mich damit nicht aus. Hier ist schon so ein Thread, bei dem es keine Antwort gab: http://www.tutorials.de/java/359383-mp3-frequenzen.html . Ich bin beim googlen auf eine bass.dll (?) gestoßen, bei der ich allerdings nicht weiß, ob das das richtige ist. Gibt es dafür irgendwelche Bibliotheken oder spezielle Sprachen? Ich hoffe es kennt sich damit jemand ein bisschen aus. :)
 
Hi

zuerst ein wenig Grundlagen zum Zustandekommen einer Audiodatei.
Nicht beleidigt sein, wenn ihr schon alles wisst, aber mir hilfts beim Antworten auch,
weil ich mich bei der Frage unten darauf beziehen kann.

---
a) Ein einzelner Ton besteht ja aus einer Sinusschwingung.
Lautstärke wird durch die Amplitude (Ausschlagshöhe) bestimmt,
Tonhöhe durch die Frequenz.

sin1.JPG
sin2.JPG
Zweites Bild ist also lauter und höher als Erstes.

b) Töne in der realen Welt sind so gut wie immer aus mehreren verschiedenen Sinusen zusammengemischt (math. einfach addiert). die dann zB. irgendsowas ergeben:
sin3.JPG

c) Wenn man die Ausschlagswerte in ein Array speichert (zB. 44100 Werte pro Sekunde, jeder davon ein float mit der dazugehörenden Genauigkeit) hat man rohe, unkomprimierte PCM-Daten.

d) Das noch komprimiert und zusammen mit den 44100/32-Zahlen etc. abgespeichert
ergibt sowas wie MP3 und alle anderen verbreiteten Formate (nur Midi ist ein Fall für sich)
---

So, Frage: Wie weit wollt ihr zerlegen?

Bis zu b) gehts zB. mit der schon genannten Bass-Library.
Die Daten bekommt man dann eben als Array von floats
(oder welche Auflösung es eben hatte) (Bass kann es auch umspeichern).
Andere Libs gibts sicher auch noch...
(ffmpeg ist etwas überdimensioniert für sowas, andere müsste ich auch erst suchen)

Wenn es wiklich bis zu a) zurückgehen soll, um sagen zu können:
"Der Sinus mit 600Hz ist von-bis und von-bis beteiligt":
Das wird dann mathematisch etwas komplexer
Stichwort: http://de.wikipedia.org/wiki/Fourier-Analysis
Hab (noch) nicht geschaut, was es da an Fertigmöglichkeiten gibt.

Gruß
 
Zurück