das kannst du IMHO sogut wie mit jeder Programmiersprache machen, also auch mit Java
Stimmen Samples einlesen, charakteristische Features extrapolieren und vergleichen.
Wie das geht findest du unter: http://www.google.de/search?hl=de&q=voice+analysis&start=10&sa=N