Je suis nouveau dans le monde de l'audio, et une tâche à laquelle je ne suis pas sûr me parvient. J'ai besoin d'afficher un graphique représentant la hauteur d'un fichier WAV. Le fichier WAV peut être polyphonique, puis j'ai besoin d'afficher le graphe de hauteur de l'instrument dominant (lire: avec le volume le plus fort) (ou le chant de la voix humaine). Je suis assez familier avec .NET, et je ne connais presque rien en C, C++, Java. J'ai commencé une recherche sur le Web, et d'après ce que j'ai compris, la détection de hauteur de fichiers polyphoniques WAV est un problème non résolu, mais je n'ai pas besoin de la hauteur exacte, juste pour savoir si elle est supérieure à la suivante et quelle est sa longueur.Affichage de la hauteur de fichier WAV
Mes questions sont les suivantes:
Où dois-je commencer à apprendre la théorie derrière cette tâche? Y a-t-il des livres recommandés pour cela?
Y at-il une API/outil qui peut faire cela?
Merci,
ML
Je suis préoccupé par la nature polyphonique du fichier WAV. Est-ce que FFT peut m'aider à isoler l'intrument/voix le plus dominant? –
Eh bien FFT vous donnera la fréquence dominante dans un fragment d'onde - donc si vous avez trois instruments tous produisant C moyen (que ce soit leur fréquence fondamentale ou harmoniques) FFT ne vous dira pas quel instrument est le plus fort, mais il vous dira ce milieu C est la fréquence la plus forte de l'échantillon. –
Je suppose que vous avez vu un analyseur de spectre - FFT vous le donnera. –