2012-06-07 3 views
2

Je souhaite déterminer quelle partie d'un fichier audio contient des paroles ou de la musique.Classification vocale/musicale

J'espère que quelqu'un a fait quelque chose comme ça ou peut me dire par où commencer. Pouvez-vous s'il vous plaît suggérer une méthode/un tutoriel pour faire de même.

Merci.

+0

comment avez-vous obtenu finalement? 6 ans plus tard, j'essaie de résoudre le même problème. Je veux savoir quel segment a la parole et quel segment a de la musique dans un enregistrement audio. :( –

Répondre

2

Il y a beaucoup d'antériorités dans ce domaine, mais je suggèrerais de parcourir quelques-uns des articles Dan Ellis's. Les diapositives pour this talk a un bon fond. En bref, il ne reste plus qu'à choisir les bons vecteurs de caractéristiques.

5

Découvrez the pyAudioAnalysis bibliothèque python. Entre autres, il dispose d'un classificateur de musique vocale pré-formé et de deux méthodes de classification de segmentation (une basée sur des fenêtres de taille fixe et une autre basée sur des HMM).

Vous pouvez extraire des parties de la parole et de la musique d'un enregistrement audio assez facilement, par exemple .:

from pyAudioAnalysis import audioSegmentation as aS [flagsInd, classesAll, acc] = aS.mtFileClassification("data/scottish.wav", "data/svmSM", "svm", True, 'data/scottish.segments')

avec un résultat que celui de this image

+1

Monsieur, pourriez-vous s'il vous plaît jeter un oeil à ceci: https://dsp.stackexchange.com/questions/45223/how-to-detect-and-remove-dial-tone-and-ivrs-voice-etc- du-début d'un an –