C'est probablement une question très stupide, mais je n'ai trouvé aucun détail. J'ai donc un enregistrement audio (fichier wav) de 3 secondes. C'est mon échantillon et il doit être classé comme [class_A] ou [class_B]. En suivant quelques tutroial sur MFCC, j'ai divisé l'échantillon en images (291 images pour être exact) et j'ai obtenu des MFCC de chaque trame.Comment utiliser les vecteurs MFCC pour classer un seul fichier audio?
Maintenant, j'ai 291 vecteurs de caractéristiques, la longueur de chaque vecteur est 13.
Ma question est; comment exactement utilisez-vous ces vecteurs avec classifier (k-NN par exemple)? J'ai 291 vecteurs qui représentent 1 échantillon. Je sais comment travailler avec 1 vecteur pour 1 échantillon, mais je ne sais pas quoi faire si j'en ai 291. Je ne pouvais pas vraiment trouver d'explication nulle part. Chacun de vos vecteurs représentera les caractéristiques spectrales de votre fichier audio, étant donné qu'il varie dans le temps.
pourriez-vous fournir un lien vers la façon dont vous l'avez résolu? –
pourriez-vous s'il vous plaît poster votre solution –