J'essaie de mettre en œuvre un module de reconnaissance vocale utilisant Mel Fréquence Cepstral Coefficient (MFCC) et Dynamic Time Warping (DTW).Comment appliquer les coefficients MFCC à DTW
Je divise le signal (x (n)) en trames de 25 ms avec un chevauchement de 10 ms et trouve les paramètres MFCC pour chaque trame. Mon principal doute est comment puis-je effectuer DTW dans ce scénario. Supposons qu'il existe M trames et N (13) coefficients MFCC.
J'ai donc une matrice M x N. Maintenant, comment dois-je calculer DTW?