2016-03-24 1 views
0

Ma question est que je utilise un fichier audio et le convertir en un texteNe pas obtenir la sortie désirée à l'aide pocketsphinx

mon fichier audio contient « HI BONJOUR » mais je reçois la sortie comme POUR LES VENDEURS COURTS EN INDE QUI Je ne sais pas comment?

Le code que j'ai utilisé est ci-dessous.

import sys,os 


    def decodeSpeech(hmmd,lmdir,dictp,wavfile): 
    """ 
    Decodes a speech file 
    """ 

    try: 
     import pocketsphinx as ps 
     import sphinxbase 

    except: 
     print """Pocket sphinx and sphixbase is not installed 
     in your system. Please install it with package manager. 
     """ 

    speechRec = ps.Decoder(hmm = hmmd, lm = lmdir, dict = dictp) 
    wavFile = file(wavfile,'rb') 
    wavFile.seek(44) 
    speechRec.decode_raw(wavFile) 
    result = speechRec.get_hyp() 

    return result[0] 

if __name__ == "__main__": 
    hmdir = "/usr/share/pocketsphinx/model/hmm/wsj1" 
    lmd = "/usr/share/pocketsphinx/model/lm/wsj/wlist5o.3e-7.vp.tg.lm.DMP" 
    dictd = "/usr/share/pocketsphinx/model/lm/wsj/wlist5o.dic" 
    wavfile = sys.argv[1] 
    recognised = decodeSpeech(hmdir,lmd,dictd,wavfile) 

    print "%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%" 
    print recognised 
    print "%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%" 
+1

Quelle est votre question? Vous devez être très clair pour que les gens puissent vous aider. Voir http://stackoverflow.com/help/how-to-ask – feargal

+0

J'ai essayé de réparer votre message. Lors de la publication, veuillez utiliser la fonction de prévisualisation pour voir si votre mise en forme a fonctionné. – Dakkaron

Répondre

0

Votre fichier d'entrée est au format incorrect. Assurez-vous qu'il s'agit d'un fichier PCM mono 16 bits 16 bits.

De plus, vous utilisez de vieux pocketsphinx. Assurez-vous d'utiliser http://github.com/cmusphinx/pocketsphinx-python

+0

Merci pour l'aide :) –