2016-10-27 4 views
1

J'essaie d'utiliser avconv pour créer un fichier raw LINEAR16 pour le discours de Google, mais chaque fois que j'essaie, j'obtiens un fichier très lent lorsque j'essaie pour le lire en utilisant la commande de lecture dans la documentation:Utilisation de avconv Comment créer un fichier linear16 pour Google Speech to Text

play --rate=16000 --bits=16 --endian=little --encoding=signed-integer --channels=1 out.raw 

Quelle est la bonne façon de faire ce genre de conversion?

Répondre

1

Il a fallu quelques essais, mais j'ai pu le faire fonctionner en indiquant explicitement le taux d'échantillonnage, le nombre de canaux, et le format de sortie:

avconv -i michael_queen_v._ed_schultz_cl.mp3 -f s16le -ac 1 -ar 16k out.raw 

-f: Cela force l'encodage de sortie, depuis .raw ISN apparemment pas assez pour savoir quoi faire.

-ac 1: Mono

-ar 16k: Cela ressemble à a gun, ce qui est déprimant, mais cela fixe le taux d'échantillonnage à 16000MHz.