Je suis à la recherche d'une plate-forme logicielle qui aidera les linguistes et les anthropologues dans leur étude de langues auparavant non étudiées. Les statistiques montrent qu'il existe environ 1000 langues qui n'ont jamais été étudiées par une personne en dehors de leurs groupes de locuteurs respectifs. Mon objectif est d'utiliser TensorFlow pour créer une plate-forme qui permettra aux linguistes d'étudier et de documenter ces langages plus efficacement et de les aider à créer des systèmes écrits pour ceux qui n'ont pas encore de système écrit. Une de leurs méthodes actuelles d'accomplissement d'une telle tâche est triple: 1) Enregistrer un locuteur natif conversant dans la langue, 2) Écouter cet enregistrement et essayer de le transcrire dans l'API, 3) De la phonétique, analyser les phonèmes et phonotactique de la langue pour éventuellement créer un système écrit pour le locuteur.Transcription IPA (alphabet phonétique international) avec Tensorflow
La plateforme que je propose réduirait le temps de recherche d'un minimum d'un an à un maximum de six mois. Avant de commencer, j'ai quelques questions ...
Qu'est-ce qui serait nécessaire pour former TensorFlow à transcrire l'audio en direct dans l'API? Est-ce que cela a déjà été fait? et si oui, comment pourrais-je utiliser une solution précédente pour ce projet? Un projet comme celui-ci est-il possible avec TensorFlow? Si non, que recommanderiez-vous d'utiliser à la place?
Mes excuses pour l'ampleur de cette question. Je n'ai pas beaucoup d'expérience dans le domaine de l'apprentissage automatique, car je ne fais que commencer le processus de recherche pour ce projet. Toute aide est appréciée!
Avez-vous parlé à un linguiste à ce sujet? La reconnaissance des phonèmes peut être beaucoup plus difficile que la reconnaissance des mots https://cmusphinx.github.io/wiki/phonemerecognition/ – Aaron
@Aaron techniquement, c'est * téléphones * ici, pas de phonèmes, mais je ne sais pas si ça rend mieux ... – lenz