Je veux écrire un programme dans lequel joue un fichier audio qui lit un texte. Je veux mettre en relief la syllabe actuelle que l'audiofile joue en vert et le reste du mot courant en rouge. Quel type de structure de données dois-je utiliser pour stocker le fichier audio et les informations qui indiquent au programme quand passer au mot/syllabe suivant?Quelle structure de données pour lier le texte avec l'audio en Java
Répondre
Ceci est une suggestion légèrement à gauche, mais avez-vous regardé le logiciel Karaoke? Cela peut ne pas être considéré comme assez "sérieux", mais cela ressemble beaucoup à ce que vous faites. Par exemple, Aegisub est un programme de sous-titrage qui vous permet de créer des sous-titres au format SSA/ASS. Il a des outils de karaoké pour hilighting le mot choisi ou une partie.
Il est le plus couramment utilisé pour le sous-titrage anime, mais il fonctionne aussi pour l'audio à condition que vous avez un lecteur approprié. Ce sont malheureusement assez rares sur le Mac.
Le format ressemble à celui proposé par Yuval A:
{\K132}Unmei {\K34}no {\K54}tobira
{\K60}{\K132}yukkuri {\K36}to {\K142}hirakareta
Les longueurs sont durées plutôt que des décalages absolus. Cela facilite le décalage du début de la ligne sans recalculer tous les décalages. La double entrée indique une pause.
Y a-t-il une bonne raison pour que cela fasse partie de votre programme Java, ou est-ce une solution disponible immédiatement?
vous pouvez vous familiariser avec FreeTTS - cet outil open source: http://freetts.sourceforge.net/docs/index.php -
Vous pouvez nourrir seulement quelques mots au moteur TTS à un moment donné - les mettre en évidence et une fois ceux-ci sont éteints, les désactivez et passez au lot de mots suivant.
BR,
~ A
Que diriez-vous d'une simple structure de données qui décrit ce prochain lot de lettres se compose de la syllabe suivante et l'horodatage pour le passage à cette syllabe?
Juste un exemple rapide:
[0:00] Ce [00:02] est [00:05] un [00:07] ex [00:08] am- [0:10] ple
Pour mettre en surbrillance une partie du mot, sonne comme phonetics qui sont des sons qui composent des mots. Il sera vraiment difficile de transformer un fichier sonore en quelque chose qui «lira» un texte. Votre meilleur pari est d'utiliser le texte lui-même pour conduire un moteur basé sur la phonétique, comme FreeTTS qui est basé sur le Java Speech API.
Pour ce faire, vous devrez prendre le texte à lire, le diviser en chaque syllabe phonétique et le jouer. donc "syllabe" est "syl" "la" "ble". Jouer serait; mettez en surbrillance syl, dites-le et passez au suivant.
Ceci est vraiment "old-skool" il a été fait sur le Apple II d'origine de la même manière.
- 1. Java: structure de données pour le résultat de calcul de mise en cache?
- 2. asp.net 2.0: meilleure structure de données à lier à gridview
- 3. Quelle structure/solution de données Java répondrait le mieux à ces exigences?
- 4. Quelle est la meilleure structure de données pour les données arborescentes de profondeur fixe en C#?
- 5. Gérer une grande structure de données en Java
- 6. Class Dictionary dans java (structure de données)
- 7. Comment analyser une structure de données sérialisée PHP en Java?
- 8. 2d Structure de données en C#
- 9. Structure de données la plus efficace pour représenter les commentaires threadés en Java?
- 10. Structure de données utilisée pour la structure de répertoire?
- 11. Java Applet - MVC - Comment lier le modèle à afficher?
- 12. Comment lier un texte en Perl?
- 13. Meilleure structure de données pour la recherche?
- 14. Structure de classe protégée en Java?
- 15. Quelle structure de données dois-je utiliser pour suivre les éléments récemment utilisés?
- 16. Quelle structure de données ajouter/rechercher/conserver compte des chaînes?
- 17. Quelle est la meilleure infrastructure de données à utiliser en Java pour une liste "multidimensionnelle"?
- 18. Quelle structure de données .NET devrais-je utiliser?
- 19. Decomposing HTML pour lier le texte et la cible
- 20. Structure de données pour les relations
- 21. Quelle est la structure de données la plus efficace pour contenir des mots-clés?
- 22. Analyse de fichier texte en Java
- 23. Classification de texte en Java
- 24. Quelle est la meilleure structure de données pour mapper les chaînes aux valeurs?
- 25. Sémantique de la structure html pour les pages de données
- 26. Quelle structure de données et analyseur python dois-je utiliser avec system_profiler d'Apple?
- 27. structure de données laide à la recherche java
- 28. Java Program Structure Advice
- 29. Structure de données d'arbre
- 30. Quelle est la meilleure structure de données à utiliser pour une relation progéniture?
Je ne veux pas de voix synthétique, mais je veux utiliser un fichier audio préexistant du texte en question. – Christian