Comment extraire le texte d'un fichier .tex
en utilisant Apache Tika? Un exemple de fichier est à http://www.tug.org/texshowcase/EulerGibbsDuhem.texExtrait du texte des fichiers .tex en utilisant Tika
Tika est capable de détecter correctement le type de contenu comme application/x-tex
mais n'en extrait rien.
J'ai essayé la commande
java -jar tika-app-0.9.jar -t EulerGibbsDuhem.tex
et aussi le code suivant:
File file = new File(fileName);
Tika tika = new Tika();
String mimeType = tika.detect(file);
pageContent = tika.parseToString(file);
Merci, si je trouve une telle bibliothèque, alors je vais ouvrir un ticket. – nikhil500