J'ai quelques fichiers .tex à partir de laquelle je veux recevoir le texte brut sans balises de latex telles que \ section {...} ou \ newpage.
Quelqu'un a-t-il une idée sur la façon d'y parvenir? J'ai aussi le fichier .pdf mais quand je viens de copier le code à partir de là, certains mots sont concaténés ce qui est vraiment mauvais.
Y a-t-il un outil que vous connaissez?extraire le texte de tex, enlever les étiquettes de latex
Répondre
S'il vous plaît voir le OpenDetex GitHub page pour la dernière version de OpenDetex. C'est une version plus moderne et dérivée de mon DeTeX original.
Mon héritage DeTeX home page est disponible here.
Si vous voulez juste la source detex-2.8.tar héritée, vous pouvez l'obtenir here.
opendetex est disponible pour Windows et Linux
télécharger le opendetex programme d'ici
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list
Utilisation: http://code.google.com/p/opendetex/wiki/Usage
extrait à un répertoire de votre choix . Dites-nous l'extraire dans le répertoire Téléchargements. Créez un autre répertoire de n'importe quel nom dans ce répertoire (facultatif, mais c'est bon si vous le créez). disons que le nom du répertoire est "my_paper". Mettez votre papier dans le répertoire "my_paper". dire votre nom de papier est project.tex
Naviguez à travers le chemin
cd ~/Downloads/opendetex
Exécutez la commande
detex -n my_paper/project.tex > out.txt
forme générique
detex -n full_path_to_tex_file.tex > output_text_file.txt
- 1. Minipage au latex pour aligner les groupes de texte
- 2. Comment modifier les dimensions de papier en TeX nu?
- 3. saisissant le texte entre toutes les étiquettes dans Nokogiri?
- 4. Toute alternative XML de TEX?
- 5. Extraire le texte du fichier CSV
- 6. Comment extraire le texte d'un fichier PSD?
- 7. Sortie Latex
- 8. Comment afficher le code LaTeX dans un document LaTeX?
- 9. Regex pour enlever apostrophes
- 10. Masquage de certains attributs, tels que des zones de texte, des étiquettes dans le formulaire parent
- 11. Erreur lors de l'utilisation de l'environnement LaTeX de fancyvrb
- 12. comment remplacer les macros latex avec leurs définitions (en utilisant du latex)
- 13. Utilisation de sphinx/miktex pour générer des fichiers pdf affichant le texte japonais UTF8 (CJK) dans Windows
- 14. Comment "truquer" du texte incliné dans LaTeX?
- 15. Conventions de dénomination pour les étiquettes GoTo
- 16. XHTML strict Désactiver les étiquettes de formulaire
- 17. Références avec du texte dans LaTeX
- 18. Modèle de visiteur, enlever le besoin de lancer
- 19. Affectation dynamique de différentes étiquettes
- 20. Les titres irréguliers dans le texte justifié
- 21. Comment extraire des étiquettes d'identification à partir de fichiers MP3 dans Cocoa?
- 22. comment enlever les 3 premiers caractères de nsstring?
- 23. tableaux Javascript - tableau enlever les éléments
- 24. Comment souligner les en-têtes de section dans LaTeX?
- 25. Après avoir supprimé les étiquettes indésirables, que dois-je faire d'autre pour l'entrée de texte?
- 26. comment enlever les charaters de la chaîne dans ASP.net 2.0
- 27. Comment enlever le reste d'une chaîne
- 28. Séquence de latex \ /?
- 29. Impression de variables LaTeX
- 30. Enlever la barre en haut de Loginview pour le formatage
Vous êtes les bienvenus! –
Ne fonctionne que sur les fichiers tex ASCII. Si vous utilisez des fichiers tex codés en xelatex et UTF-8 avec des caractères non-ASCII, les sorties detex produisent des caractères indésirables pour les caractères non-ASCII. – Lucas
Il est open source, il pourrait toujours être réparé. –