2009-05-06 8 views
14

J'ai quelques fichiers .tex à partir de laquelle je veux recevoir le texte brut sans balises de latex telles que \ section {...} ou \ newpage.
Quelqu'un a-t-il une idée sur la façon d'y parvenir? J'ai aussi le fichier .pdf mais quand je viens de copier le code à partir de là, certains mots sont concaténés ce qui est vraiment mauvais.
Y a-t-il un outil que vous connaissez?extraire le texte de tex, enlever les étiquettes de latex

Répondre

19

detex(1):

S'il vous plaît voir le OpenDetex GitHub page pour la dernière version de OpenDetex. C'est une version plus moderne et dérivée de mon DeTeX original.

Mon héritage DeTeX home page est disponible here.

Si vous voulez juste la source detex-2.8.tar héritée, vous pouvez l'obtenir here.

+0

Vous êtes les bienvenus! –

+4

Ne fonctionne que sur les fichiers tex ASCII. Si vous utilisez des fichiers tex codés en xelatex et UTF-8 avec des caractères non-ASCII, les sorties detex produisent des caractères indésirables pour les caractères non-ASCII. – Lucas

+1

Il est open source, il pourrait toujours être réparé. –

6

opendetex est disponible pour Windows et Linux

télécharger le opendetex programme d'ici
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list

Utilisation: http://code.google.com/p/opendetex/wiki/Usage

extrait à un répertoire de votre choix . Dites-nous l'extraire dans le répertoire Téléchargements. Créez un autre répertoire de n'importe quel nom dans ce répertoire (facultatif, mais c'est bon si vous le créez). disons que le nom du répertoire est "my_paper". Mettez votre papier dans le répertoire "my_paper". dire votre nom de papier est project.tex

Naviguez à travers le chemin

cd ~/Downloads/opendetex 

Exécutez la commande

detex -n my_paper/project.tex > out.txt 

forme générique

detex -n full_path_to_tex_file.tex > output_text_file.txt 
Questions connexes