2017-09-20 1 views
0

Chaque fois qu'un mot MS (ou LibreOffice ou tout autre traitement de texte) document est ouvert dans son programme respectif, les mots apparaissent normalement sur la page, mais lorsque le document est ouvert dans un éditeur de texte, la plupart est Unicode charabia.Pourquoi les documents du programme de traitement de texte ne sont-ils pas stockés en clair?

Je peux comprendre pourquoi le document peut avoir des parties qui ne sont pas lisibles, comme des puces ou des métadonnées, mais pourquoi certaines parties du contenu ne sont-elles pas stockées en clair? Est-ce que chaque lettre est codée?

Répondre

1

Le dernier format docx de Microsoft Word est un xml avec le texte brut compressé avec zip. Vous pouvez décompresser le fichier en renommant docx en zip et ensuite ouvrir le fichier avec un bloc-notes. Donc, il est stocké partiellement en texte brut juste compressé.

0

je trouve qu'il est probablement une chose de l'image de marque. Si vous voulez, vous pouvez l'importer dans un fichier texte.

Si vous allez dans Fichier> Exporter> Modifier le type de fichier> Texte brut (* .txt), vous pouvez exporter le document là-bas.