Il existe une contrainte dans le système de gestion de contenu qui nécessite de stocker tous les documents Word avec une extension spécifique (différente de DOC ou DOCX). Cependant, lors de la sortie du document à l'utilisateur, nous devons savoir s'il s'agit d'un fichier DOC ou DOCX afin de fournir le bon type MIME. Donc, existe-t-il un moyen de savoir par programme si DOC est DOC ou DOCX par son contenu?Déterminer si le document est DOC ou DOCX dans l'application Java sans connaître son extension
Répondre
Here est un lien vers le ForensicsWiki qui détaille beaucoup de types de fichiers différents. Il décrit les en-têtes des fichiers DOC et DOCX, vous devriez donc pouvoir analyser les fichiers et déterminer leur nature.
Axé sur le lien, les fichiers .doc sont composés OLE fichiers, le fichier doit avoir l'en-tête binaire suivant:
d0 cf 11 e0 a1 b1 1a e1
En constraste, les fichiers .docx auront la signature binaire:
50 4b
Les fichiers DOCX sont au format ZIP, dans lequel les deux premiers octets sont les lettres PK (après le créateur de ZIP, Phil Katz).
Merci les gars, semble être très clair et facile – Andriy
- 1. Meilleur moyen de déterminer si le fichier * .doc est RTF avec Java ou ColdFusion
- 2. Comment générer un document Word (doc, docx) dans ASP.NET?
- 3. Comment modifier le fichier .doc ou .docx en php
- 4. Lire un fichier .doc ou .docx dans asp.net C#
- 5. Nombre de pages dans un document doc en java
- 6. Comment convertir des fichiers .doc ou .docx en .txt
- 7. Convertir doc/docx en sémantique HTML
- 8. Création d'un nouveau fichier DOCX en lisant le modèle DOCX (son contenu est déjà remplacé)
- 9. Déterminer si l'élément est le dernier enfant de son parent
- 10. Supprimer l'élément dom sans connaître son parent?
- 11. Convert Doc, Docx en TIFF avec delphi
- 12. Décharger le document Word (* .doc) en texte?
- 13. Ouverture doc, docx, Excell fichiers en ligne de IE 7.0
- 14. Vérifiez si la classe existe dans le classpath Java sans exécuter son initialiseur statique?
- 15. Déterminer si l'application est WinForms ou WebForms
- 16. son java sans périphérique
- 17. déterminer si dropdownlist est sélectionné ou non
- 18. Déterminer si ELMAH est activé ou non?
- 19. Comment déterminer si une URL est une image ou non?
- 20. C# .NET - comment déterminer si le répertoire est accessible en écriture, avec ou sans UAC?
- 21. Lecture des données à partir de .doc ou .docx et insertion dans db
- 22. Obtenir un seul nœud sans connaître son espace de noms
- 23. Extension Firefox, accès au document
- 24. Protéger une propriété d'objet sans connaître son nom à l'avance
- 25. Définition de valeurs de tableau sans connaître son type
- 26. Comment déterminer si la date/heure est EDT ou EST en Java?
- 27. Quelle est la meilleure façon de C# de déterminer si le programmeur exécute le programme via IDE ou son utilisateur?
- 28. faire pivoter le document dans emacs doc-view-mode
- 29. Problème d'ouverture des fichiers doc/docx/excel dans le navigateur (Asp.net, C#)
- 30. Convertir un fichier doc Word en docx sur un serveur sans Word
Si un fichier docx est protégé par mot de passe, il aura également 'd0 cf 11 e0 a1 b1 1a e1' dans l'en-tête. – SolidSun