Je veux lire un document MS Word et identifier des mots de police en-tête/gras/des mots soulignés, etc. est-il un moyen de résoudre ce problème par programme? Je veux la suggestion en Java ou PHP ou Ruby si possible, sinon s'il y a des méta-données disponibles, faites le moi savoir.MS Word reconnaissant Heading/Font etc?
Répondre
Vous avez Java API qui peut le faire. Je vous suggère de regarder la bibliothèque Apache POI.
Apache Tika est un bon projet, j'ai découvert qu'il fait beaucoup de choses. – realnumber
Ceci est lié à cette What's a good Java API for creating Word documents?
Il y a un travail dans l'API de progression pour celui-ci en utilisant Apache POI.
HWPF est le nom de notre port du Microsoft Word 97 (-2007) format de fichier à Java pur. Il fournit également un support limité en lecture seule pour les formats de fichier Word 6 et Word 95, ainsi que les formats de fichier Word 95.
Le partenaire de HWPF pour le nouveau format Word 2007 .docx est XWPF. Alors que HWPF et XWPF fournissent des fonctionnalités similaires, il n'y a pas une interface commune à travers les deux d'entre eux à ce moment.
- 1. Java MS Word libarary
- 2. MS Word to Stylesheet
- 3. MS Word tableau hindi
- 4. Motif reconnaissant
- 5. Convertir modèle Word à partir de MS Word 2003 à MS Word 2007
- 6. Développement d'un complément MS Word
- 7. Rejoindre des documents MS Word
- 8. Inclure des fichiers HTML dans MS Word
- 9. Écriture de MS Word 2007 XML
- 10. Signer numériquement MS Office (Word, Excel, etc.) et les fichiers PDF sur le serveur
- 11. Créer un fichier MS Word par programme sans installer MS Word
- 12. Comment analyser le formatage MS Word?
- 13. MS Word 2007 - nombre de mots cibles
- 14. ID unique pour MS Word 2007 paragraphe
- 15. Impression de certaines pages dans MS Word
- 16. Désinfecter le texte collé de MS-Word
- 17. Bibliothèque de classes MS Word 12.0
- 18. SSRS 2008 exporter vers MS Word numéro
- 19. MS Word Macro - Supprimer les paragraphes
- 20. Ajouter un autotexte personnalisé pour MS Word
- 21. Documents MS Word aux documents RTF
- 22. de HTML à convertir MS Word
- 23. Signets MS-Word avec script VB
- 24. API C# pour l'éditeur d'équation MS Word
- 25. Configurer la police par défaut avec C# pour MS Word
- 26. Reconnaissant mon application dans iTunes
- 27. types MIME et exporter vers différentes applications (excel, word, pdf ... etc etc)
- 28. XML significatif à partir du plugin MS Word
- 29. Intégrer MS Word comme éditeur (comme dans Outlook)
- 30. Ruby: Remplacement des puces collées à partir de MS Word
http://stackoverflow.com/questions/188452/reading-writing-a-ms-word-file-in-php – NAVEED