Je veux analyser le fichier pdf de telle sorte que je puisse identifier le titre de chaque article et sa description. Ainsi je peux stocker le texte et le descriptiontext de titre dans le cache pour la recherche. Y at-il n'importe quelle bibliothèque ou outil?dot net: je dois analyser le fichier pdf pour obtenir chaque article avec son titre?
0
A
Répondre
1
D'abord vous pouvez installer Adobe Pdf IFilter dll. Ensuite, vous pouvez lire les propriétés de n'importe quel fichier .pdf en utilisant this library (en utilisant IFilter en C#). Ou vous pouvez également regarder dans this library (Implémentation d'un TextReader pour extraire divers contenus de fichiers en utilisant IFilter).
Questions connexes
- 1. Obtenir le titre pour correspondre lien Titre
- 2. Application Dot Dot Net
- 3. versioning en dot net
- 4. Comment puis-je analyser ce fichier avec .net?
- 5. Comment puis-je analyser le fichier d'assemblage pour obtenir ses corflags?
- 6. Joomla, afficher différents modèles pour chaque article
- 7. Analyser un langage simple pour le formatage de titre
- 8. Définir le titre PDF avec Java et FOP
- 9. comment obtenir la valeur d'un article http dans son ensemble? parsing reposful post
- 10. dois-je fermer() un son ou arrêter() le canal? (AS3)
- 11. Xcode 3.1 localisation: Si je change d'interface, dois-je changer cela pour chaque localisation?
- 12. Pour chaque obtenir RowIndex
- 13. Dois-je inclure le fichier jquery version pour utiliser jquery.ui.js?
- 14. Je besoin d'aide: .NET Exemple de code pour lire les propriétés du fichier de fichier comme titre et le résumé
- 15. Puis-je ajouter mes propres tags dans un article rss?
- 16. JSeparator avec le titre
- 17. Dois-je partager le contexte Entity-Framework ou créer un nouveau contexte pour chaque opération?
- 18. Outil pour analyser un fichier
- 19. Comment obtenir le titre de la page HTML avec JavaScript?
- 20. Comment puis-je retarder le son dans chaque enceinte avec FMOD?
- 21. Comment puis-je analyser correctement mon fichier? (Avec pause/continuer)
- 22. Mise en page Gridview dot net
- 23. Comment puis-je extraire le titre d'un PDF crypté en PHP?
- 24. Analyser le fichier XML local dans Android
- 25. DOT NET code pour convertir du HTML en texte
- 26. Bibliothèques de rendu de polices pour C#/dot-NET?
- 27. Comment analyser un fichier XML
- 28. Comment dois-je utiliser Gosu avec IronRuby?
- 29. Comment utiliser PDFBox avec Asp.Net pour analyser des fichiers pdf avec C#?
- 30. Dois-je toujours utiliser TryGetValue pour accéder aux dictionnaires .net?