Je suis passé par le projet APACHE POI et je l'ai trouvé utile pour extraire le contenu textuel des fichiers MS Word. Plus précisément, il existe une fonctionnalité appelée Text Extraction dans POI qui fait le travail efficacement. J'ai également entendu parler de Apache Tika qui utilise le POI Apache en interne.Extrait du texte du fichier MS Word (.doc) dans l'application Web Ruby on Rails à l'aide d'Apache POI
Maintenant, nous avons besoin de notre application Web Rails pour extraire le contenu du texte à partir d'un fichier (.doc)
. Quelles pourraient être les possibilités que nous pourrions intégrer Apache POI/Apache Tika
dans mon application web pour servir mon but?
Si quelqu'un a une expérience pertinente, j'aimerais en savoir plus à ce sujet avec les extraits de code.
Pourquoi vote près? La question est assez technique et spécifique. Je ne sais pas comment l'utiliser dans un projet Rails, alors quelle aurait été une meilleure façon de le demander? –
Avez-vous regardé la documentation POI pour Ruby Bindings? https://poi.apache.org/poi-ruby.html –
La question est très large et il serait difficile de donner une réponse définitive. Même si tout le monde «partagera ses expériences», il sera difficile de choisir une seule bonne réponse, car vous n'avez fourni aucun critère objectif pour le faire. La question montre peu d'effort de recherche - vous devriez probablement commencer par lire la documentation, chercher des liens pertinents (comme suggéré par @NickVeys) et si vous tomberez sur quelque chose de spécifique, alors vous êtes invités à le demander. – GreyCat