2011-05-27 3 views
-1

Bonjour Je développe un petit type de moteur de recherche. Il recherche le contenu dans les documents Word. J'ai besoin d'implémenter une option "view as html" comme dans gmail. Lorsque je clique sur le lien vers le document, il devrait s'ouvrir en tant que page HTML dans un nouveau navigateur. Y'a-t-il une quelconque façon de réussir cela?Afficher MS Word en HTML dans un navigateur

J'ai pu ouvrir le document doc dans un iframe, mais cela ne correspond pas à mon objectif.

Mon application utilise Asp.Net et C#. Toute aide serait appréciée.

Cordialement

Vignesh

+1

regardé Google Docs? –

+0

Voir ceci, il peut ou peut ne pas vous aider: http://stackoverflow.com/questions/3694090/saving-multiple-word-documents-as-html-through-office-api – contactmatt

+0

@Tony: Il peut être possible que mon réseau de déploiement peut ne pas avoir accès à Internet. Je ne suis pas sûr si je peux être en mesure d'utiliser google docs sans internet. – vikky114

Répondre

0

La manière facile, lent, gourmand en mémoire, unscalable, unscalable (doit être dit deux fois) de le faire serait d'utiliser l'API bureau COM pour charger le fichier et Sauvegardez-le au format html (ou texte en fait puisque tout ce que vous voulez faire est une recherche), mais je doute vraiment que vous puissiez le retirer même dans un site web modérément utilisé. En y mettant de côté, il vous reste des analyseurs open source ou en utilisant l'interface IFilter pour le faire. J'ai trouvé un exemple de ce dernier: http://www.neowin.net/forum/topic/316480-reading-text-from-ms-word-files-in-c

+0

Je n'ai aucun problème à chercher le texte dans le document. J'utilise Solr et son extracteur pour extraire le texte du document Word. Maintenant, j'ai besoin d'un moyen d'afficher le document Word pour le chercheur quand il clique sur le lien. Je pensais que l'afficher en html serait génial ... – vikky114

+0

Oh ... eh bien ... dans ce cas je n'ai aucune suggestion. Ce n'est pas trivial du tout. – Blindy