2017-06-22 1 views
2

Je suis à la recherche d'une bibliothèque JavaScript qui peut lire les fichiers .doc - et .docx. L'accent est uniquement sur le contenu du texte. Je ne suis pas intéressé par les images, les formules ou d'autres structures spéciales dans le fichier MS-Word.Bibliothèque JavaScript pour lire doc et docx sur le client

Ce serait génial, si la bibliothèque fonctionne avec JavaScript FileReader comme indiqué dans le code ci-dessous. J'ai cherché sur Internet, mais je ne pouvais pas vraiment obtenir ce que je cherchais.

Merci pour votre aide.

+0

Je ne suis pas au courant de toutes les bibliothèques JS qui peuvent afficher le contenu doc ​​/ docx sur l'extrémité avant seulement. Mais si vous récupérez ces fichiers à partir d'un backend, vous pouvez extraire le contenu textuel des fichiers doc/docx dans le backend avant d'envoyer le contenu du texte au frontal en utilisant Apache Tika, par ex. 'Tika # parseToString()' méthode. –

+0

Merci pour votre réponse, mais mon backend est Microsoft Dynamics NAV. Donc, votre solution ne fonctionne malheureusement pas pour moi. Et comme plus d'informations, il doit être un AddIn JS pour NAV. – Torben

Répondre

1

Vous pouvez utiliser docxtemplater pour cela (même si normalement, il est utilisé pour templating, il peut aussi simplement obtenir le texte du document):

var zip = new JSZip(content); 
var doc=new Docxtemplater().loadZip(zip) 
var text= doc.getFullText(); 
console.log(text); 

Voir the Doc pour des informations d'installation (je suis mainteneur de ce projet)

Cependant, il ne gère que docx, non doc

+0

Merci, c'est ce que je cherchais. Vous avez fait du bon travail. – Torben

+0

Je reçois une erreur quand je l'utilise comme fichier zip 'zip.file ('yo.docx', element.data, {base64: true});' – lorussian

+0

Quel type d'erreur? Utilisez-vous la version 2 de jzip? Si vous utilisez JSZip version 3, il échouera. – edi9999