2017-07-12 4 views
2

J'utilise node.js et pdf2json parser pour analyser un fichier pdf. Actuellement, il fonctionne avec un fichier pdf local. Mais j'essaie d'obtenir un fichier pdf via le module URL/HTTP de node.js et je veux ouvrir ce fichier pour l'analyser.node.js Comment utiliser une URL comme pdf-path pour travailler avec pdf2json

Existe-t-il une possibilité d'analyser/travailler avec un pdf en ligne?

let query = url.parse(req.url, true).query; 
let pdfLink = query.pdf; 
... 
pdfParser.loadPDF(pdfLink + ""); 

Ainsi, l'URL doit être donnée par l'URL comme: https://localhost:8080/?pdf=http://whale-cms.de/pdf.pdf

Est-il possible de l'analyser dans le pdf en ligne/lien?

Merci d'avance.

+1

Pourquoi ne pas le télécharger et de travailler avec elle comme un fichier local? – LEQADA

+0

Parce que ces pdfs sur lesquels travaillaient sont mis à jour toutes les heures, il serait donc beaucoup plus facile de le faire sur une url –

+0

Oui, il suffit de le télécharger à chaque fois et de travailler comme un fichier local – LEQADA

Répondre

-1

Im juste face au même problème, et a trouvé une solution:

 var request = require('request'); 
     var PDFParser = require("pdf2json"); 
     var pdfUrl = "http://localhost:3000/cdn/storage/PDFFiles/sk87bAfiXxPre428b/original/sk87bAfiXxPre428b" 
     var pdfParser = new PDFParser(); 

     var pdfPipe = request({url: pdfUrl, encoding:null}).pipe(pdfParser); 

     pdfPipe.on("pdfParser_dataError", err => console.error(err)); 
     pdfPipe.on("pdfParser_dataReady", pdf => { 
      let usedFieldsInTheDocument = pdfParser.getAllFieldsTypes(); 
      console.log(usedFieldsInTheDocument) 
     }); 

Source de: https://github.com/modesty/pdf2json/issues/65
Vive

+0

Veuillez poster votre réponse ici, pas seulement un lien. –

+0

Bien que ce lien puisse répondre à la question, il est préférable d'inclure les parties essentielles de la réponse ici et de fournir le lien pour référence. Les réponses à lien uniquement peuvent devenir invalides si la page liée change. - [De l'examen] (/ review/low-quality-posts/18415289) – Liam