Je voudrais faire un programme qui cherche des mots dans un pdf en utilisant PDFBox.Programme avec PDFBox recherche de mots
Voici mon petit programme:
List<String> words ;// List of words
PDDocument document = PDDocument.load("D:\\INIT.pdf");
PDFTextStripper s = new PDFTextStripper();
String content = s.getText(document);
Comparing(content,words);//methode for searching those words on my text
System.out.println(content);
Mais est-il possible de regarder directement dans le PDF sans le texte avec getText
?
getText
renvoie une chaîne .dans le cas où nous avons un grand texte en pdf Fichier cette chaîne peut-elle porter le même texte, existe-t-il un autre type à utiliser lorsque le texte est grand et non pris en charge par String ??? ?
Même avec l'édition, le paragraphe avec 'renvoie une chaîne' n'a aucun sens pour moi. Pouvez-vous le reformuler? –
OK, merci @AndrewThompson – salvador
Et .. ce mot est épelé avec un A - «merci» par opposition à «pensez-vous». ;) –