J'ai 3000 sous-dossier dans un dossier principal contenant 2 pdfs dans chacun. J'ai écrit le code suivant pour convertir des PDF dans un fichier texte.conversion de fichier PDF en texte
all.subfolders * < - list.dirs ("# Chemin vers le dossier principal", full.names = TRUE)
sapply(all.subfolders[-1], function(x) {
file <-list.files(x, full.names=TRUE)
lapply(file, function(x) system(paste('"C:\\Program Files (x86)\\xpdfbin-win-3.03\\bin64\\pdftotext.exe"', paste0('"', x, '"')), wait = FALSE))})*
Mais dans quelques fichiers PDF qui ne peuvent être convertis en texte, Comment les obtenir dans une liste ou plus. S'il vous plaît aider.
Pourquoi ces fichiers PDF ne peuvent-ils pas être convertis? As-tu eu un message d'erreur? Peut-être que ces fichiers PDF ne contiennent pas de texte? –
Ils contiennent du texte mais je pense que les fichiers PDF sont scannés et ne peuvent donc pas être convertis. Je dint obtenir un message d'erreur. Après avoir exécuté les commandes, je trouve leur fichier converti dans le dossier correspondant. –