2017-10-10 6 views
-1

J'utilise RStudio version 1.0.153.Studio R/R: Itérer le dossier des fichiers PDF et convertir en objets R

J'ai un dossier d'environ 30 fichiers PDF. Je voudrais les convertir en objets respectifs dans R comme des chaînes de caractères. J'ai déjà le paquet pdftools et il convertit avec succès en objets, je cherche juste un moyen pour iterativement parcourir une liste de fichiers PDF dans un dossier à assigner automatiquement à sa variable respective. Par exemple, si j'ai 30 fichiers PDF nommés "P1.pdf, P2.pdf, P3.pdf .... P30.pdf", comment puis-je obtenir R pour les convertir tous en texte en utilisant pdftools afin qu'ils sont leurs propres objets R respectifs appelés P1, P2, P3 .... P3?

Merci beaucoup.

J'ai beaucoup appris ici!

Meera

+0

Avez-vous essayé quoi que ce soit vous-même? S'il vous plaît regarder [this] (https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) et envisager de modifier votre question pour refléter des informations supplémentaires. Généralement, les gens s'attendent à ce que les questions montrent des efforts, car le site n'est pas destiné à écrire du code pour les personnes qui ont besoin d'aide. – shea

+0

Je suis débutant et j'ai essayé quelques petites choses et je suis évidemment nouveau dans ce domaine. Je n'ai pas posté cela pour que quelqu'un écrive du code pour moi et vos commentaires sont présomptueux à cet égard. J'ai toujours du mal à comprendre comment écrire un code itératif et je demandais de l'aide. – MeeraWhy

+0

Je ne présume rien, c'est pourquoi je vous ai demandé ce que vous avez fait. Beaucoup de nouveaux utilisateurs obtiennent le "Bienvenue à SO, s'il vous plaît lire Mon premier commentaire n'était rien de différent que beaucoup d'utilisateurs de première fois obtiennent d'autres utilisateurs plus expérimentés ici. votre question, quelqu'un d'autre l'a rejetée, probablement à cause de ce que j'ai indiqué dans mon commentaire, mon commentaire devait être constructif, désolé de ne pas l'avoir fait de cette façon. – shea

Répondre

-1

Cela pourrait fonctionner:

pdf_operations <- function{ 
... #using whatever operations you may have 
} 

fnames <- dir(".//PDF Files/", pattern = "\\.pdf") 
sapply(fnames, pdf_operations) 
+0

Pourquoi est-ce que l'OP doit créer une nouvelle fonction personnalisée Avez-vous cherché à voir les fonctions de 'pdftools' – shea

+0

Dans le cas où ils veulent sauvegarder certaines données dans un fichier séparé (image ou un autre pdf), extraire des informations, les passer à une autre fonction pour le nettoyage (par exemple pour les données de table - qui n'ont pas de format séparé pour pdfs) ou juste si elles veulent nommer les objets d'une certaine manière. donner la solution la plus large possible t engloberait tout ce qui précède. – Gautam

+0

Vous ne savez pas ce que l'OP a essayé, écrire une réponse et espérer que c'est la bonne réponse est la mauvaise façon de répondre à une question. J'ai essayé votre solution et de ce que je peux dire, cela ne fonctionne pas. C'est probablement parce que vous ne savez pas quelle est la fonction réelle et ce qu'elle est censée faire. – shea