2010-05-05 6 views
0

J'ai besoin de trouver une certaine clé dans un fichier pdf. Pour autant que je sache, la seule façon de le faire est d'interpréter un pdf en tant que fichier txt. Je veux le faire en PHP sans installer addon/framework/etc.Est-il possible de lire un fichier pdf en txt?

Merci

Répondre

4

Vous pouvez certainement ouvrir un fichier PDF sous forme de texte. Le format de fichier PDF est en fait une collection d'objets. Il y a un en-tête dans la première ligne qui vous indique la version. Vous devriez ensuite aller en bas pour trouver le décalage au début de la table xref qui indique où se trouvent tous les objets. Le contenu des objets individuels dans le fichier, comme les graphiques, sont souvent binaires et compressés. La spécification 1.7 peut être trouvée here.

+0

wow, je vous remercie beaucoup pour votre entrée. Avez-vous, par hasard, une documentation sur les relations PDF et PHP? – Kel

0

Merci à tous pour votre aide. Je vous dois ce morceau de code:

// Proceed if file exists 
if(file_exists($sourcePath)){ 
    $pdfFile = fopen($sourcePath,"rb"); 
    $data = fread($pdfFile, filesize($sourcePath)); 
    fclose($pdfFile); 

    // Check if file is encrypted or not 
    if(stripos($data,$searchFor)){ // $searchFor = "/Encrypt" 
     $counterEncrypted++;  
    }else{ 
     $counterNotEncrpyted++; 
    } 
}else{ 
    $counterNotExisting++; 
} 
Questions connexes