2016-11-28 1 views
-1

J'utilise simplehtmldom et j'essaie d'obtenir tous les liens à partir d'un site Web. Ceci est mon script:Obtenir% 3F sur les URL

include('simplehtmldom/simple_html_dom.php'); 

// get DOM from URL or file 
$html = file_get_html('http://example.com/urls/'); 

// find all a tags 
foreach($html->find('a') as $e) 
    echo $e->href . "\n"; 

Ce que je veux la liste complète des urls mais certains d'entre eux se terminent par un % 3F où Sould être une chaîne. Quelque chose comme:

http://example.com/urls/%3F 

Au lieu de:

http://example.com/urls/foo 

Je l'ai fait quelques recherches et il semble que le correctif doit être fait sur le serveur Apache bu tI n'ont pas accès , y a-t-il quelque chose que je puisse faire pour le réparer?

+0

% 3F est juste la version codée de l'URL de **? ** ... Je doute que ce soit quelque chose qui a besoin d'un * "fixing" * dans Apache. – CD001

Répondre

1

décodent Juste URL entrant comme ceci:

echo urldecode($e->href)."\n"; 

Il donnera l'URL décodée pour la chaîne.

+0

Enregistré le jour, merci! – sysfiend