2010-09-06 2 views
2

je suis ecrivais un petit robot qui extrait quelques 5 à 10 sites tout en obtenant les liens que je reçois des urls comme cel'analyse d'une URL pour crawler

../tets/index.html 

si elle est /test/index.html nous pouvons ajouter avec la base url http://www.example.com/test/index.html Que puis-je faire pour ce type d'URL?

+2

Dans quelle langue essayez-vous? – bjskishore123

Répondre

0

Utilisez dirname() pour obtenir le directoy de base, supprimez le .. en utilisant substr() et ajoutez-le ici. Comme ceci:

<?php 
$url = "../tets/index.html"; 
$currentURL = "http://example.com/somedir/anotherdir"; 
echo dirname($currentURL).substr($url, 2); 
?> 

Ce sorties:

http://example.com/somedir/tets/index.html

+0

La question est étiquetée avec C++, donc je ne pense pas que le code php est pertinent ... – greg0ire

+0

@ greg0ire, la question est également étiqueté avec 'PHP'. S'il vous plaît jeter un oeil sur les tags. – shamittomar

+0

Oups, c'est vrai! C'est étrange ... upvoting Le commentaire de bjskishore123 – greg0ire