2010-03-18 4 views
-1

J'écris un robot qui va parcourir un ensemble spécifique de sites Web et d'explorer tous les liens mp3 dans la base de données. Je ne veux pas télécharger les fichiers, il suffit d'explorer le lien, de les indexer et de pouvoir les rechercher. en utilisant php et comment certains sites linke guruji.comCrawler Mp3 Link pour les liens dynamiques

+0

Bon pour vous ... alors quelle est votre question? Vous voulez que nous écrivions le robot: D? – codaddict

+0

j'ai besoin de savoir comment faire pour les liens dynamiques .. j'ai écrit chenille pour les liens mp3 statiques ... – ramesh

+1

Cette question semble être hors sujet parce que c'est une déclaration d'intention sans aucun doute. – Quentin

Répondre

0

Vous voulez sans doute à la recherche d'expressions régulières - donc, une fois que vous avez connecté, faire quelque chose comme:

function crawl($url) { 
    $ch = curl_init(); 
    curl_setopt($ch, CURLOPT_URL, $url); 
    curl_setopt($ch, CURLOPT_TIMEOUT, 30); // 30 second timeout 
    curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 
    $result = curl_exec ($ch); 
    curl_close ($ch); 

    if ($result) { 
     // top domain links 
     preg_match_all('/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is', $result, $output, PREG_SET_ORDER); 

     foreach($output as $item) { 
      // each link found is output 
      echo "<pre>"; 
      var_dump($item[0]); 
      // do your magic here 
     } 
    } 
} 

Ce ne trouvera que tous les liens, donc vous devrez ajuster le match à votre utilisation, ou proposer un filtre.