Utilisez file_get_contents() qui renvoie une chaîne entière pour le fichier entier, puis analyse la chaîne pour en extraire le contenu.
D'autres options seraient cURL ou wget qui va obtenir le fichier entier puis les traiter avec tels que sed et awk ou PERL
Cela dépend combien de fois vous avez besoin de gratter la page cible. Si occasionnellement, alors PHP, mais vous aurez besoin de le déclencher à partir d'un navigateur et remeber regexp en PHP peut prendre beaucoup de temps.
Si vous voulez graver le fichier régulièrement, un script BASH avec cURL/wget + sed et awk peut être exécuté à partir de cron sans intervention et en arrière-plan.
BTW, les sites cibles peuvent nécessiter somesort d'entrée de données pour afficher leur contenu comme nous choisir une ville dans un menu déroulant. –
et aucune API pour récupérer ces données de sites Web –