Le code que j'utilise est celui ci-dessous, cela fonctionne parfaitement bien jusqu'à ce que je rencontre url avec un caractère japonais ou des caractères spéciaux. J'ai observé ce problème et il semble qu'il retourne seulement le nom de domaine quand l'URL contient des caractères spéciaux tels que le japonais, par conséquent j'ai continué à obtenir des résultats aléatoires que je n'ai pas l'intention de récupérer.simple_html_dom ignore les caractères spéciaux
include_once 'simple_html_dom.php';
header('Content-Type: text/html; charset=utf-8');
$url_link = 'http://kissanime.com/Anime/Knights-of-Ramune-VS騎士ラムネ&40FRESH';
$html = file_get_html($url_link);
echo $html->find('.bigChar', 0)->innertext;
Je devrais obtenir un résultat des « Chevaliers de Ramune » puisque c'est l'élément que je tente de récupérer. Au lieu de cela, le $ url_link a été redirigé vers le nom de domaine qui est le 'http://kissanime.com/' sans 'Anime/Chevaliers-de-Ramune-VS & 40FRESH'. Et à partir de là, il cherche la classe avec une valeur de '.bigChar' qui résulte de donner une valeur aléatoire.
Vous devriez écrire $ html pour voir si vous récupérez la page correctement. –
Il me redirige juste vers le nom de domaine seulement –
Ensuite, le problème n'est pas avec simple_html_dom, mais avec file_get_html. Je doute que les URL puissent contenir des caractères spéciaux, mais je n'ai pas de référence à portée de main. –