Quel est le meilleur moyen de filtrer les URL en comparant où se trouve un mot-clé dans l'URL ou non? J'ai une liste de mots-clés (une sorte de liste noire) qui contient 50000 mots. La méthode de recherche utilise les étapes suivantes:Méthode efficace de filtrage des URL en parcourant la liste des mots-clés
While (fin de mots-clés) 1. Obtenir le mot-clé de la base de données 2. Vérifiez si le mot clé est dans l'url 3. redirigent l'utilisateur vers une page spécifique. Lorsque j'utilise cette méthode, l'utilisation du processeur devient autour de% 90. Y a-t-il un moyen efficace de le faire? Il semble que je ne puisse pas utiliser regex, puisque le mot clé change toujours.
Construire un arbre binaire équilibré des mots-clés et la recherche que. 5000 mots-clés ne sont pas trop pour une structure de données en mémoire. –
Merci Paul. C'est 50 000 et ça va augmenter dans le temps. Ce sera comme une recherche en arrière. Disons que mon URL est www.selldrugs.com. J'ai une liste de mots-clés qui contient de la drogue. Je dois obtenir les mots-clés un par un, puis appeler la méthode doesUrlContainsKeyword(). Si le mot clé est 50 000e mot-clé, alors c'est un problème. –
50.000 mots-clés ne devraient toujours pas être un problème pour une structure de données en mémoire sur une machine 64-bit. –