J'ai deux tables avec la liste des URL récupérées à partir de différentes sources.Quelle est la meilleure et la plus rapide façon de comparer deux URL?
Je veux trouver les entrées communes et les mettre dans une table séparée.
C'est ce que je fais:
- trouver md5 d'URL en les chercher.
- Stockez-les dans une colonne.
- Je récupère une table sous la forme d'un tableau, exécute une boucle à travers celle-ci et insère les valeurs de l'autre table où md5 hash est identique.
EDIT: Devrais-je supprimer les URL de "http: //" et "www"?
Je veux savoir toute autre méthode, ce qui est mieux et plus vite, à l'aide que je peux effectuer ce qui précède
J'utilise PHP + MySQL
Je suis un peu curieux - quelqu'un peut me dire pourquoi vous hash l'URL du tout? Est-ce pour obtenir un type de données plus facile à comparer (à la place des recherches de chaînes)? –