Le titre pourrait être un peu trompeur, mais je ne pouvais pas trouver un meilleur titre. J'écris un moteur de recherche simple qui va chercher sur plusieurs sites pour le domaine spécifique. Pour être concret: j'écris un moteur de recherche pour les livesets/aftermovies/tracks hardstyle. Pour faire, je vais chercher sur les sites qui fournissent des livesets, des pistes, et autres. Le problème ici est la vitesse, je dois passer la requête de recherche à 5-7 sites, obtenir les résultats et ensuite utiliser mon propre algorithme pour afficher les résultats dans un ordre trié. Je pourrais juste le «multithread», mais c'est plus facile à dire, alors j'ai quelques questions.Écrire un moteur de recherche
Quelle serait la meilleure solution à ce problème? Devrais-je simplement multithread/traiter cette application, donc je vais obtenir un peu d'accélération?
Y at-il d'autres solutions ou je fais quelque chose de vraiment mal?
Merci,
William van Doorn
Cette infrastructure serait-elle si compliquée?Maintenant, nous parlons de Java, je pourrais juste créer un ExecutorService avec un Runnable simple. Mais va regarder Hadoop, merci. – wvd
@wvd: Cela dépend vraiment de l'échelle et de ce que vous voulez paralléliser. Pour les petites entrées et les résultats, vous pouvez broyer le vôtre. Si vous avez des tonnes de sites à interroger et des tonnes de résultats à combiner, et surtout si vous devez utiliser plusieurs processus pour interroger un grand nombre de résultats, l'infrastructure et la robustesse d'un outil Aidez-moi. – Uri
Merci, j'ai eu ma réponse. – wvd