Je suis particulièrement intéressé par la façon dont on peut traiter une énorme quantité d'informations pour un service commercial tel que Google Search ou Google Maps. Nous savons tous qu'ils utilisent (ou "font" au moins) une sorte de grappe Linux, mais comment sont-ils organisés? Quel type de matériel utilisent-ils, quels sont les systèmes de fichiers, les réseaux, quels sont les problèmes les plus fréquents?Une structure logicielle/matérielle des clusters Google Search/Maps Linux?
Répondre
La réponse dépend de ce que vous essayez de faire. Google a créé sa propre base de données destributed, mais aussi ils ont créé leurs propres fermes de calcul et beaucoup d'autres choses. Une fois que vous avez décidé d'aller de la même façon, il n'y a pas de quoi faire, mais il est certain que vous aurez besoin de millions d'investissements dans l'infrastructure et le développement. Matthew a fourni dans le lien de commentaire à mathériaux au sujet de ce que Google a fait. Toutefois, si votre objectif est de créer une application Web, vous ne voudrez peut-être pas consacrer du temps à la création d'infrastructures, mais utiliser ce qui existe déjà sur le marché. Si vous voulez créer une application capable de gérer une énorme quantité de données et de servir des millions de clients toutes les heures, alors vous devriez considérer l'infrastructure cloud comme Amazon Elastic Computing Cloud et Microsoft Azure.
L'avantage est que vous obtenez à un prix raisonnable une énorme ferme informatique avec une application de base de données implémentée et une évolutivité immédiate, sans coûts informatiques associés. Vous pouvez l'étendre immédiatement d'un serveur à cent puis revenir à un seul, lorsque le pic de demande a été dépassé.
est ici Description d'Amazon Elastic Cloud Computing: http://aws.amazon.com/ec2/
Voici la description de leurs services de base de données évolutive: http://aws.amazon.com/simpledb/ http://aws.amazon.com/rds/
- 1. Windows Powershell & Gestion des clusters NLB
- 2. Passerelles d'événements ColdFusion dans des clusters
- 3. Google Waves - structure de base
- 4. Structure PTE dans le noyau linux
- 5. Comment le HP (Tandem) Non stop se compare-t-il aux clusters Linux?
- 6. Utilisation de Maven pour déployer des clusters pour Weblogic
- 7. Structure de l'arborescence de datastore Google appengine
- 8. Clusters de KMeans pour plus de 5 millions de vecteurs
- 9. NPAPI et Google Chrome sous Linux
- 10. structure des fichiers objet
- 11. Ecoute des changements dans une structure DOM
- 12. ce qui est l'analogue de Linux à WIN32_FIND_DATA structure
- 13. Utiliser la puissance des clusters dans le contexte des bases de données?
- 14. Y a-t-il une structure MVC de la ligne de commande de la console Linux?
- 15. Noyau Linux: copy_from_user - struct avec des pointeurs
- 16. Comment accéder à une structure de données à partir d'un processus Python sous Linux?
- 17. Google Page Rank - Nouvelle migration de structure de domaine/lien
- 18. construire des noyaux linux
- 19. suivi après l'état d'un groupe de clusters C++
- 20. Construire une structure arborescente
- 21. Initialiser une structure
- 22. Structure de répertoire pour une bibliothèque C++
- 23. Comptage de clusters dans un ensemble de hachage
- 24. Chargement de données google maps dans une structure de données consultable
- 25. Signification des paramètres dans une requête Google?
- 26. Choix du nombre de clusters dans k signifie
- 27. Structure des données du calendrier
- 28. Itérer à travers une structure?
- 29. Objective-C: Obtenir la classe True des classes dans les clusters de classe
- 30. chemin du moteur de l'application Google dans Linux?
http://research.google.com/pubs/papers.html est le endroit pour commencer. –