2012-02-05 4 views
1

Quel serait plus coûteux à exploiter, un site Web compressé ou non compressé? Prenons l'exemple de Wikipedia:trouver le coût de compression des données

Compressed size: 280GB 
Uncompressed size: 5TB 

considère que nous avons toutes les données dans une base de données, pour servir les pages Web aux utilisateurs dont vous auriez besoin:

Si vous stockez les données sous forme comprimée:

  • Interrogez le record correspondant de la base de données
  • Décompressez le dossier
  • Serve les données au large de l'utilisateur owser

Si vous stockez les données sous forme non compressée:

  • Interrogez le record correspondant de la base de données
  • Serve les données au navigateur de l'utilisateur

compression ajoute une étape plus dans le processus. Si nous supposons que le navigateur ne supporte pas la compression et néglige les coûts de bande passante, quel impact cela a-t-il sur les coûts de matériel? Pour décompresser l'enregistrement, vous auriez besoin de plus de RAM et d'autres instructions CPU en cours d'exécution. Si vous avez beaucoup de demandes, vous aurez besoin de plus de serveurs d'applications pour décompresser les données, vos coûts d'opération augmenteront. Y at-il une étude de cas sur les coûts de compression que j'ai pu lire?

+0

J'ai trouvé ce merveilleux article qui explique très bien le coût de la compression: http://devcentral.f5.com/weblogs/macvittie/archive/2009/05/27/i-am-wondering-why-not-all -websites-enabling-this-great.aspx – Nulik

+0

Vos données sont-elles statiques? La pré-compression des données devrait également être possible et n'affecterait pas les performances en temps réel. – Toymakerii

Répondre

0

Généralement les bases de données ont déjà résolu ce problème compressé/non compressé, et vous permettent de configurer la compression as needed, en fonction de combien vous sacrifieriez la modification des données. En général, en recherchant de grandes solutions - stocker des réponses compressées pré-mises en cache est ce qui se passe dans les solutions de cache basées sur RAM, c'est le plus cost-effective.

Dans Wikipedia architecture, "Le texte est compressé et seules les révisions entre articles sont stockées".