2009-06-18 7 views
3

Comment surveillez-vous votre application en production? journaux, le temps de fonctionnement, etc ... (je préférerais une application externe, libre et open source)surveillance des applications, disponibilité, fichiers journaux, etc

Par exemple, je voudrais

  1. capacité d'envoyer une alerte si l'application descend
  2. envoyer une alerte si l'utilisation cpu> à un seuil fixé
  3. envoyer une alerte si l'utilisation de la mémoire> à un seuil fixé
  4. envoi d'alerte pour les messages d'erreur
  5. doit être configurable, peut-être quelques erreurs envoyer une alerte si se produit X ti mes dans Y période
+0

Ceci est vraiment plus d'une question de faute de serveur. Cela étant dit: Nagios, Netcool, etc. – Joe

Répondre

-2

Google Analytics ???

+0

Ceci est une réponse incorrecte. – phoxis

3

Quel type d'application?

J'ai déjà utilisé Nagios par le passé. C'est gratuit et open source. Il vous permet de configurer des alertes, de surveiller les journaux d'événements, de surveiller les journaux spécifiques aux applications, ainsi que de surveiller l'infrastructure du serveur et le réseau lui-même.

http://www.nagios.org/

0

Nagios est la voie à suivre - un peu d'une courbe d'apprentissage, mais personnalisable et puissant. Dispose également d'un démon côté serveur qui peut surveiller les fichiers, l'espace disque, etc.

0

Nous disposons d'un logiciel de surveillance personnalisé.

Il surveille les journaux d'événements de nos diverses machines sous tension (et test) pour les erreurs produites par nos applications Web. Toutes nos applications Web écrivent des exceptions le journal des erreurs. Il pings également les serveurs et surveille l'espace disque.

Il existe une application cliente sur chaque machine de développement qui interroge l'application serveur qui surveille tous les serveurs que nous avons définis. Cette application client s'exécute dans la barre des tâches et affiche des messages lorsque tout est hors de la norme, donc un développeur le voit instantanément. Nous pouvons également voir quand les testeurs rencontrent des erreurs et ont généralement un correctif ou au moins une correction en cours au moment où le testeur signale même l'erreur. Le serveur envoie également des e-mails à un groupe de distribution afin que nous puissions voir les erreurs importantes lorsque nous ne sommes pas au travail si nécessaire.

Il a également la capacité de supprimer les exceptions/erreurs prédéfinies.

1

De nombreuses personnes optent pour des solutions orientées données. Alors que la plupart des outils de surveillance (nagios, etc.) fournissent des diagrammes statiques, ils sont plus silo, des vues conventionnelles - les applications d'aujourd'hui sont hautement distribuées et les transactions couvrent plusieurs serveurs et les choses peuvent devenir folles. Pour plus de fonctionnalités avancées qui vont au-delà de kpis et de simples API, vous devez chercher des solutions de données machine comme Logscape ou Splunk. Ils vous permettent de créer des tableaux de bord, etc. qui sont flexibles et peuvent être analysés de manière interactive pour fournir une analyse des causes profondes très riche. Regardez quelques-unes des applications sur cette page LogscapeApps

Questions connexes