Cosmos Consulting Group

 CosmosNet
 CosmosMedia
 CosmosDev
 CosmosTeach

Monitoring


Der CosmosMonitoring Server, erhältlich als zertifizierte Hardware Box, virtuelle Maschine oder Softwarelösung, ist eine beliebig skalierbare Netzwerküberwachungslösung jeder Größenordnung bis hin zum Enterprise Network. Die besonders einfache Integration ergibt sich durch den Einsatz diverser Standardprotokolle wie SNMP, ICMP oder SMTP. So werden sicherheitskritische und fehleranfällige Installationen von Agenten vermieden. Der CMS kann den Status verschiedener Dienste (z.B. SSH, FTP, HTTP) sowie den Festplattenplatz, Speicher- und CPU-Auslastung, Uptime usw. über diverse Module (Plug-ins) abfragen und auswerten. Da einige Testmethoden auf Protokollebene arbeiten (TCP, UDP, SNMP, etc.), ist es möglich, verschiedene Betriebssysteme zu überwachen. Für speziellere Aufgaben kommen weitere Programme zum Einsatz, die kostenlos verfügbar sind. Mit entsprechender Zusatzhardware ist es sogar möglich, Umweltbedingungen (z.B. Temperaturwerte, Luftfeuchtigkeit, Füllstände von Flüssigkeitstanks, etc.) zu überwachen.

Die Konfiguration ist extrem flexibel, Zeitfenster oder Abhängigkeiten können ebenso implementiert werden, wie die daraus resultierenden Prozesse oder automatische Fehlerkorrekturen, die eine Hochverfügbarkeit sicherstellen. Es werden nicht nur einfache Abfragen durchgeführt, sondern Clientanfragen emuliert, so dass sichergestellt ist, dass der Dienst nicht nur läuft, sondern auch innerhalb eines festgesetzten Zeitlimits korrekt antwortet.

Sobald ein Dienst oder ein Host einen (teilweise einstellbaren) kritischen Wert erreicht oder gar nicht mehr verfügbar bzw. erreichbar ist, alarmiert der CosmosMonitoring Server die Kontaktpersonen über beliebige Kanäle (z.B. E-Mail, SMS, Pager, IM-Messages, Telefonanrufe, etc.). CosmosMonitoring Server [CMS]Dabei besteht auch die Möglichkeit, festzulegen, in welcher Reihenfolge Meldungen an weitere Kontaktpersonen erfolgen sollen, wenn eine Störung nach den ersten Meldungen nicht behoben wurde (Eskalationsmanagement). Ebenfalls können bei der Überwachung der Dienste untereinander bestehende Abhängigkeiten berücksichtigt werden. Wird etwa die Erreichbarkeit eines Rechners und auf ihm laufende Programme überwacht, so werden bei einem Ausfall des gesamten Rechners die Meldungen über die einzelnen nicht mehr laufenden Programme unterdrückt. Die konsolidierten Überwachungsdaten werden in einer SQL Datenbank gespeichert und können über das Webinterface grafisch ausgewertet werden.

Um einen CosmosMonitoring Server ausfallsicher, redundant und fehlalarmsicherer zu gestalten, gibt es die Möglichkeit des Setups als Distributed Monitoring sowie des Redundant/Failover Monitoring. Bei verteiltem Monitoring werden mehrere, dezentral installierte CMS Instanzen genutzt, die ihre Ergebnisse an einen zentralen CMS senden, der sie als passive Checks verarbeitet. Bei redundantem Monitoring arbeiten zwei CMS Instanzen parallel wie bei einem Clusternode und halten sich mit einem Heartbeat gegenseitig auf dem Laufenden.
Mithilfe des Cosmos Remote Plugin Executor (crpe) oder SSH ist es auch möglich, Plug-ins auf entfernten Rechnern auszuführen, die die Ergebnisse ihrer Untersuchung an den Server melden. Eleganter, wenn auch schwieriger zu konfigurieren, ist die passive Überwachung via SNMP-Traps.Die Anzahl der überprüften Ressourcen, Dienste oder Services ist nicht limitiert. Das ist auch preislich der große Unterschied zu Konkurrenzprodukten.