Was ist Anwendungsüberwachung?

Arfan Sharif - Februar 15, 2023

Definition von Anwendungsüberwachung

Die Anwendungsüberwachung umfasst die Erfassung von Log-Daten, mit denen Entwickler die Verfügbarkeit, Fehler, Ressourcennutzung sowie Leistungsveränderungen von Anwendungen kontrollieren, die Einfluss auf das Benutzererlebnis haben. Tools zur Anwendungsüberwachung warnen bei gerade stattfindenden ungewöhnlichen Ereignissen und können durch verteilte und Service-übergreifende Nachverfolgung zeigen, welche Vorgänge die jeweilige Kausalkette bilden.

Die auch als APM (Application Performance Management, Verwaltung der Anwendungsleistung) bekannte Funktion stellt durch Zuordnung von Abhängigkeiten und Datenflüssen grafisch die Verbindungen zwischen Ereignissen dar. Die Anwendungsüberwachung erfolgt über dedizierte Überwachungstools oder durch die Erfassung und Analyse von Protokollen mithilfe von Log-Management-Tools. Das Ziel der Anwendungsüberwachung besteht letztendlich darin, die Verfügbarkeit zu maximieren und Kunden das bestmögliche Erlebnis zu ermöglichen.

Tools zur Anwendungsüberwachung haben folgende wichtige Aufgabenbereiche:

  • Überwachung von Anwendungskomponenten: Zu diesen Komponenten gehören Server, Datenbanken sowie Meldungswarteschlangen oder Caches.
  • Bereitstellung von Anwendungs-Dashboards und Warnungen: Dashboards bieten eine Übersicht, während Warnungen die Aufmerksamkeit auf konkrete Probleme lenken.
  • Anomalieerkennung: Kann von einfacher Schwellenwert-Erkennung bis zur hochentwickelten Machine Learning-Mustererkennung reichen.
  • Verteilte Nachverfolgung: Überwacht, wie ein Ereignis mit mehreren Knoten verbunden ist, um die Ursache des Fehlers aufzudecken.
  • Zuordnung von Abhängigkeiten und Datenflüssen: Eine grafische Darstellung der Anfragen zwischen Services.

Herausforderungen

Durch die zunehmende Nutzung von Mikroservices sowie die Migration zu heterogenen Cloud-Umgebungen wächst auch die Zahl von Anwendungen. Daher ist die Gewährleistung der Beobachtbarkeit im Laufe der Zeit immer schwieriger geworden. Ohne die zentrale Überwachung durch ein dediziertes Anwendungsüberwachungstool wie APM können andere Monitoring-Tools wie solche zur Überwachung der Netzwerkleistung, Serverüberwachung und Benutzerüberwachung nur eine begrenzte Bandbreite von Metriken erfassen, was zu einem eingeschränkten Überblick führt. Unternehmen, die das Modell der kontinuierlichen Auslieferung (Continuous Delivery) nutzen, fällt es schwerer, die Abhängigkeiten innerhalb einer Anwendungsumgebung zu erfassen und zu verstehen. Sofern APM-Tools für dynamische Umgebungen angepasst wurden, fehlt ihnen häufig die Möglichkeit, in Echtzeit auf Zwischenfälle zu reagieren.

Folgende Faktoren bereiten APM-Tools dauerhaft Schwierigkeiten:

  • Kontinuierliche Veränderungen: Das Modell der kontinuierlichen Auslieferung (Continuous Delivery) bietet insgesamt eine hohe Leistung, erschwert jedoch die Ermittlung von Kontext für die Überwachung.
  • Komplexität: Millionen Datenpunkte sind über ein immer komplexeres Netzwerk aus Betriebsprozessen, Beziehungen und Abhängigkeiten verteilt.
  • Begrenzte Daten: Reinen APM-Tools entgehen möglicherweise die Konfigurations- und Betriebsdaten in anwendungsfremden Protokollen.
  • Nicht synchronisierte Zeitstempel: Wenn während der Zeitrahmenanalyse nicht die richtigen Konfigurations- und Plattformabhängigkeiten berücksichtigt werden, ist die Informationsbasis unvollständig.
  • Isolierte Überwachungslösungen: Über mehrere Lösungen verteilte Daten verlangsamen die Erkennung der Ursachen für Zwischenfälle.

So kann Log-Management APM-Probleme beheben

Log-Management erweitert die Rolle von APM-Tools und ermöglicht so die Beobachtbarkeit der gesamten Infrastruktur. Während APM normalerweise nur eine Teilmenge aller Log-Daten erfasst, umfasst Log-Management alle Daten und unterstützt detaillierte Ursachenforschung und Analysen. Log-Management-Lösungen können auf mehr Daten von spezifischen Plattformen zugreifen, als das für APM-Überwachungsagenten möglich ist. Dies umfasst Informationen zu Netzwerkproblemen, Datenbankverbindungen oder -verfügbarkeiten oder Informationen dazu, was in einem Container vorgeht, den eine Anwendung nutzt.

Log-Management-Tools können Daten komprimieren und speichern sowie historische Datenanalysen nutzen, sodass Benutzer die Ursachen von Leistungsproblemen in viel größerem Umfang identifizieren können. Da Log-Management für schnelle Reaktionszeiten optimiert ist, bietet es folgende zusätzliche Vorteile:

  • Überblick über die gesamte Infrastruktur
  • Umfassende Ursachenforschung und Analyse
  • Suche in allen relevanten Daten, nicht nur in Anwendungsdaten
  • Längere Datenspeicherung und langfristige Speicherung

 grafische Darstellung der Anwendungsüberwachung

Implementierung moderner Log-Management-Tools

Nicht alle Log-Management-Tools erfüllen die Anforderungen komplexer APM-Lösungen, die stark auf Mikroservices setzen. Wählen Sie ein Tool, das diese grundlegenden APM-Anforderungen moderner verteilter Umgebungen erfüllt:

  • Unbegrenzte Datenerfassung
  • Indexlose Abfragen
  • Echtzeitdaten und Datenstreaming

Unbegrenzte Datenerfassung

Bei Mikroservices fallen erheblich mehr Daten an als bei monolithischen Anwendungen oder Anwendungen mit Service-orientierter Architektur (SOA). Neben den individuellen Daten der im Unternehmen eingesetzten Lösungen und Technologien gibt es auch Anwendungsdaten. Gleichzeitig kann jede Abfrage einen ganz eigenen Weg durch die Infrastruktur nehmen. Dadurch ist es praktisch unmöglich, die zu analysierenden Daten festzulegen. Verwenden Sie daher ein Log-Management-Tool, das alle Daten erfasst und unbegrenzte Datenerfassung unterstützt, um auch unerwartete Fragen beantworten zu können, die eventuell erst später auftauchen.

Indexlose Abfragen

Wenn Daten bereits bei der Erfassung indexiert und Indexe zur Analyse durchsucht werden sollen, werden alle Prozesse verlangsamt und behindern erweiterte Analysen. Zur Untersuchung eines einzigen Problems sind mitunter dutzende Abfragen erforderlich. Wenn Streaming-Daten erfasst werden können, ohne dass das Schema im Voraus definiert werden muss, bietet das bei späteren Untersuchungen der Beziehungen sehr viel mehr Flexibilität. Indexlose Abfragen ermöglichen sofortige Suchergebnisse und geben Benutzern die Möglichkeit, weitere Fragen zu stellen und weitere Untersuchungen durchzuführen.

Echtzeitdaten und Datenstreaming

Da Unternehmen statt weniger Software-Versionen im Jahr mittlerweile mehrere Dutzend am Tag veröffentlichen, ist der Bedarf an sofortigen Rückmeldungen so hoch wie nie zuvor. Die einzige Möglichkeit, das DevOps-Team effektiv dabei zu unterstützen, hohe Service-Level zu gewährleisten und die Zeit bis zur Problemlösung zu verkürzen, ist die Bereitstellung von Daten nahezu in Echtzeit. Dazu sollten die Daten aus der Quelle gestreamt und ohne eventuelle Verzögerungen durch die Indexierung sofort zur Verfügung stehen.

CrowdStrike Falcon® LogScale bietet modernes Log-Management

CrowdStrike Falcon® LogScale ist eine Lösung zur indexlosen Erfassung von Live-Streaming-Daten mit kostengünstigen unbegrenzten Lizenzen, die heutigen Ansprüchen an die Anwendungsüberwachung und das Leistungsmanagement gerecht wird. Damit können Sie Lücken in der Beobachtbarkeit schließen und erhalten Echtzeitwarnungen, mit denen die Leistung eines Teams verbessert wird und die Ansprüche moderner Kunden erfüllt werden.

Vollständige Protokollierung mit CrowdStrike Falcon LogScale

WEITERE INFORMATIONEN

INFORMATIONEN ZUM AUTOR

Arfan Sharif ist Product Marketing Lead für das Observability-Portfolio bei CrowdStrike. Er verfügt über mehr als 15 Jahre Erfahrung bei der Umsetzung von Lösungen für Log-Management, ITOps, Beobachtbarkeit, Sicherheit und Benutzerunterstützung für Unternehmen wie Splunk, Genesys und Quest Software. Arfan Sharif hat einen Abschluss in Informatik bei der Buckinghamshire New University und blickt auf eine Karriere in den Bereichen Produktmarketing und Sales Engineering zurück.