Definition von Cloud-Überwachung
Cloud-Überwachung bezeichnet die Messung bestimmter Metriken und Schwellenwerte von Workloads in Cloud-Umgebungen.
Mithilfe von Cloud-Überwachung können Sie potenzielle Sicherheitsrisiken erkennen, Kapazitätsprobleme identifizieren, Kosten analysieren und überprüfen, ob Ihre in der Cloud gehosteten Anwendungen im Rahmen der Service Level Agreements (SLAs) funktionieren.
In diesem Artikel gehen wir umfassend auf das Thema Überwachung im Rahmen der Public Cloud ein und beantworten dabei folgende Fragen:
- Warum ist die Überwachung der Cloud wichtig?
- Welche Cloud-Services sollten Sie überwachen?
- Welche Arten der Überwachung gibt es?
- Wie werden Cloud-Services überwacht?
- Welche Funktionen sollte eine Plattform zur Cloud-Überwachung unbedingt haben?
Warum ist Cloud-Überwachung wichtig?
Cloud-Überwachung ist ein Teil der Beobachtbarkeit – ein Ansatz, bei dem die Datenausgaben eines Systems untersucht werden, um Einblicke zum internen Zustand zu erhalten. In der modernen IT nutzen Unternehmen Beobachtbarkeit, um ein ganzheitliches Bild von der Sicherheit komplexer verteilter Anwendungen zu erhalten.
Da Unternehmen ihre Workloads zum Teil (oder ausschließlich) in der Cloud ausführen, ist Cloud-Überwachung ein entscheidender Bestandteil ihrer allgemeinen Beobachtbarkeitsstrategie. Allerdings geht es bei der Cloud-Überwachung primär um Metriken und Protokolle. Schauen wir uns nun einige konkrete Beispiele für Cloud-Überwachung in der Praxis an.
Kostenoptimierung
Durch die Überwachung Ihrer Cloud-Infrastruktur können Sie die Auslastung von Ressourcen verfolgen und somit Kosten optimieren. Wenn sich beispielsweise herausstellt, dass die cloudbasierten virtuellen Maschinen (VMs) nur während der Geschäftszeiten voll ausgelastet sind, könnten Sie sie außerhalb der Geschäftszeiten abschalten und dadurch Geld sparen.
Leistung
Wenn Sie zum Beispiel bemerken, dass Ihre cloudbasierten Anwendungen langsam laufen, könnten Sie zusätzliche Prozessor- oder Speicherkapazität zur Verfügung stellen. Beobachten Sie, ob bei stärkerer Skalierung die Leistung gesteigert wird. Wenn zusätzliche Kapazität oder Elastizität die Leistung nicht mehr verbessert (d. h. wenn das Verhältnis zwischen Skalierung und Leistung stagniert), könnte Ihnen ein genauerer Blick auf die Metriken und Protokolle helfen, die Ursache des Problems herauszufinden.
Benchmark-Analysen
Die Überwachung gut funktionierender cloudbasierter Anwendungen hilft Ihnen, Referenzzustände zu erstellen. Diese liefern Ihnen nützliche Daten für Vorher-Nachher-Vergleiche, falls Sie die Infrastruktur erweitern oder einer Anwendung neue Funktionen hinzufügen wollen.
Sicherheit
Cloud-Überwachung kann Ihre Sicherheit verbessern. Eine Überwachungslösung kann die Protokolle von Anwendungen, Servern, API-Gateways oder Firewalls analysieren und Sie vor Anomalien, schädlichen Zugriffsversuchen oder DDoS-Angriffen warnen. Zudem können Erkenntnisse aus der Überwachung in die allgemeinen Sicherheitsmaßnahmen einfließen.
Welche Cloud-Services sollten Sie überwachen?
Die kurze Antwort darauf lautet: Sie sollten alle von Ihnen genutzten Services überwachen. In Unternehmen kommen unter anderem folgende Services zum Einsatz:
- Software-as-a-Service (SaaS), z. B. Google Workspace, Microsoft 365 oder Salesforce
- Infrastructure-as-a-Service (IaaS), z. B. AWS, Google Cloud Platform oder Microsoft Azure
- Platform-as-a-Service (PaaS), z. B. verwaltete Web-Anwendungsfirewalls, Container-Services, API-Gateways oder DNS
- Functions-as-a-Service (FaaS), z. B. AWS Lambda oder Google Cloud Functions
- Database-as-a-Service (DBaaS), z. B. Oracle Cloud, Azure Synapse oder Snowflake
Die jeweiligen Plattformen und Services stellen dabei unterschiedliche Mengen an Informationen bereit.
Sie selbst sollten alle Metriken und Protokolle erfassen, die durch Ihre Cloud-Plattformen bereitgestellt werden und für Ihren Use Case von Wert sind. So sollten Sie beispielsweise keine Metriken von Entwicklungsservern erfassen. Ebenso ist möglicherweise die Erfassung der Metriken einer kleinen serverlosen Funktion, die nur einen Lookup-Vorgang durchführt, (selbst in einer Produktionsumgebung) kaum von Nutzen, wohingegen Zugriffsprotokolle von Webservern oder Datenbank-Protokolle zu langsamen Abfragen durchaus wichtig sein können.
Welche Cloud-Metriken sollten Sie überwachen?
Cloud-Anwendungen nutzen heutzutage dutzende oder sogar hunderte Cloud-Services von mehreren Cloud-Anbietern. Angesichts der zahllosen Metriken in derart komplexen Umgebungen haben IT-Mitarbeiter häufig das Gefühl, von Informationen förmlich erschlagen zu werden. Oft gibt es zu viele unwichtige Informationen, sodass tatsächliche Warnsignale übersehen werden.
Deshalb sollten Sie zunächst zwei Dinge festlegen: welche Informationskategorien Sie benötigen und welche relevanten Informationen in den jeweiligen Kategorien erfasst werden sollen. Dies sind einige Beispiele für Kategorien:
Netzwerke
- Flow-Protokolle
- Auslastung der Netzwerkbandbreite nach Servern
Sicherheit
- Protokolle von Firewalls, Virenschutz-Software, API-Gateways, Webservern und Zugriffen auf den Datenbank-Server
- Fehlgeschlagene Anmeldungen
- Zugriffsprotokolle von Objekten wie denen, die durch AWS S3-Buckets offengelegt werden
- Syslog
Anwendungen
- Aufruflisten und Anwendungsprotokolle von Mikroservices
- Protokolle von Laufzeit-Bibliotheken (z. B. log4j)
Rechner-Ebene
- Servermetriken wie Prozessorauslastung, verfügbarer Arbeitsspeicher, Festplattenleistung und I/O-Latenz
Containerisierte Anwendungen
- Anzahl der geplanten Pods pro Minute oder Anzahl der abgestürzten Pods pro Knoten
Serverlose Funktionen
- Serverlose Funktionen sollten nur überwacht werden, wenn sie komplexe mehrstufige Aktionen ausführen
- Protokolle von CronJob oder vom Ereignisplaner für wichtige geplante Aufgaben
Datenbanken
- Protokolle von langsamen Anfragen
- Leistungsmetriken
- Ereignisprotokolle
Diese unvollständige Liste kann Ihnen eine Orientierung dafür geben, worauf Sie sich konzentrieren sollten.
Wie wird Cloud-Überwachung durchgeführt?
Nachdem Sie nun wissen, welche Cloud-Plattformen und Metriken Sie überwachen sollten, stellt sich die Frage: Wie setzen Sie die Überwachung um?
Die meisten Cloud-Anbieter haben einen eigenen Überwachungsservice. Amazon CloudWatch und CloudWatch Logs bieten Ihnen beispielsweise Einblicke in die meisten AWS-Services. Ebenso stellt GCP die Google Cloud Operations Suite und Azure den Azure Monitor bereit. Andere Cloud-Services (z. B DigitalOcean) bieten einige grundlegende Metriken, während Snowflake seine Abfrageprotokolle mit den zugehörigen Abfrageplänen darstellt.
Wenn Ihr Unternehmen mit einer Multi-Cloud-Umgebung arbeitet, haben Sie möglicherweise hunderte laufende Workloads in mehreren Konten von verschiedenen Cloud-Anbietern, wobei jedes Cloud-Konto anfällige Service-Metriken und Protokolle aufweist.
Es kann unmöglich erscheinen, Millionen Zeilen Protokolle, Metriken, Spuren und Ereignisse zu erfassen, zu aggregieren, zu katalogisieren und zu durchsuchen – und dabei noch nach der Ursache eines Problems Ausschau zu halten.
Aus diesem Grund gibt es heute eine völlig neue Generation von Plattformen zur Überwachung und Berichterstellung. Diese Plattformen können Protokolle und Metriken aus der gesamten Cloud-Umgebung erfassen und anschließend nur die relevanten Informationen extrahieren, Formate standardisieren und einen Index für effiziente Suchen erstellen. Zudem können Sie die Plattformen nutzen, um sich durch intelligente Trendanalysen, Anomalieerkennung und Dashboards einen allgemeinem Überblick über Ihre Multi-Cloud-Anwendungen zu verschaffen.
Diese Lösungen laufen entweder lokal oder über ein abonnementbasiertes SaaS-Produkt, was jeweils eigene Vor- und Nachteile mit sich bringt. In jedem Fall benötigen diese Anwendungen Administratorrechte, um auf Ihre Cloud-Konten zugreifen und die nötigen Informationen erfassen zu können. Zudem müssen Sie möglicherweise spezielle Software (z. B. Erfassungs-Agenten im Zielsystem) installieren. Häufig sind diese Integrationen jedoch in bereits in der Plattform enthalten und verwenden gängige Protokolle.
Welche Funktionen sind bei Cloud-Überwachungsplattformen unverzichtbar?
Bei der Suche nach einer Cloud-Überwachungslösung sollten Sie darauf achten, dass diese über bestimmte Kernfunktionen verfügt. Zunächst sollte die Einrichtung, Konfiguration und Wartung der von Ihnen gewählte Plattform einfach sein.
Integrationen
Die Lösung sollte für alle vorhandenen und geplanten Systeme möglichst die erforderlichen Integrationen besitzen – oder zumindest ein Ökosystem an Drittanbieter-Integrationen unterstützen. Zudem sollten sich die Integrationen während der Erfassung von Metriken und Protokollen der Cloud-Workloads nicht negativ auf die Leistung von Systemen auswirken.
Analyse und Präsentation
Außerdem sollte die Plattform erfasste Daten synthetisieren können, um den Sicherheitszustand Ihrer Anwendung(en) in einer zentralen Übersicht darzustellen. Darüber hinaus sollte sie sich an die Anforderungen Ihres Unternehmens anpassen lassen. Wenn Sie beispielsweise nach Berichten über Cloud-Kosten suchen, sollte die Überwachungsplattform in der Lage sein, Kosteninformationen aus den Cloud-Konten für das gesamte Jahr zu extrahieren und auf verständliche Art und Weise darzustellen. Wenn Sie nach Cybersicherheitsbedrohungen suchen, sollte sie Trendanalysen für Brute-Force-Angriffe durchführen können.
Speichern, Katalogisieren und Durchsuchen von Daten
Die Menge an Protokollen, die aus allen Cloud-Quellen erfasst werden, kann sich leicht auf mehrere Terabyte oder sogar Petabyte belaufen. Die Cloud-Überwachungsplattform sollte diese Datenmenge nicht nur speichern, sondern auch schnell katalogisieren und durchsuchen können. Sie sollte zudem Such-Syntaxen wie RegEx oder eine SQL-ähnliche Sprache anbieten.
Bereinigen oder Schwärzen
Bei einigen Unternehmen können die Protokolle vertrauliche Daten wie Finanzdaten oder personenbezogene Informationen enthalten. Häufig möchten Unternehmen solche Informationen bereinigen oder schwärzen. Zudem müssen möglicherweise Branchenvorschriften eingehalten werden, die die Speicherung von Protokollen in SaaS-Plattformen außerhalb des eigenen Standorts untersagen. Wenn dies auf Ihr Unternehmen zutrifft, sollten Sie darauf achten, dass die Überwachungsplattform diese Vorgaben erfüllen kann.
Vollständige Protokollierung und Einblicke – kostenlos
Falcon LogScale Community Edition (ehemals Humio) ist eine kostenlose moderne Log-Management-Plattform für die Cloud. Durch die Erfassung von Streaming-Daten erhalten Sie einen sofortigen Überblick über verteilte Systeme und können Zwischenfälle verhindern bzw. beheben.
Falcon LogScale Community Edition ist sofort kostenlos verfügbar und bietet folgende Vorteile:
- Erfassung von bis zu 16 GB pro Tag
- Speicherung bis zu 7 Tage
- Keine Kreditkarte erforderlich
- Unbegrenzter Zugriff ohne Testzeitraum
- Indexlose Protokollierung, Echtzeit-Warnungen und Live-Dashboards
- Zugriff auf unseren Marktplatz und zugehörige Pakete, einschließlich Leitfäden zur Entwicklung neuer Pakete
- Lernen und Kooperation in einer aktiven Gemeinschaft