16. April 2020

Projekt End2End-Analytics: Application Performance Management in der IT


Kategorie: Digital


Ein Gastbeitrag von:
Reiko Streng, - it@M Reiko Streng,
it@M
Moderne IT-Systeme erleichtern Anwenderinnen und Anwendern die Arbeit. Dahinter liegen allerdings aufwändige Anwendungslandschaften mit komplexen Schnittstellen. Kommt es zu Störungen, ist die Identifikation der Ursachen oftmals schwierig. Hier hilft eine sogenannte Application Performance Management Lösung (APM), welche im Projekt „End2End-Analytics“ in der Landeshauptstadt München eingeführt wird.

Proaktive Erkennung von Fehlerzuständen – die ideale Welt!

Das Thema Monitoring in der IT ist nicht neu. Alle Verantwortlichen versuchen, Störungen proaktiv zu erkennen – also bevor Anwenderinnen und Anwender einen Fehler melden – und diese zu beheben. Dazu wurden Systeme eingeführt, die sich automatisch melden, wenn etwas nicht richtig funktioniert. Soweit die Theorie.

In der Realität kommt es aber immer wieder vor, dass das Monitoring-System keinen Fehler meldet, beim Anwender jedoch eine Störung vorliegt. Für alle Beteiligten keine zufriedenstellende Situation.

Es ist komplex

Der Fehler ist dann oftmals schwer eingrenzbar, da viele IT-Teams und externe Softwarelieferanten zusammen einen Service erbringen. Die Architekturen von Anwendungslandschaften haben sich zudem im letzten Jahrzehnt enorm weiterentwickelt. Liefen früher alle relevanten Dienste für einen Service auf einem System, sind heute verteilte Architekturen bestehend aus Datenbanken, Anwendungsserver und Anmeldediensten Standard. Die Anforderungen an Monitoring-Systeme steigen so erheblich: Ein klassisches Verfügbarkeitsmonitoring mit dem Status grün, gelb, rot reicht bei Weitem nicht mehr aus.

Im Nachgang solcher Störungen kommt daher immer wieder die Frage auf: Wie kann so ein Ausfall rechtzeitig und proaktiv erkannt werden? Eine berechtigte Frage, die Kolleginnen und Kollegen von it@m im Projekt „End2End-Analytics“ beantwortet haben.

Application Performance Management ist die Lösung!

Eine dynamische Überwachung mit Künstlicher Intelligenz (KI) ist die Lösung der Zukunft. Dafür kommen Application Performance Management Tools (APM) zum Einsatz.

Dazu werden so genannte „Agenten“ in der Anwendungslandschaft installiert. Diese messen jegliche Aufrufe (Transaktionen) in der Applikation. Durch die Transaktionen können Echtzeitgrafiken erstellt werden, welche die Kommunikation und verwendeten Komponenten der Applikation darstellen. Folgender Screenshot zeigt eine solche Grafik von der Überwachung einer Anwendung mit dem APM-Tool „AppDynamics“.

AppDynamics –  Überwachung einer Anwendung, Quelle: IT-Referat

Im Beispiel sieht man die verschiedenen Datenbanken und Schnittstellensysteme. An den Transaktionslinien sind Werte eingetragen, wie oft und in welcher Geschwindigkeit Verbindungen benutzt wurden. In der obigen Grafik haben die Applikationsserver beispielsweise in der letzten Stunde im Schnitt 140.000-mal pro Minute auf die Datenbank zugegriffen. Das ergibt in einer Stunde rund 8,4 Millionen Aufrufe. Über alle gemessenen Werte werden dynamische Schwellwerte (Baselines) gelegt. So lässt sich erkennen, dass das System zum Beispiel Dienstagvormittag deutlich mehr ausgelastet ist, als an einem Freitagabend. 

Eine solche Analyse ist für einen Menschen nicht mehr möglich, für ein maschinelles Tool mit KI-Unterstützung aber eine Leichtigkeit. Das System lernt auch die Auslastung über die Zeit mit Hilfe künstlicher Intelligenz immer besser kennen. Abweichungen oder sogar Abbrüche werden so deutlich besser und früher bemerkt.

Fehler identifizieren und Vorschläge zur Optimierung erhalten

Anwendungsverantwortliche können mit Application Performance Management Tools somit rasch erkennen, wie der Zustand der Business-Funktionalität ist. Darüber hinaus können Analysen bis auf Code-Ebene durchgeführt werden, um Aussagen darüber zu treffen, an welcher Stelle im Anwendungscode das Problem entstanden ist. Folgendes Bild zeigt zudem eine Transaktion, bei der die „Benutzererfahrung“ nicht optimal war und schlägt potenzielle Fehlerquellen vor.

Potentielle Fehlerquellen bei Transaktionen, Quelle: IT-Referat

Auch nach einem Release (Einführung einer neuen Software-Version) lässt sich mit Application Performance Management Tools bestimmen, ob sich die geforderten Funktionalitäten verbessert haben. Dank konkreter Zahlen kommt die IT von „gefühlten“ Verbesserungen für die Anwenderinnen und Anwender so zu belastbaren und nachweisbaren Erkenntnissen und Ergebnissen.

Ausblick

Das Projekt End2End-Analytics wird im Jahr 2020 weitere business-kritische Fachanwendungen in die Überwachung mit Hilfe von AppDynamics aufnehmen. Bereits jetzt sind die Erfahrung mit der Software äußerst positiv und konnten im Rahmen von Ausfallszenarien die Anwendungsverantwortlichen und Software-Lieferanten mit detaillierten Analysen unterstützen. Auch das Feedback von CDO Thomas Bönig ist positiv:

Zu modernen leistungsfähigen IT-Services gehört, dass der Betrieb sicher, stabil und dauerhaft ohne Einschränkungen funktioniert und jederzeit verfügbar ist. Mögliche Probleme in der Technik sollten nicht von den Anwenderinnen und Anwendern bemerkt werden. Es gilt, potentielle Probleme vorab zu erkennen und zu bereinigen, bevor sich diese Auswirkungen zeigen. Mit dem neu eingeführten Application-Performance-Management können die Services unseres Digitalen Service- und Technologie Providers it@m deutlich verbessert werden. Ein bedeutender Schritt nach vorne.

Kommentare(3)
  1. Wenn wir mit dem Grad an Automatisierung weiter machen, gibt es demnächst keine Applikation mehr ohne Monitoring! Nächster halt, Microservices – wir kommen..

    Antworten
  2. Danke Sebastian! Wie du richtig sagst, ist das große Ziel IT-Probleme zu lösen, bevor sie beim Nutzer spürbar sind. Und das am besten noch automatisiert gelöst werden. Der erste Schritt ist getan, viele weitere werden noch folgen…

    Antworten
  3. Spitze! Nach dem Projekt „Datacenter Netzwerk Redesign“ eines der wichtigsten Projekte um eine absolut verlässliche IT zu haben. Gerade in diesen Tagen der Krise zeigt sich, wie Systemrelevant die IT für ALLE Arbeitsprozesse in der LHM ist und was dahingehend geleistet wird. Mittels APM seit ihr auf dem richtigen Weg noch besser zu werden. Die Probleme erkennen und bereits Maßnahmen einleiten bevor es zum Kollaps kommt. Die Feuerwehr Kollegen würden sagen: „ihr schaft es damit vor der Lage zu bleiben“! Danke an alle die da mitwirken!

    Antworten

Kommentar absenden

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Weitere Beiträge

Wie hat Ihnen dieser Beitrag gefallen?
Ihre Bewertung wurde gespeichert.[Gesamt: 1 Durchschnitt: 5]
Teilen
Wie hat Ihnen dieser Beitrag gefallen?
Ihre Bewertung wurde gespeichert.[Gesamt: 1 Durchschnitt: 5]