Von Daten zu Maßnahmen und Erkenntnissen bei Conviva
Inhaltsverzeichnis
- Einleitung
- Projektüberblick
- Probleme im Internet-Video-Streaming
- Wachstum des OTT-Marktes
- Typische Streaming-Pipeline
- Herausforderungen bei der Fehlerbehebung
- Einführung in das Diagnostic Alert System
- Funktionsweise des Systems
- Anomalieerkennungsalgorithmus
- Erkennung von Root Causes
- Maschinelles Lernen zur Vorhersage der Leistung kleiner Gruppen
- Verarbeitung des Zeitreihendaten in Spark
- Erfolge und zukünftige Pläne des Systems
- Zusammenfassung und Fazit
🔍 Einleitung
Willkommen zu unserer Präsentation! Mein Name ist Yen und dies ist mein Kollege Ray, beide von der Engineering-Abteilung bei Kanaeva. Heute möchten wir über ein Projekt sprechen, das wir bei Kuvira entwickelt haben - das Auto Tech Diagnostics Alert System. Dieses System ermöglicht es, anomale Vorfälle entlang der Video-Streaming-Pipeline zu erkennen und automatisch die Ursache zu diagnostizieren. In diesem Artikel werden wir detailliert auf die Funktionsweise des Systems eingehen und die Herausforderungen im Bereich des Internet-Video-Streamings erläutern.
📚 Projektüberblick
Das Auto Tech Diagnostics Alert System ist eine Plattform, die entwickelt wurde, um Probleme im Internet-Video-Streaming zu lösen. Hierbei werden wichtige KPIs (Key Performance Indicators) wie die Wartezeit vor dem Start des Videos, Pufferprobleme und Fehlerkorrekturen kontinuierlich überwacht. Durch den Einsatz von leistungsstarken Algorithmen auf Client-Seite und Server-Seite wird die Videoqualität optimiert, um das Engagement der Zuschauer zu maximieren.
Probleme im Internet-Video-Streaming
Das Online-Video-Streaming (auch als OTT bezeichnet) ist in den letzten Jahren exponentiell gewachsen. Immer mehr Inhalte werden ausschließlich online gestreamt, was zu einem dramatischen Anstieg des globalen Internetverkehrs für das Video-Streaming führt. Trotz des schnellen Wachstums des OTT-Marktes ist es nach wie vor eine große Herausforderung, ein erfolgreiches End-to-End-Streaming zu gewährleisten. Die Streaming-Pipelines sind komplex, mit vielen beteiligten Entitäten, und ein Ausfall an einer Stelle kann zu einer Beeinträchtigung der gesamten Videoqualität führen.
🚀 Wachstum des OTT-Marktes
Der Online-Video-Streaming-Markt wächst rasant und hat sich in den letzten Jahren deutlich verändert. Immer mehr Zuschauer bevorzugen das Streaming von Inhalten gegenüber traditionellen Fernseh- oder Kabelanschlüssen. Laut einer Studie von Cisco wird bis 2019 voraussichtlich mehr als 80% des globalen Internetverkehrs auf das Online-Video-Streaming entfallen. Dieses schnelle Wachstum des Marktes bietet sowohl Chancen als auch Herausforderungen für Video-Publisher.
🎥 Typische Streaming-Pipeline
Die Streaming-Pipeline besteht aus mehreren Entitäten - vom Content Delivery Network (CDN) über Video-Player bis hin zu Live-Encodern. Jede dieser Entitäten kann jederzeit einen Fehler haben, was zu einer Beeinträchtigung der Videoqualität führt. Eine einfache Anomalie kann beispielsweise auftreten, wenn ein Video-Player auf bestimmten Geräten hängt, was zu langen Pufferzeiten führt. Die Herausforderung besteht darin, den genauen Ort und die genaue Ursache des Problems zu identifizieren.
⚙️ Herausforderungen bei der Fehlerbehebung
Die Fehlerbehebung im Internet-Video-Streaming ist eine komplexe Aufgabe. Da die gesamte Pipeline aus vielen Entitäten besteht, kann es schwierig sein, den genauen Ort und die genaue Ursache des Problems zu ermitteln. In den meisten Fällen gibt es mehrere Anomalien entlang der Pipeline, und das Debugging kann zeitaufwändig und frustrierend sein. Um die Videoqualität zu gewährleisten und frustrierte Benutzer zu vermeiden, ist ein effektives Diagnose- und Fehlerbehebungssystem erforderlich.
🔬 Einführung in das Diagnostic Alert System
Das Diagnostic Alert System von Kuvira Technologies ist ein fortschrittliches System zur Echtzeit-Erkennung von Qualitätsproblemen im Video-Streaming. Das System analysiert kontinuierlich die Zeitreihendaten jedes KPIs und identifiziert Abweichungen von der Norm. Anhand dieser Abweichungen werden automatisch Warnmeldungen generiert, und das System führt eine Root-Cause-Analyse durch, um die genaue Ursache des Problems zu ermitteln.
Funktionsweise des Systems
Das Diagnostic Alert System basiert auf Algorithmen zur Erkennung von Anomalien in Zeitreihendaten. Zunächst wird mithilfe historischer Daten eine Baseline für jedes KPI berechnet. Anschließend wird anhand dieser Baseline eine Toleranzschwelle festgelegt, die als mehrere Standardabweichungen über der Baseline definiert ist. Wenn der Wert eines KPI über dieser Toleranzschwelle liegt, wird er als anomal betrachtet.
Anomalieerkennungsalgorithmus
Der Anomalieerkennungsalgorithmus basiert auf der Berechnung des Flächenuntergrunds jeder Anomalie. Dieser Flächenuntergrund spiegelt die Auswirkungen der Anomalie wider. Der Algorithmus markiert eine Anomalie, wenn der Flächenuntergrund einen bestimmten Schwellenwert überschreitet. Dieser Schwellenwert kann von den Kunden angepasst werden, um die Empfindlichkeit des Systems anzupassen.
🔍 Erkennung von Root Causes
Die Identifizierung des wirklichen Problemverursachers ist entscheidend für die effektive Fehlerbehebung. Das Diagnostic Alert System verwendet ein hierarchisches Diagnosegraphmodell, um die Beziehung zwischen verschiedenen Gruppen zu erfassen. Dieses Modell ermöglicht es dem System, systematisch nach dem Wurzelproblem zu suchen, ohne versehentlich unschuldige Gruppen zu beschuldigen.
🛠️ Maschinelles Lernen zur Vorhersage der Leistung kleiner Gruppen
Für kleine Gruppen mit geringem Datenverkehr ist es oft schwierig, eine klare Anomalie zu erkennen. Das Diagnostic Alert System verwendet maschinelles Lernen, um eine Vorhersage der Leistung für solche Gruppen zu treffen. Durch die Verwendung von historischen Daten anderer Video-Sitzungen kann das System die durchschnittliche Leistung für eine bestimmte Gruppe vorhersagen und den Anomalieerkennungsalgorithmus entsprechend anwenden.
⚡ Verarbeitung des Zeitreihendaten in Spark
Die Verarbeitung der Zeitreihendaten erfolgt auf einem Spark-Cluster. Die Sitzungsdaten werden von HDFS geladen und gruppiert, um die Zeitreihen für jede Entität entlang der Streaming-Pipeline zu generieren. Anschließend wird der Anomalieerkennungsalgorithmus auf jeder Gruppe angewendet, um Anomalien zu identifizieren. Die Ergebnisse werden in einer Datenbank gespeichert und können über eine externe API abgerufen werden.
✅ Erfolge und zukünftige Pläne des Systems
Das Diagnostic Alert System wurde erfolgreich in der Produktion eingesetzt und hat positive Rückmeldungen von Kunden erhalten. Das System unterstützt derzeit 25 Video-Publisher mit Tausenden von Sitzungen pro Minute. Das Unternehmen plant, das System kontinuierlich zu verbessern und weiterhin in neue Algorithmen und Leistungsverbesserungen zu investieren.
🔎 Zusammenfassung und Fazit
Das Diagnostic Alert System von Kuvira Technologies ist ein leistungsstarkes Tool zur Erkennung und Diagnose von Qualitätsproblemen im Internet-Video-Streaming. Durch die Analyse von Zeitreihendaten und die Durchführung von Root-Cause-Analysen ermöglicht das System eine effektive Fehlerbehebung und Maximierung des Benutzerengagements. Mit kontinuierlichen Verbesserungen und Investitionen in maschinelles Lernen wird das System auch zukünftig ein wichtiges Werkzeug für Video-Publisher sein.
Highlights
- Das Auto Tech Diagnostics Alert System ermöglicht die automatische Erkennung und Diagnose von Qualitätsproblemen im Internet-Video-Streaming.
- Das System basiert auf fortschrittlichen Algorithmen zur Anomalieerkennung in Zeitreihendaten.
- Es verwendet ein hierarchisches Diagnosegraphmodell, um die Root Causes von Problemen zu identifizieren.
- Kleine Gruppen mit geringem Datenverkehr werden mithilfe von maschinellem Lernen vorhergesagt.
- Das System wurde erfolgreich in der Produktion eingesetzt und verbessert laufend.
FAQ
Frage: Wie funktioniert das Diagnostic Alert System?
Antwort: Das System analysiert kontinuierlich die Zeitreihendaten jedes KPIs und identifiziert Abweichungen von der Norm. Anhand dieser Abweichungen werden automatisch Warnmeldungen generiert, und das System führt eine Root-Cause-Analyse durch, um die genaue Ursache des Problems zu ermitteln.
Frage: Was sind die Herausforderungen im Internet-Video-Streaming?
Antwort: Die Streaming-Pipelines sind komplex, mit vielen beteiligten Entitäten. Ein Fehler an einer Stelle kann zu einer Beeinträchtigung der gesamten Videoqualität führen. Die Identifizierung des genauen Ortes und der genauen Ursache von Problemen ist daher eine Herausforderung.
Frage: Wie groß ist der Markt für Online-Video-Streaming?
Antwort: Der Markt wächst schnell, und bis 2019 wird erwartet, dass mehr als 80% des globalen Internetverkehrs auf das Online-Video-Streaming entfallen. Dies bietet sowohl Chancen als auch Herausforderungen für Video-Publisher.
Frage: Wie funktioniert die Anomalieerkennung im Diagnostic Alert System?
Antwort: Der Algorithmus berechnet eine Baseline für jedes KPI und legt eine Toleranzschwelle fest. Wenn der Wert eines KPI über der Toleranzschwelle liegt, wird er als anomal betrachtet. Die Größe der Anomalie wird durch die Fläche unter der Kurve des abweichenden Zeitreihendatenpunkts bestimmt.
Frage: Wie werden kleine Gruppen mit geringem Datenverkehr vorhergesagt?
Antwort: Mithilfe von maschinellem Lernen werden historische Daten anderer Video-Sitzungen verwendet, um eine Vorhersage der durchschnittlichen Leistung für eine kleine Gruppe zu treffen. Diese Vorhersage wird dann verwendet, um den Anomalieerkennungsalgorithmus anzuwenden.
Ressourcen: