EINEN KURZEN AUSZUG AUS DEM ARTIKEL FINDEN SIE HIER:
Wir haben eine Methode für die Erkennung von Anomalien auf multidimensionalen Zeitreihendaten entwickelt und dies mit Clustern aus Nachrichtenartikeln kombiniert, um automatisch mögliche Risiken für Unternehmen zu erkennen. Dazu sammeln wir Daten wie zum Beispiel die Anzahl der Artikel, Anzahl positiver und negativer Artikel sowie den Aktienwert. Diese Datensätze werden dann mit Hilfe einer Datenzusammenführung kombiniert, was zu einem einzelnen Zeitreihendatensatz führt. Mit diesem Datensatz haben wir dann eine Anomalieerkennung durchgeführt, um relevante Ausreißer zu finden. Parallel dazu, haben wir Nachrichtencluster mit einer Reihe von Nachrichtenartikeln gefunden, die sich auf ein Ereignis aus der realen Welt beziehen. Für jeden dieser Cluster extrahierten wir relevante Schlüsselwörter und verglichen sie mit einer vordefinierten Liste. Die Schlüsselwörter in dieser vordefinierten Liste werden dann mit einem bestimmten Risiko verknüpft, sodass wir mögliche Risiken innerhalb der Cluster finden. Schließlich kombinierten wir die Ergebnisse der beiden vorherigen Schritte und überlagerten die Zeitstempel der Anomalien mit der Zeitspanne des Clusters. Wenn ein Cluster, der ein Risiko enthält, sich nun mit dem Zeitstempel einer Anomalie überschneidet, schließen wir, dass die Risiken als „echte“ Risiken betrachtet werden können. Für die Zukunft planen wir, den Ansatz durch eine Trendanalyse zu erweitern, um die Wahrscheinlichkeit des Auftretens von Risiken zu ermitteln. Darüber hinaus wird das System um einen Warnmechanismus erweitert, der eine frühzeitige Erkennung möglicher Risiken ermöglicht und dem Risikoeigentümer die Möglichkeit geben soll, Gegenmaßnahmen zu ergreifen.