Die Identifizierung und schnelle Umsetzung von Big Data Use Cases entscheidet über den Erfolg von Big Data Initiativen. Business Know-how, die Bereitschaft Geschäftsprozesse vom Kunden her zu denken, analytische und methodische Fähigkeiten, Pragmatismus und Kreativität sind wichtige Faktoren auf dem beschwerlichen Weg der digitalen Transformation. Und nicht zu vergessen, ein bisschen Inspiration. Deshalb möchten wir Ihnen aus unseren aktuellen Projekten Use Cases vorstellen. In diesem Blogbeitrag starten wir mit Use Cases aus dem Retail Banking.
Use Case 1: Automatisierte Erstellung eines Digitalen Haushaltsbuchs
Vor der Bewilligung eines Kredits müssen die Kunden häufig nachweisen, dass sie über genügend freie Mittel zur Rückzahlung des Kredits verfügen. Dazu müssen Sie ein Haushaltsbuch über mehrere Monate führen, in dem sie ihre Ausgaben kategorisieren (Miete, Versicherungen, Auto, Reisen, Lebensmittel, Freizeit, Medien, Anschaffungen etc.). Manche Banken unterstützen diesen Prozess, indem sie ihren Kunden ein digitales Haushaltsbuch anbieten. Allerdings bleibt dann immer noch für den Kunden die oft aufwendige Zuordnung von Ein- und Auszahlungen zu Kategorien. Auch wenn durch die Hinterlegung von Regeln dieser Prozess teilweise automatisiert werden kann, bleibt immer noch ein manueller Aufwand. Wenn man z.B. in einer anderen Edeka-Filiale eingekauft hat, versagt die hinterlegte Regel. Deshalb hat eine Bank für ihre Kunden einen Service geschaffen, bei dem die Kunden für die letzten 13 Monate automatisch ein Haushaltsbuch erstellen lassen können. Dabei werden alle Kontobewegung mit Hilfe von Verfahren des Maschinellen Lernens mit sowohl Klassifizierungs- als auch Clusterungsalgorithmen kategorisiert und dann für den Kunden aufbereitet. Eine besondere Herausforderung hierbei war die Analyse der Verwendungszwecke der einzelnen Transaktionen, da wie im oben gennannten Beispiel mit Edeka unterschiedliche textuelle Repräsentationen derselben Kategorie angehören können. Über verschiedene Textmining-Methoden konnten hierbei zusätzliche Variablen abgeleitet werden, die zur Kategorisierung der Transaktionen beitragen konnten. Anschließend wird der Kunde aufgefordert, den Inhalt des Haushaltsbuches zu prüfen und, falls alles korrekt ist, zu bestätigen. In diesem Fall kann schnell über die Gewährung des Kredits entschieden werden. Der UC wurde u.a. auf Basis der Spark MLlib auf einem Hadoop-Cluster realisiert, pro Monat kommen 50 Millionen neue Datensätze hinzu. Die Umsetzung dieses UC hat dazu geführt, dass für viele Kunden die Customer Journey bei der Beantragung eines Kredits angenehmer und schneller geworden ist. Dieses führt dann zu einer erhöhten Kundenbindung auch bei den Kunden, die keinen Kredit benötigen, aber ihre Ein- und Ausgaben zukünftig ohne Aufwand im Blick haben wollen.
Use Case 2: Realtime Monitoring von Geldautomaten
Die Loggingdaten aller Geldautomaten werden realtime in einen Data Lake gepumpt, um Reports in nahezu Echtzeit durchführen zu können. So gibt es aktuelle Informationen über den Betriebstatus der Geldautomaten. Auch kann prognostiziert werden, wann Banknoten im Gerät wieder aufgefüllt werden müssen. In einer weiteren Ausbaustufe sollen unerlaubte Zugriffe auf die Festplatte des Bankautomaten protokolliert und analysiert werden. Auch könnten Bankkunden, die ihr Geld nicht aus dem Automaten entnommen haben, per SMS informiert werden.
Use Case 3: Big Data Anwendung für Datenschutzbeauftragten
Die neue Datenschutz-Regulierung der EU tritt im Mai 2018 endgültig in Kraft, muss aber vorher in nationales Recht übernommen werden. Als ernsthafter Verstoß gilt dabei die Nichteinhaltung der Grundsätze in Bezug auf die Verarbeitung personenbezogener Daten (Artikel 5) sowie der Bestimmungen zur Einwilligung betroffener Personen (Artikel 7). Deshalb ist es für Unternehmen zur Vermeidung von hohen Strafzahlungen und eines Shitstorms in den Medien wichtiger denn je, genau zu prüfen und festzulegen, welche Person in welcher Funktion Zugriff auf welche Daten und Informationen hat. Aus diesem Grunde werden die Zugriffe der Bankmitarbeiter auf Kundendaten über alle Informationssysteme auf der Analytischen Plattform zusammengeführt und für die Compliance-Abteilung analysierbar gemacht. Auf diese Weise sollen z.B. „verdächtige“ Zugriffe auf Kundendaten identifiziert werden. Zur Ermittlung auffälliger Zugriffe wurden Algorithmen wie Random Forrest, Neuronale Netze sowie Support Vector Machine eingesetzt. Die Modelle wurden auf Basis von R erstellt und für das Deployment.