Was sind Ratingverfahren?
Banken sind für den Erfolg ihres Geschäftsmodells und von Bankaufsichten angehalten ihre Kreditrisiken abzuschätzen und entsprechend zu handeln. Dies bedeutet Rücklagen in Form eines Risikopuffers anzulegen sowie die Risiken angemessen zu bepreisen. Um Kenntnisse über die Risiken eines Kredites zu ermitteln, wird in der Praxis ein sogenanntes Ratingverfahren verwendet.
Es geht hierbei vor allem darum das Kreditrisiko und das Marktrisiko aus Kennzahlen (z.B. Bilanzkennzahlen eines Kunden) abzuschätzen und folgende Werte zu ermitteln:
- Ausfallwahrscheinlichkeit des Kunden im nächsten Jahr (PD = Probability of Default)
- Die erwartete Höhe der Forderung bei Ausfall im nächsten Jahr (EAD = Exposure At Default)
- Der aus der Forderung erwartete, verbleibende Ausfall (LGD = expected Loss at Given Default)
In einem Ratingmodell wird die logistische Regression und die Maximum-Likelihood-Methode benutzt, um eine Prognose der oben erwähnten Kriterien für neue Kunden basierend auf den Daten bestehender Kunden zu ermitteln. Somit kann der Kreditausfall (LGD) möglichst gering gehalten werden.
Einführung in die logistische Regression und Maximum-Likelihood-Methode
Die Wahrscheinlichkeit P(y), dass ein Kreditnehmer seinen zukünftigen Forderungen nicht nachkommt, kann folgender logistischer Funktion beschrieben werden. Diese nimmt einen Wertebereich von [0,1] ein, wobei 0 einer garantierten Krediterfüllung und 1 einem garantierten Kreditausfall entspricht:
Eine normale lineare Funktion, wie sie bei der linearen Regression verwendet wird, liefert einen Wertebereich von [-∞,+∞] und ist daher für den gegebenen Fall ungeeignet.
Die Optimierung des Modells an die Kunden- und Marktdaten geschieht in der Regel mit der Maximum-Likelihood-Methode. Diese berechnet die bedingte Wahrscheinlichkeit, dass das Modell die Kundendaten hinreichend genau beschreibt (Verw. Bayessische Wahrscheinlichkeiten). Hierfür muss die Wahrscheinlichkeit, dass ein Kreditnehmer ausfällt (yi = 1 für den Fall i), gegeben einer beliebigen Menge an Kennzahlen (xi), berechnet werden:
wobei die beliebige Menge an Kennzahlen im Parametervektor a zusammengefasst sind. Diese Kennzahlen beschreiben für die Analyse zusammengefasste Eigenschaften der Kunden, welche relevant für das Kreditrisiko sind (siehe Tabelle).
Tabellenüberschrift
Fall | Ausfall | Kennzahl 1 | Kennzahl 2 | … | Kennzahl n |
i | … | ||||
1 | 0 | 23.19 | 1.1 | … | 3.8 |
2 | 1 | 20 | 0.9 | … | 1.25 |
3 | 1 | 15 | 1 | … | 0.9 |
: | : | : | : | : | : |
: | : | : | : | : | : |
Kennzahlen beschreiben gewisse für die Bonität relevante Eigenschaften. Diese können beispielsweise das Einkommen, der Wohnort oder das Alter der Person sein. In der Praxis werden aufgrund der Einfachheit Kennzahlen die ähnliche Schwerpunkte beschreiben gerne zusammengefasst.
Im Zuge der Datenanpassung soll der Parametervektor a’ gefunden werden, welcher mit der logistischen Funktion die Ausfallwahrscheinlichkeiten der Kunden am besten beschreibt. Hierfür muss die Likelihood-Funktion L(a) maximiert werden:
wobei y die Ausfallwahrscheinlichkeit und x die Kennzahlen aller Fälle zusammengefasst darstellen. In der Praxis wird aufgrund der einfacheren Berechenbarkeit der natürliche Logarithmus der Likelihood-Funktion (log-Likelihood) maximiert. Dieser ergibt dasselbe Ergebnis a‘, da die ln-Funktion streng monoton steigend ist. Mit der Annahme, dass die Daten alle relevanten Informationen für den Fall y enthalten und nach einigen Umformungsschritten (Verw. auf Herleitung) ergibt sich die Formel:
mit:
und:
(log. Funktion). Aus dieser Formel lässt sich derjenige Parametervektor a’ bestimmen, welcher die Likelihood-Funktion maximiert und somit die Kundendaten am besten beschreibt.
Dieser Parametervektor wird nun für die Ermittlung der Ausfallwahrscheinlickeiten zukünftiger Kundendaten in ein Ratingmodell implementiert. Dieses wird im folgenden Abschnitt näher beschrieben.
Praktische Umsetzung und Implementierung eines Ratingmodells
Die Entwicklung und Implementierung eines Ratingverfahrens lässt sich grob in folgende Abschnitte unterteilen:
- Auswahl der Kundendaten
- Erstellung von Kennzahlen und Scoringfunktionen
- Durchführung der Maximum-Likelihood Methode
- Zuteilung der Ausfallwahrscheinlichkeiten zu verschiedenen Ratingklassen
- Entwicklung einer Endnutzersoftware
1. Für die Implementierung eines Ratingverfahrens in der Praxis ist es zunächst erforderlich, nur die für den Kreditausfall relevanten Kundendaten zu nutzen und diese dann mit der erforderlichen Qualität in einer einheitlichen Datenbasis abzulegen. Das Datenbankmodell sollte hierbei entsprechend der Anforderungen an die Analyse, Nutzung, etc. gewählt werden. Die relevanten Kundendaten werden in der Regel durch Abschätzungen von Experten oder durch die Berechnung kausaler Relevanz ermittelt. Wichtig ist hierbei vor allem, die Korrelation der einzelnen Kundendaten möglichst gering zu halten, um das Modell nicht unnötig zu verkomplizieren und die Abschätzungsfehler zu minimieren. Weiterhin sollten die Kundendaten so gewählt werden, dass es zu keiner systematischen Verzerrung kommt. Dies kann erreicht werden indem z.B. Kundendaten aus vielen verschiedenen Regionen betrachtet werden sowie ein angemessenes Verhältnis zwischen eingetroffenen und nicht eingetroffenen Kreditausfällen ausgewählt wird.
2. Die reinen Kundendaten werden dann in einem weiteren Schritt in Kennzahlen ausgedrückt bzw. zusammengefasst (siehe Scoringfunktionen), welche jeweils einen Informationsbereich abdecken. Diese werden dann für die Erstellung des Modells genutzt. Es ist hierbei wichtig, das Modell nicht zu kompliziert zu gestalten, d.h. zu viele Kennzahlen zu verwenden, da es ansonsten zu einem ‚Overfitting‘ kommt. Werden Modelle zu komplex, neigen sie dazu die Trainingsdaten sehr gut, aber neue Daten sehr schlecht zu beschreiben. Auf der anderen Seite sollten Modelle auch möglichst viele verschiedene Bereiche abdecken, um gute Aussagen liefern zu können (Optimierungsproblem).
3. Im nächsten Schritt wird ein Teil von Kundendaten für die Optimierung des Regressionsmodels verwendet (Trainingsdaten). Zur Validierung des Modells wird es im Anschluss an dem restlichen Pool von Kundendaten, welcher nicht für die Erstellung des Modells genutzt wurde, getestet. Hierbei ergibt sich auch eine Abschätzung des Modellfehlers.
4. Mit dem Modell können nun Ausfallswahrscheinlichkeiten zukünftiger Kunden berechnet werden. In der Praxis werden die Ausfallswahrscheinlichkeiten verschiedenen Ratingklassen zugeteilt, welche dann an verschiedene Kostenmodelle für die Kredite geknüpft sind.
5. In der finalen Phase der Entwicklung eines Ratingmodells, wird die Berechnungsgrundlage in eine Software implementiert, welche dann von den Bankangestellten für die Ermittlung der Ratingklasse eines Kunden genutzt werden kann. Hierbei sind in der Regel auch Schulungen notwendig, um den richtigen Gebrauch des Ratingmodells sicherzustellen.
Fazit
Ratingmodelle sind wichtige Werkzeuge für Banken und Versicherungen, um den Erfolg ihres Geschäftsmodells zu garantieren und Verluste zu minimieren. Die Einzelheiten der Entwicklung und Implementierung eines Ratingmodells sind in der Praxis sehr aufwändig und kompliziert. Es erfordert eine große Menge an interdisziplinärer Zusammenarbeit zwischen verschiedenen Unternehmensbereichen. Zum einen soll das Modell so implementiert sein, dass es sowohl die Kunden- und Marktdaten sinnvoll und effizient nutzen kann und akkurate Abschätzungen liefert. Zum Anderen muss die nötige Skalierbarkeit auf Modellierungs- und Hardwareebene gegeben, als auch vom Endbenutzer verständlich zu nutzen sein. Weiterhin sollte das Modell auch kontinuierlich gewartet und aktuell gehalten werden, damit die aktuelle Marksituation akkurat abgebildet wird. Damit sind die Banken in der Lage Kreditrisiken einzuplanen und sich an die gesetzlichen Vorgaben zu halten.