Eine empirische Analyse von 80.000 jährlichen Beobachtungen börsennotierter Unternehmen zeigt die Vorrangstellung des Konjunkturzyklus und des Sektorengagements bei der Vorhersage von Ausfällen
Makro-sektorale Faktoren dominieren Finanzkennzahlen.
Einleitung: Erklärbarkeit als Imperativ für Kredit- und Investitionsentscheidungen
Bei M&A-Transaktionen, Private-Equity-Geschäften und Unternehmensfinanzierungen bestimmt die Fähigkeit, das Ausfallrisiko eines Zielunternehmens zu antizipieren, die Qualität der Entscheidungsfindung. Traditionelle Kreditanalysemethoden stützen sich auf standardisierte Finanzkennzahlen (Verschuldung, Zinsdeckung, Liquidität), ergänzt durch eine qualitative Bewertung der Branche und des makroökonomischen Umfelds.
Machine Learning bietet heute die Möglichkeit, diese Intuitionen zu quantifizieren und Risikofaktoren objektiv zu priorisieren. Doch in einem regulierten Umfeld (EZB/EBA-Richtlinien zu internen Risikomodellen) und angesichts mehrerer Interessengruppen (Aufsichtsräte, Investitionsausschüsse, Regulierungsbehörden) ist die Anforderung an Interpretierbarkeit zentral: Ein „Black-Box”-Modell ist nicht auditierbar und daher nicht verwendbar.
Diese Studie wendet erklärbares Machine-Learning auf einen umfangreichen Datensatz von 80.000 jährlichen Beobachtungen von Unternehmen an, um die tatsächlichen Treiber des Unternehmensausfallrisikos zu identifizieren.
Methodik: Datensatz, Modelle und Metriken
Datenumfang
Der Datensatz umfasst 80.000 Unternehmens-Jahres-Beobachtungen von an der Nasdaq und NYSE notierten Unternehmen zwischen 2000 und 2018. Jede Beobachtung integriert:
Über 20 Finanzindikatoren: langfristige Schulden, EBITDA, EBIT, Nettoumsatz, Bruttomarge, Gesamtvermögen, Forderungen aus Lieferungen und Leistungen, Eigenkapital, operativer Cashflow usw.
Detaillierte Branchenklassifizierungen: Division (Makro-Sektor), Majorgroup (Mikro-Sektor), die eine feine Granularität des Industrieengagements ermöglichen.
Zielvariable: Ausfallstatus (binär), mit einem starken Klassenungleichgewicht, das für reale Kreditdaten typisch ist (Ausfälle machen weniger als 5% der Beobachtungen aus).
Verwendete Algorithmen
Mehrere Modellfamilien wurden getestet und verglichen:
Clustering (K-Means, DBSCAN) zur Identifizierung homogener Unternehmensprofile hinsichtlich des Risikos und zum Verständnis der latenten Datenstruktur.
Random Forest, ein robuster Ensemble-Algorithmus, der komplexe Interaktionen zwischen Variablen verarbeiten kann und native Variablenwichtigkeit liefert.
LightGBM, ein für große Datensätze optimierter Gradient-Boosting-Algorithmus, der bei unausgeglichenen Klassen durch Gewichtungstechniken gut funktioniert.
Neuronale Netze (mehrschichtiges Perzeptron) zur Erfassung subtiler nichtlinearer Beziehungen und zum Testen des Mehrwerts komplexerer Modelle.
SMOTE (Synthetic Minority Over-sampling Technique) zur Korrektur des Klassenungleichgewichts durch synthetische Generierung von Ausfallbeobachtungen, um so die Verzerrung der Modelle zur Mehrheitsklasse zu vermeiden.
Metriken: AUC und Precision-Recall
Im Kontext unausgeglichener Klassen ist die Gesamtgenauigkeit (Accuracy) eine irreführende Metrik. Ein naives Modell, das systematisch „kein Ausfall” vorhersagt, würde 95% Genauigkeit erreichen, wenn nur 5% der Unternehmen ausfallen, während es völlig nutzlos wäre.
Daher wurden zwei Metriken priorisiert:
AUC-ROC (Area Under the Receiver Operating Characteristic Curve): misst die Fähigkeit des Modells, zwischen gesunden und risikobehafteten Unternehmen zu unterscheiden, unabhängig vom gewählten Entscheidungsschwellenwert. Ein AUC von 0,85+ zeigt eine gute diskriminative Leistung an.
Precision-Recall-Kurve: betont die effektive Erkennung von Ausfällen. Die Präzision misst den Anteil echter Warnungen unter allen ausgegebenen Warnungen, während der Recall den Anteil der tatsächlich erkannten Ausfälle misst. Im M&A-Screening-Kontext ist das Übersehen eines Ausfalls (falsch negativ) kostspieliger als eine Fehlwarnung (falsch positiv).
Erklärbarkeit über SHAP (SHapley Additive exPlanations)
SHAP ist eine auf Spieltheorie basierende Methode, die jeder Variable einen marginalen Beitrag zur Vorhersage zuordnet, für jede Beobachtung. Konkret zerlegt SHAP die Modellvorhersage, indem es angibt, welche Faktoren zu einem hohen oder niedrigen Risiko führen und in welchem Ausmaß.
Diese Transparenz erfüllt drei kritische Anforderungen:
Regulatorische Konformität: EZB/EBA-Richtlinien verlangen, dass interne Kreditrisikomodelle validierbar und interpretierbar sind.
Vertrauen der Entscheidungsträger: Ein Aufsichtsrat oder Investitionsausschuss muss verstehen, warum ein Zielunternehmen als risikoreich eingestuft wird, über einen einfachen probabilistischen Score hinaus.
Umsetzbarkeit: Identifizierung von Hebeln zur Risikominderung (finanzielle Umstrukturierung, Branchendiversifizierung, Timing des Zyklus-Eintritts).
Empirische Ergebnisse: Die Hierarchie der Risikotreiber
Die SHAP-Analyse, aggregiert über den gesamten Datensatz, zeigt für den leistungsstärksten Algorithmus die folgende Hierarchie der zehn Haupttreiber des Ausfallrisikos (geordnet nach absolutem mittlerem SHAP-Wert):
1. fyear (Geschäftsjahr) — dominierender Faktor
2. division (Makro-Branchenklassifizierung)
3. majorgroup (Mikro-Branchenklassifizierung)
4. Langfristige Schulden
5. Ergebnis vor Zinsen, Steuern, Abschreibungen
6. Ergebnis vor Zinsen und Steuern
7. Nettoumsatz
8. Bruttomarge
9. Gesamtvermögen
10. Gesamtforderungen

Interpretation: Makro und Sektor vor Finanzkennzahlen
Dieses Ergebnis ist kontraintuitiv im Vergleich zur traditionellen Kreditanalysepraxis, die oft Finanzkennzahlen (Verschuldung, Rentabilität, Liquidität) in den Vordergrund stellt. Hier zeigen empirische Daten eine andere Realität: Der makroökonomische Kontext und das Sektorengagement sind die primären Determinanten des Ausfallrisikos, vor der intrinsischen finanziellen Gesundheit des Unternehmens.
1. Geschäftsjahr (fyear): Der Konjunkturzyklus als dominierender Treiber
Das Geschäftsjahr erfasst Konjunkturzykluseffekte über den Zeitraum 2000-2018: Finanzkrise 2008-2009, Verlangsamung 2015-2016, Expansion nach 2010. Ein perfekt geführtes Unternehmen mit soliden Finanzkennzahlen kann ausfallen, wenn es in einem zyklischen Sektor zum falschen Zeitpunkt im Zyklus tätig ist.
Implikation für M&A-Transaktionen: Das Timing des Eintritts in eine Transaktion ist entscheidend. Der Erwerb eines Zielunternehmens am Höhepunkt des Zyklus in einem zyklischen Sektor (Bauwesen, Rohstoffe, Transport) setzt ein deutlich höheres Ausfallrisiko aus als eine Akquisition am Tiefpunkt des Zyklus oder in einem antizyklischen Sektor.
Empirische Veranschaulichung: Stichproben-Unternehmen, die 2009-2010 ausfielen, hatten vergleichbare Finanzprofile wie überlebende Unternehmen, waren aber in zyklusempfindlicheren Sektoren tätig (Einzelhandel, Bauwesen, Finanzen). Das Geschäftsjahr allein erklärt einen erheblichen Teil der Ausfallvarianz.
2. Branchenklassifizierungen (division, majorgroup): Industrielles Engagement strukturiert das Risiko
Bestimmte Sektoren sind strukturell risikoreicher als andere, unabhängig von der Managementqualität der darin tätigen Unternehmen. Die Daten bestätigen diese Intuition:
Hochrisikosektoren: Branchen, in denen der Ausfall lauert
Kohlebergbau: Durchschnittliche Wahrscheinlichkeit ~0,55. Dieser Sektor ist stark abhängig von Rohstoffpreisen, die mit der globalen Nachfrage und dem Übergang zu erneuerbaren Energien schwanken. Hinzu kommen strenge Umweltvorschriften (z.B. Emissionsnormen) und hohe Kosten für die Gesundheit pensionierter Bergleute, was ein Rezept für Insolvenzen ergibt, wie bei mehreren US-Unternehmen im Zeitraum 2010-2020 zu sehen war.


Lokaler Personennahverkehr: Durchschnittliche Wahrscheinlichkeit ~0,50. Starker Wettbewerb durch Dienste wie Uber oder Privatfahrzeuge, kombiniert mit niedrigen Margen aufgrund fixer Kosten (Flottenwartung) und krisenempfindlicher Nachfrage (z.B. Einbruch nach COVID). Unzureichende öffentliche Subventionen und Kraftstoffinflation verschärfen die Vulnerabilität und führen zu kaskadierenden Insolvenzen im Stadtverkehr.
Wassertransportdienste: Durchschnittliche Wahrscheinlichkeit ~0,45. Wetterrisiken (Stürme, Überschwemmungen) stören den Betrieb, während globale Lieferketten zusätzliche Kosten verursachen (unbezahlter Treibstoff, wie im Hanjin-Fall 2016). Flottenüberkapazität und Abhängigkeit vom internationalen Handel verstärken Risiken bei Konjunkturabschwächung.


Öl- und Gasförderung: Durchschnittliche Wahrscheinlichkeit ~0,40. Extreme Abhängigkeit von Ölpreisen, volatil aufgrund von Geopolitik (z.B. Kriege oder OPEC) und grüner Transition. Betriebsrisiken (Unfälle, Explorationskosten) und hohe Schulden für Infrastruktur führen oft zu Umstrukturierungen, wie beim Preisverfall 2020.
Textilmühlenprodukte: Durchschnittliche Wahrscheinlichkeit ~0,35. Harter internationaler Wettbewerb (kostengünstiges Asien), volatile Lieferketten (Rohstoffe wie Baumwolle) und Nachhaltigkeitsdruck (z.B. Scheitern wie Renewcell 2024 aufgrund hoher Recyclingkosten). Nachfrageschwankungen in der Mode und Rohstoffinflation beschleunigen Insolvenzen.

Resiliente Sektoren: Branchen, die Krisen besser widerstehen

Kreditinstitute ohne Einlagengeschäft: Durchschnittliche Wahrscheinlichkeit ~0,20. Resilient dank strenger Bundesregulierung, die übermäßige Expositionen begrenzt, und Anpassung an Konjunkturzyklen durch Produkte wie alternative Kredite. Weniger von traditionellen Bankenkrisen betroffen, profitieren sie von günstigen Geldpolitiken.
Lederprodukte: Durchschnittliche Wahrscheinlichkeit ~0,18. Innovation in Nachhaltigkeit (z.B. umweltfreundliche Veredelungen) und lokale Lieferketten reduzieren Vulnerabilitäten. Der Sektor profitiert von Nischennachfrage (Luxus, Handwerk) und qualitätsfördernden Vorschriften, wodurch Insolvenzen trotz Wettbewerb seltener sind.


Eisenbahntransport: Durchschnittliche Wahrscheinlichkeit ~0,15. Unterstützt durch massive öffentliche Subventionen für Infrastruktur (z.B. US-Investitionen von 23 Milliarden jährlich) und Deregulierung 1980, die Effizienz steigerte. Essenzielle Logistik (Fracht) gewährleistet Resilienz gegenüber Schocks, im Gegensatz zu volatileren Modi.
.
Rechtsdienstleistungen: Durchschnittliche Wahrscheinlichkeit ~0,12. Konstante Nachfrage, sogar erhöht in Rezessionen (Insolvenzen, Umstrukturierungen, Rechtsstreitigkeiten). Anwälte profitieren von hohen Markteintrittsbarrieren (Qualifikationen) und schneller Anpassung an Krisen, wie in Rezessionen zu sehen, wenn Insolvenzpraktiken explodieren.


Fischerei und Jagd: Durchschnittliche Wahrscheinlichkeit ~0,10. Stabile Regulierungen (Quoten, Hilfe über Kapitel 12 für Landwirte/Fischer) und handhabbare Saisonalität mit lokalen Nischen. Trotz Umweltrisiken widersteht der Sektor durch Subventionen und konstante Nahrungsmittelnachfrage, was massive Insolvenzen vermeidet.
Das KI-Modell zeigt, wie Faktoren wie Preisvolatilität oder öffentliche Unterstützung das Insolvenzrisiko beeinflussen.
Implikation für Target-Screening: Vor der Analyse der Finanzberichte eines Zielunternehmens ist es unerlässlich, dessen Sektorenexposition zu qualifizieren. Ein Zielunternehmen mit hohem EBITDA in einem strukturell rückläufigen Sektor birgt ein höheres Risiko als ein Zielunternehmen mit durchschnittlichem EBITDA in einem Wachstumssektor.
3. Finanzkennzahlen: wichtig, aber kontextabhängig
Finanzkennzahlen (langfristige Schulden, EBITDA, EBIT, Umsatz, Bruttomarge, Vermögen, Forderungen) kommen nach makro-sektoralen Faktoren in der SHAP-Hierarchie. Dies bedeutet nicht, dass sie vernachlässigbar sind, sondern dass ihre Wirkung kontextabhängig ist.
Langfristige Schulden: Ihre relative Bedeutung (4. SHAP-Position) bestätigt, dass Refinanzierungsrisiko und Gläubigerdruck zentral bleiben. Ein verschuldetes Unternehmen in einem resilienten Sektor (Versorgung) birgt jedoch ein geringeres Risiko als ein gering verschuldetes Unternehmen in einem Krisensektor.
EBITDA, EBIT, Bruttomarge: Diese operativen Rentabilitätsindikatoren signalisieren Managementqualität und Wettbewerbspositionierung, aber ihre Vorhersagekraft wird durch Zyklus und Sektor moduliert.
Gesamtvermögen und Forderungen: Diese Größen- und Cash-Conversion-Zyklus-Variablen erfassen Liquiditäts- und Working-Capital-Management-Effekte, besonders kritisch in makroökonomischen Stressphasen.
Implikationen für die M&A-Praxis
1. Due Diligence: Makro-sektorales Risiko vor Finanzanalyse qualifizieren
Die Ergebnisse legen eine überarbeitete analytische Sequenz für das Target-Screening nahe:
Schritt 1 – Makro-sektorale Qualifizierung: Identifizierung der Exposition gegenüber dem Konjunkturzyklus (zyklischer vs. resilienter Sektor) und sektorale Positionierung (Wachstums-, reifer, rückläufiger Sektor).
Schritt 2 – Bedingte Finanzanalyse: Interpretation der Finanzkennzahlen im Lichte des makro-sektoralen Kontexts. Eine 5x-Verschuldung kann in einem stabilen Sektor mit vorhersehbaren Cashflows (Versorgung, Infrastruktur) akzeptabel sein, aber in einem zyklischen Sektor (Bauwesen, Rohstoffe) untragbar.
Schritt 3 – Kontextualisierte Stresstests: Modellierung von Stressszenarien unter Einbeziehung sektoraler Schocks (Rückgang der Branchennachfrage, technologische Disruption) und makroökonomischer Schocks (Rezession, Zinserhöhungen), nicht nur idiosynkratischer Schocks (Verlust eines Großkunden, Rechtsstreit).
2. Bewertung: Risikoprämien gemäß makro-sektoraler Exposition anpassen
In DCF-Bewertungsmodellen (Discounted Cash Flow), die bei M&A verwendet werden, integriert der Diskontierungssatz (WACC) eine Risikoprämie. Die SHAP-Ergebnisse legen nahe, dass diese Prämie entsprechend der makro-sektoralen Exposition kalibriert werden sollte, über das traditionelle sektorale Beta hinaus.
Beispiel: Ein Zielunternehmen im Sektor “Division X” (von SHAP als hochriskant identifiziert) sollte einen um 100-200 Basispunkte erhöhten WACC erhalten im Vergleich zu einem vergleichbaren Zielunternehmen in einem resilienten Sektor, selbst wenn die Finanzkennzahlen ähnlich sind.
3. Transaktionsstrukturierung: Schutzklauseln und Earn-out
Wenn die SHAP-Analyse eine starke Exposition gegenüber Zyklus und Sektor aufzeigt, kann die Transaktionsstrukturierung Schutzmechanismen integrieren:
Preisanpassungsklauseln: Indexierung des Endpreises auf makro-sektorale Indikatoren (Branchenindex, BIP-Wachstum, Rohstoffpreise).
Bedingtes Earn-out: Aufgeschobene Zahlung, die an die Leistung des Zielunternehmens gebunden ist, aber für makro-sektorale Effekte angepasst wird (EBITDA-Normalisierung im Verhältnis zum Branchendurchschnitt).
Garantien & Entschädigungen: Verstärkte Garantien bezüglich der makro-sektoralen Annahmen, die dem Businessplan zugrunde liegen.
4. Post-Akquisitions-Monitoring: Prädiktive Risiko-Dashboards
Für Investmentportfolios (Private Equity, Corporate Ventures) ermöglichen SHAP-Modelle die Konstruktion dynamischer Risiko-Dashboards:
Makro-sektorale Warnungen: Frühzeitige Erkennung der Verschlechterung des sektoralen Kontexts (sektoraler Stimmungsindex, Disruptionssignale).
Sich entwickelndes prädiktives Scoring: Vierteljährliche Aktualisierung des Ausfallrisiko-Scores unter Einbeziehung neuer Finanzdaten UND makro-sektoraler Entwicklungen.
Priorisierung von Interventionen: Konzentration der Wertschöpfungsbemühungen auf Beteiligungen, die gestressten Sektoren ausgesetzt sind, bevor sich die Finanzkennzahlen verschlechtern.
Modellleistung: Random Forest und LightGBM führend
Algorithmenvergleich
Im Testset sind die diskriminativen Leistungen (AUC-ROC) wie folgt:
Random Forest: AUC = 0,87 | Hohe Robustheit, native Interpretierbarkeit über SHAP.
LightGBM: AUC = 0,81 | Deutlich geringere Leistung, schnelles Training, korrekte Handhabung unausgeglichener Klassen.
Neuronale Netze: AUC = 0,80 | Vergleichbare Leistung, aber höhere Komplexität und geringere Interpretierbarkeit.
Clustering + Regeln: AUC = 0,79 | Deskriptiver Ansatz nützlich für Portfolio-Segmentierung, aber geringere prädiktive Leistung.
Der Leistungs-Erklärbarkeits-Kompromiss
Random Forest bietet den besten Kompromiss: Spitzen-Vorhersageleistung, reduziertes Overfitting-Risiko, einfache Hyperparameter-Optimierung und Erklärbarkeit über SHAP.
Grenzen und Anreicherungsperspektiven
Methodologische Grenzen
Zeitlicher Umfang: Der Datensatz endet 2018, vor der COVID-19-Pandemie, der Inflation nach 2021, den jüngsten geopolitischen Spannungen und der beschleunigten Energiewende. Makro-sektorale Muster haben sich weiterentwickelt.
Geografischer Umfang: Nur Nasdaq und NYSE. Risikodynamiken unterscheiden sich erheblich in Europa (unterschiedliche Regulierung, Finanzierungsstrukturen), Asien oder Schwellenländern.
Fehlende Variablen: Kritische qualitative Faktoren, die in strukturierten Finanzberichten nicht erfasst werden: Managementqualität, Governance, laufende Rechtsstreitigkeiten, ESG-Exposition, Patente und F&E, Kunden-Lieferanten-Konzentration.
Anreicherungswege
Alternative Daten: Integration von Textdaten (NLP auf Jahresberichte, Earnings-Call-Transkripte, Branchenpresse) zur Erfassung der Marktstimmung und früher Verschlechterungssignale.
ESG-Daten: ESG-Scores entwickeln sich zu Resilienzprädiktoren (solide Governance, Klimarisikomanagement). Ihre Integration würde die Vorhersage für Übergangssektoren (Energie, Automobil) verbessern.
Dynamische Modelle: Vorhersage von Risikotrajektorien (zeitliche Entwicklung des Scores) statt jährlicher Momentaufnahmen. Nützlich zur Antizipation fortschreitender Verschlechterungen.
Branchenspezialisierung: Training dedizierter Modelle nach industrieller Division zur Erfassung spezifischer Geschäftslogiken (z.B. hängt das Risiko im Luftfahrtsektor stark vom Kerosinpreis und Passagieraufkommen ab, Variablen, die im generischen Modell fehlen).
Schlussfolgerung: Auf dem Weg zu KI-verstärkter Due Diligence
Diese empirische Studie über 1,6 Millionen Finanzbeobachtungen zeigt, dass das Unternehmensausfallrisiko zuerst durch die Linse des Konjunkturzyklus und der Sektorenexposition verstanden wird, vor traditionellen Finanzkennzahlen. Dieses Ergebnis, kontraintuitiv im Vergleich zur standardmäßigen Kreditanalysepraxis, ist robust über mehrere Machine-Learning-Modellfamilien hinweg.
Für M&A- und Private-Equity-Transaktionen ist die Implikation strategisch: Die Qualifizierung des makro-sektoralen Risikos muss der Finanzanalyse vorausgehen, und Bewertungen müssen Risikoprämien integrieren, die auf diese Faktoren kalibriert sind.
Die Modellerklärbarkeit über SHAP ist kein technischer Luxus, sondern ein operatives Muss: Sie verwandelt probabilistische Vorhersagen in umsetzbare Erkenntnisse für Investitionsausschüsse, Aufsichtsräte und Regulierungsbehörden.
Erklärbare KI ersetzt nicht die Fachkompetenz, sie verstärkt sie: Sie quantifiziert Intuitionen, enthüllt mit bloßem Auge unsichtbare Muster und bietet einen rigorosen Rahmen für Entscheidungsfindung in komplexen und regulierten Umgebungen.
Dieses Projekt ist das Gegenteil einer Black Box. Der Quellcode ist zugänglich auf github.