Aktuell sind über 10 Millionen Deutsche zwangsweise in Kurzarbeit. Gleichzeitig sind die Angebots- und Bestandsmieten in den Metropolen in den letzten Jahren teilweise gestiegen. Das hat verschiedene Folgen für die Mietwohnungsmärkte. Um diese besser einschätzen zu können, haben wir eine KI-basierte Analyse durchgeführt.
Die KI von PREA ist: mercury. Mit Hilfe von modernsten Datenbanktechnologien und Algorithmen erkennt, analysiert und prognostiziert mercury alle wichtigen Szenarien der Immobilienwelt. Durch mercury sind wir von PREA in der Lage die kleinsten Veränderungen am Immobilienmarkt zu erkennen und auszuwerten, sodass diese die zukünftigen Investmentchancen optimieren.
Unter Verwendung aktueller Daten zu Mietangeboten in Verbindung mit soziodemographischen Daten von 2019 haben wir ein Modell entworfen, trainiert und angewandt, um den Anteil der Haushalte innerhalb eines bestimmten Breiten- und Längengrades und Radius vorherzusagen, die mehr als 50% ihres Einkommens an Miete zahlen würden – unter der extremen Annahme, dass alle Haushalte nur noch 60% ihres ursprünglichen Gehalts verdienen. Zur Berechnung der Risikoniveaus gehen wir wie folgt vor: Für alle reduzierten Einkommen pro Haushalt, d.h. das 0,6-fache des Einkommens, abzüglich der Miete, und zählen die Anzahl derjenigen - für jedes Angebot - die mehr als 50% ihres reduzierten Einkommens an Miete zahlen. Anschließend, teilen wir die Anzahl der betroffenen Haushalte durch die Gesamtanzahl der Haushalte, womit wir unseren gesuchten Anteil erhalten.
Unser Ziel war es, dass unser Modell folgende Informationen zur Vorhersage heranzieht: Miete, Breitengrad, Längengrad und Fläche. Dies ist wichtig, da der Standort ein wesentliches Merkmal für die Kartierung, die Fläche für die Bestimmung der Gesamtzahl der Haushalte und die Miete als Faktor für die Skalierung des Modells ist; höhere Mieten führen zu mehr Betroffenen. Auf diese Weise kann auch ermittelt werden, an welchen Standorten Mietreduzierungen oder -zuschüsse für eine Entlastung der Haushalte sorgen dürfte.
In dem Modell trainieren wir den Mittelpunkt des Wohnquartiers und der Fläche, die aus dem Wohnquartier errechnet wurde. Die analysierten betroffenen Haushalte haben die Eigenschaften der Tweedie-Verteilung, in denen die Mehrheit der Haushalte von keinem Risiko betroffen ist. Die, die von einem Risiko betroffen sind, folgen einer Poisson-Verteilung.
Das trainierte Modell ist ein Boosted-Decision-Tree ausgestattet mit einer Tweedie-Zielsetzung, die eine Ensemble-Version eines Tree-Based-Modells ist. Unser Ansatz war aufgrund der verschiedenen Datentypen notwendig: Eine Normalisierung hätte somit die Interpretierbarkeit verhindert. Ein solches Random-Forest-Modell verwendet intuitive und erklärbare Schritte zur Aufteilung auf Grundlage binärer Fragen. Hierzu ein Beispiel: Ist die Miete im Schnitt höher als 400 Euro je Monat, und wenn ja, ist der Breitengrad kleiner als 52? Ist dies der Fall, erwarten wir an diesem Standort mit einer Miete von 200, dass 5% der Haushalte gefährdet sind. Der hinzukommende Bonus, dieses Modells liegt in der Interpretierbarkeit eines visuellen Baumdiagramms.
Wir haben unser Modell an sieben Standorten in Deutschland trainiert: Frankfurt am Main, Köln, München, Berlin, Stuttgart, Hamburg und Düsseldorf.
Zusätzlich wird ein Faktor der Extremität berechnet, d.h. der beschränkte monatliche Einkommensanteil von 0,6. Die Metriken zur Messung der Modellleistung waren in diesem Fall der R2 Score und der mittlere absolute Fehler (MAE). R2 bestimmt den Prozentsatz der Varianz, der durch das Modell erklärt wird. MAE ist der Abstand von getesteten Stichproben zu vorhergesagten Stichproben. Über alle 7 Modelle mit K-facher Kreuzvalidierung, wobei k = 10, waren die Durchschnittswerte für alle 70 Vorhersagen: 0,95 und 0,5% Abweichung für R2 bzw. MAE. Das bedeutet, dass es bei jeder Vorhersage eine Abweichung von 0,5% existiert. Zusätzlich wurden BIC und AIC Werte aufgenommen, um die Performance des Modells von anderen nutzbaren Informationen zu bestätigen.
Der Nachteil eines solchen Modells ist eine verzerrte Darstellung: Wir gingen von der Annahme aus, dass jeder Mensch eingeschränkt arbeitet. Diese Annahme ist nicht realistisch. Vielmehr zeigt das Modell mögliche Risiken in Form eines Worst-Case-Szenarios auf, über das sich Investoren informieren können. In Zukunft kann durch die Sammlung aktueller Beschäftigungsdaten ein noch präziseres Modell entwickelt werden. Zusätzlich beeinflussen regionale Verzerrungen die Vorhersagen aufgrund der Eigenschaften eines Tree-Based-Modells. Das Gebiet ist außerdem so verzerrt, dass es zirkulärer Natur ist, welches in der Realität nicht der Fall ist. Trotz hoher Punktzahlen sollte dieses Modell mit Sorgfalt verwendet werden.
Die Risikoanalyse von PREA liegt für die 7 größten deutschen Städte bereit.
Der Download steht für Sie als PDF-Dokument zur Verfügung.