KI-Tools ermöglichen heute etwas, das vor wenigen Jahren noch völlig unrealistisch klang: Aus unterschiedlichsten digitalen oder analogen Ausgangsformen lassen sich innerhalb von Sekunden glaubwürdige architektonische Szenarien entwickeln. Moderne Modelle erkennen geometrische Muster, räumliche Beziehungen und Materialanmutungen allein anhand einfacher visueller Inputs – und übersetzen diese in komplexe Architekturkompositionen mit erstaunlich realistischer Lichtstimmung und Tiefe.
Um dieses Potenzial praktisch zu untersuchen, habe ich bewusst mit sehr heterogenen 3D-Geometrien und Objektformen gearbeitet – von einfachen kubischen Volumen bis hin zu frei verzogenen oder fragmentierten Shapes. Ergänzt wurden diese Inputs durch Aufnahmen alltäglicher Gegenstände und Modellfotografien, die im späteren Artikel detailliert beschrieben werden.
Gerade diese Vielfalt an Ausgangsmaterial zeigt eindrucksvoll, wie flexibel KI-Tools in der frühen Phase des architektonischen Entwerfens eingesetzt werden können: Die KI interpretiert Silhouetten, abstrahiert Formen, schlägt plausible Materialitäten vor und erzeugt visuelle Atmosphären, die sich oft eher wie frühe Konzeptstudien anfühlen als wie zufällige KI-Experimente.
Für mein eigenes Projekt kombinierte ich verschiedene Systeme: FLUX/Depth zur Forminterpretation, ChatGPT für die realistische Bildnachbearbeitung und Krea.ai für die Erzeugung kurzer Videos, die die Konzepte atmosphärisch erweitern.
Objekt 1 – Einfaches 3D-Objekt

Das Original Bild (Objekt 1)
Ausgangsbasis war ein sehr simples 3D-Objekt – ein reduziertes, nahezu abstraktes Volumen ohne besondere architektonische Hinweise. Gerade dieses Minimalniveau macht den Test interessant: Die KI muss aus fast nichts eine bauliche Idee ableiten.
Ich nutzte zunächst Prompts wie:
-
Modern Concrete-Wood House
-
Hi-Tech Modern House
-
Glass Concrete House
Diese Variationen dienten dazu, unterschiedliche Fassadensprachen und Materialrichtungen zu testen. FLUX generierte daraufhin mehrere Vorschläge, die trotz der einfachen Ausgangsform erstaunlich unterschiedliche Architekturstile hervorbrachten.
Die rohen KI-Bilder waren visuell spannend, aber konstruktiv und atmosphärisch noch unausgereift. Die Nachbearbeitung durch ChatGPT brachte einen klaren Qualitätssprung: Materialität wurde glaubwürdiger, die Proportionen stimmiger, die Beleuchtung realistischer. Am Ende wirkte das Gebäude wie ein greifbarer Konzeptentwurf – geeignet für ein erstes Ideengespräch oder ein internes Designmeeting.

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 1)

Die Ergebnisse durch Nachbearbeitung von ChatGPT ( Objekt 1)
Objekt 2 – Komplexere Cubatur
Das zweite Objekt war deutlich anspruchsvoller: mehrere ineinandergreifende Volumen, verschobene Ebenen und komplexere Proportionen. Dadurch musste die KI stärker interpretieren und entscheiden, welche Elemente tragend, dekorativ oder raumbildend sind.
Ich arbeitete mit Prompts wie:
-
Modern Building
-
Modern Glass Building
-
Glass-Wood Building
-
Glass-Steel Building
Die ersten Ergebnisse waren gestalterisch spannend, aber teilweise fehlerhaft – z. B. unlogische Fensterflächen, zu dünne Decken oder verzerrte Materialien. ChatGPT konnte diese Mängel sehr gut korrigieren: Tragfähige Proportionen, klare Fassadenraster und eine glaubwürdige Materialästhetik entstanden. Das Resultat war ein Gebäude, das man sich problemlos in einer realen Umgebung vorstellen könnte.

Das Original Bild (Objekt 2)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 2)


Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 2)
Objekt 3 – Finpappe-Modell
Das erste Finpappe-Modell war sehr rudimentär und bot der KI nur wenige architektonische Hinweise. Dadurch musste das System viele Entscheidungen selbst treffen: Wie interpretiert man eine Fläche? Ist sie Wand, Dach, Dachüberstand oder Terrasse?
FLUX testete verschiedene Ansätze, erzeugte aber oft eher konzeptuelle Volumenstudien als fertige Gebäudeentwürfe. Die Ergebnisse waren solide, aber weniger charakterstark. Genau deshalb entschied ich mich, zum nächsten Modell weiterzugehen – hier ging es eher darum zu beobachten, wie die KI mit schwachen, unpräzisen Inputs umgeht.

Das Original Bild (Objekt 3)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 3)
Objekt 4 – Weiteres Finpappe-Modell
Das zweite Modell bot eine klarere Geometrie und funktionierte deutlich besser. FLUX erzeugte aus der Grundform ein glaubwürdiges Einfamilienhaus mit zeitgenössischer Fassadensprache. Die Proportionen wirkten harmonischer und die Interpretation der Flächen – Wand, Fenster, Dach – war nachvollziehbar.
ChatGPT übernahm anschließend die Feinarbeit: realistischere Materialien, Korrektur kleiner Widersprüche und bessere atmosphärische Wirkung. Einige logische Fehler blieben erhalten (z. B. Elemente, die auf Dachterrassen strukturell keinen Sinn ergeben), doch sie zeigen gut, wo KI-Tools heute noch an Grenzen stoßen.

Das Original Bild (Objekt 4)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 4)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 4)
Objekt 5 – Komplexes 3D-Objekt mit schwebenden Teilen
Dieses Objekt gehörte zu den herausforderndsten: mehrere voneinander abgelöste Kuben schwebten frei im Raum – eine Form, die statisch natürlich keinen Sinn ergibt.
Phase 1 – KI-Tools (Flux/Depth):
Die erste Umwandlung erzeugte eine spannende, fast skulpturale Architekturkomposition. Der Charakter der aufgebrochenen Würfel war gut getroffen, aber die Stützen, Übergänge und tragenden Elemente fehlten komplett. Vieles wirkte eher wie ein Kunstobjekt als ein Gebäude.

Das Original Bild (Objekt 5)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 5)
Phase 2 – ChatGPT (Nachbearbeitung):
Ich markierte die schwebenden Kuben farbig und skizzierte grob tragende Elemente. ChatGPT reagierte präzise und verstand die Hinweise erstaunlich gut:
– massive, logisch positionierte Stützen
– realistisch dimensionierte Übergänge
– begehbare Stege
– klare Verbindungspunkte zwischen den Modulen
Am Ende entstand eine Version, die den fragmentierten Charakter des Ursprungsobjekts behält, aber architektonisch nachvollziehbarer wird. Die KI verwandelte ein frei schwebendes 3D-Objekt in eine modulare, funktional denkbare Struktur – ohne die ursprüngliche Idee zu verlieren.


Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 5)
Objekt 6 – Explodierende Sphäre
Dieses Objekt bestand ursprünglich aus einer filigranen, netzartigen Kugelstruktur. Die KI übernahm diese leichte Geometrie erstaunlich gut und verwandelte sie in zwei sehr unterschiedliche, aber stimmige architektonische Interpretationen.
In der ersten Version platzierte die KI die Struktur in einem riesigen, glasartigen Trichter – fast wie eine technische Installation oder ein experimentelles Forschungsgebäude. Die Transparenz und die räumliche Tiefe blieben erhalten, nur die Materialität wurde architektonisch übersetzt.
In der zweiten Variante entstand eine große freistehende Kugel auf einer runden Plaza, eingebettet in ein städtisches Raster. Hier wurde das Objekt deutlich massiver interpretiert, blieb aber in seiner Geometrie gut erkennbar.
Beide Ergebnisse sind weniger als klassische Gebäude nutzbar, funktionieren aber hervorragend als Landmark, Kunstobjekt oder architektonisches Icon. Gerade dieses Objekt zeigt, wie gut KI den Charakter einer komplexen Struktur erfassen und in glaubwürdige architektonische Szenarien überführen kann.

Das Original Bild (Objekt 6)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 6)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 6)
Das Ergebnis war atmosphärisch so stark, dass ich ein Kameraflug-Video in Krea.ai erzeugte, welches die Formwirkung noch besser vermittelt.
Objekt 7 – Sphäre mit Innenstruktur
Im Gegensatz zum vorherigen Objekt lag hier der Fokus auf der inneren Struktur der Sphäre. Die äußere Form war eher zurückhaltend.
Beide KIs interpretierten die Innenstruktur als zentrales architektonisches Element – etwa wie ein tragender Kern oder ein raumbildendes Ornament. Als Gebäude wäre die Nutzung schwierig, aber als Landmarke, Pavillon oder Kunstraum funktioniert die Idee erstaunlich gut.

Das Original Bild (Objekt 7)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 7)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 7)
Objekt 8 – Martini-Glas
Ein einfaches Foto eines Martini-Glases diente hier als Ausgangsform – und genau diese klare, konische Silhouette machte es zu einer idealen Vorlage für ein KI-Hochhaus. Die Transformation war erstaunlich präzise: Die KI übernahm die elegante Trichterform, verlängerte den Stiel in eine tragende Turmstruktur und entwickelte daraus ein futuristisches, fast skulpturales Landmark.
ChatGPT half anschließend, Materialität und Maßstab zu klären, sodass aus einem alltäglichen Objekt eine glaubwürdige architektonische Vision entstand. Besonders spannend ist, wie gut die KI die Proportionen interpretiert hat: nicht 1:1, aber charakterlich sehr nah – genug, um die Herkunft sofort wiederzuerkennen, ohne dass es trivial wirkt.
Das Ergebnis: Ein extrem ikonisches, fast utopisches Hochhaus, das zeigt, wie frei KI Formen übertragen und dennoch architektonisch lesbar machen kann.

Das Original Bild (Objekt 8)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 8)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 8)
Objekt 9 – Komplexes 3D-Objekt
Bei diesem Objekt ging es um eine komplexe, ringartige 3D-Form mit überlappenden Kurven und transparenten Ebenen. Die KI erkannte die dynamische Bewegung der ursprünglichen Geometrie erstaunlich gut und verwandelte sie in eine Architektur mit starkem ikonografischem Charakter. Die erste Variante wurde zu einem expressiven Holzbau mit rhythmischen Öffnungen und präzisen Kanten, der die kreisenden Linien des Ausgangsobjekts räumlich weiterführt. Die zweite Version interpretierte dieselben Formen als markante Glas-Stahl-Struktur, die wie ein technisches Landmark im Stadtraum wirkt.
Trotz klar unterschiedlicher Materialien blieb der gestalterische Kern erhalten: Kreisbewegungen, ineinandergreifende Linien und ein sehr skulpturaler Aufbau. Die KI hat hier keine Kopie erzeugt, sondern eine architektonische Übersetzung, die sich logisch anfühlt und trotzdem experimentell bleibt. Gerade dieses Objekt zeigt, wie gut KI aus abstrakten Formen funktionale, aber charakterstarke Gebäudetypen entwickeln kann.

Das Original Bild (Objekt 9)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 9)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 9)
Auch hier entstand ein kurzes animiertes Video, das die räumliche Wirkung noch besser transportiert.
Objekt 10 – Abstraktes Objekt
Das Ausgangsobjekt war eine stark abstrahierte, fließende 3D-Form mit klarer räumlicher Dynamik. Genau diese Grundstimmung hat die KI sehr gut erkannt und in einen architektonischen Ansatz übersetzt. Statt die Form zu kopieren, wurden ihre wichtigsten Eigenschaften – die geschwungene Silhouette, die weichen Übergänge und die offene, organische Bewegung – in eine plausible Gebäudegeometrie überführt.
Die Nachbearbeitung durch ChatGPT verstärkte anschließend Materialität, Lichtwirkung und Raumtiefe, sodass aus dem abstrakten Ausgangsobjekt eine glaubwürdige, räumlich funktionierende Architekturstudie entstand.
Wichtig dabei: Der ursprüngliche Charakter blieb deutlich spürbar, trotz der notwendigen architektonischen Anpassungen.

Das Original Bild (Objekt 10)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 10)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 10)
Objekt 11 – Foto aus meiner Umgebung
Für dieses Experiment habe ich zum ersten Mal rein fotografische Inputs verwendet: ein Cocktail-Shaker aus Edelstahl und eine einfache Trinkflasche mit Farbverlauf. Beide Objekte standen ohne besonderen Hintergrund auf meinem Küchenherd. Gerade diese Banalisierung war bewusst gewählt – ich wollte testen, wie KI-Tools reagieren, wenn keinerlei architektonische Hinweise vorhanden sind und die Form allein über das Foto vermittelt wird.
Die KI übernahm die Grundsilhouetten der Objekte – die konische Form des Shakers und den zylindrischen Körper der Flasche – und übersetzte sie in glaubwürdige Fassadenraster, Glasstrukturen und Proportionen. Nach der optischen Nachbearbeitung durch ChatGPT wirkten beide Modelle wie real existierende Türme in einer Großstadt.
Dieses Beispiel zeigt besonders gut, wie zuverlässig KI selbst alltägliche Formen erkennen und in architektonische Konzepte transformieren kann.

Das Original Bild (Objekt 11)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 11)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 11)
Objekt 12 – Foto eines kleinen Geräts
Aus einem einfachen Foto eines kleinen Headphone-Amps entstand ein überraschend plausibles Gebäude. Die klare, rechteckige Form des Geräts wurde von der KI direkt als kompakter Baukörper interpretiert, während die vier Drehregler oben als technische Aufbauten auf dem Dach erschienen.
Mit der Nachbearbeitung durch ChatGPT wurden Glas, Struktur und Umgebung deutlich realistischer. Das Ergebnis wirkt wie ein kleiner Forschungs- oder Technikbau – und zeigt gut, wie selbst banale Alltagsobjekte zu funktionierenden architektonischen Volumen werden können.

Das Original Bild (Objekt 12)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 12)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 12)
Objekt 13 – Abstrakte Form, schwierige Übersetzung
Das letzte Objekt war eine stark fragmentierte 3D-Form, die visuell interessant, aber schwer eindeutig zu lesen war. Die KI erzeugte daraus zwar hochwertige Fassaden und stimmige Gebäudetypologien, doch der ursprüngliche Charakter des Objekts ging weitgehend verloren.
Gerade dieses Beispiel zeigt, dass KI nicht mit jeder Form souverän umgehen kann:
Wenn die Ausgangsgeometrie zu abstrakt oder in sich widersprüchlich ist, priorisiert das System Realismus gegenüber formaler Treue. Das Ergebnis wirkt dann zwar architektonisch sauber, aber weniger wie eine direkte Weiterentwicklung des Ausgangsobjekts.
Trotzdem bleibt es wertvoll im Prozess — denn es zeigt klar, wo die Grenzen liegen und wo menschliche Kontrolle wieder notwendig wird.

Das Original Bild (Objekt 13)

Die Ergebnisse durch Bearbeitung von FLUX Krea (Objekt 12)

Die Ergebnisse durch Nachbearbeitung von ChatGPT (Objekt 13)
Fazit:
KI-Tools eröffnen der Architektur eine völlig neue Art des schnellen, visuellen Experimentierens. Ohne komplexe CAD-Modelle oder lange Renderprozesse lassen sich räumliche Ideen innerhalb von Sekunden generieren, variieren und atmosphärisch durchspielen. So entsteht eine frühe Entwurfsphase, die freier, mutiger und experimenteller wird als je zuvor.
Trotz aller Fortschritte bleibt klar: Die Ergebnisse sind visuelle Vorschläge – keine baubaren Gebäude. Tragwerk, Konstruktion, Normen oder Grundrisse werden nicht automatisch korrekt erzeugt. Und natürlich gibt es Momente, in denen die KI Elemente falsch interpretiert oder stilistische Details ungenau darstellt.
Dennoch trifft die KI erstaunlich zuverlässig den gestalterischen Charakter, die Grundidee und die räumliche Intention eines Inputs. Selbst wenn einzelne Details nicht perfekt sind, gelingt es ihr oft, die konzeptionelle Qualität eines Entwurfs überraschend klar herauszuarbeiten. In vielen Fällen entsteht dadurch ein Bild, das schon wie eine authentische Vision wirkt – und das, obwohl der Ausgangspunkt vielleicht nur ein simples Objektfoto oder eine grobe 3D-Form war.
Durch die Kombination verschiedener KI-Werkzeuge – in meinem Fall insbesondere FLUX/Depth für die formale Übersetzung, ChatGPT für realistische Nachbearbeitung und Krea.ai für atmosphärische Videosequenzen – lassen sich Visualisierungen erzeugen, die beeindruckend nah an klassischen Renderings liegen und hervorragend für Moodboards, Zwischenschritte, Präsentationen oder Wettbewerbsphasen geeignet sind.
Für Architektinnen und Architekten bedeutet dies:
KI ersetzt das Entwerfen nicht – aber sie erweitert es radikal.
Sie wird zu einem kreativen Beschleuniger, einem Werkzeug für neue Perspektiven und einer intuitiven Plattform, die Ideen schneller sichtbar macht, ihren Charakter erhält und die Entwicklung räumlicher Konzepte inspirierend unterstützt.