Bildgenerierung mit WAN 2.2: Was das Open Source Modell drauf hat

Katharina
August 14, 2025

Wenn du gerade von unserem WAN 2.2 Video‑Blogbeitrag kommst, weißt du schon, was dich erwartet.
Wenn nicht – kein Problem. Hier bekommst du den zweiten Teil unseres Tests. Diesmal geht’s um die Bildgenerierung mit WAN 2.2, und die ist – kein Witz – richtig stark.

Warum? Weil WAN 2.2 nicht nur in der Videogenerierung überzeugt, sondern auch bei Standbildern extrem abliefert: realistische Hauttöne, fotorealistisches Licht, klar definierte Materialien.

Falls du erstmal das Video sehen willst: Hier geht’s zum Beitrag →

Und jetzt viel Spaß mit dem praktischen Deep Dive in die Bildgenerierung mit WAN 2.2 – inklusive Beispielen, Setup und echten Learnings aus dem Test.

Kurz vorgestellt: Was ist WAN 2.2?

WAN 2.2 ist ein generatives Modell für Video und Standbild. Für Fotos wirkt es erstaunlich „echt“: Hauttöne bleiben natürlich, Licht verhält sich plausibel und Materialien zeigen feine Texturen. Der Look ist eher neutral‑fotografisch und funktioniert deshalb für Porträt, Produkt und Interior gleichermaßen. Die Modelle stehen unter Apache 2.0 – das bedeutet breite kommerzielle Nutzungsrechte (Marken‑ und Persönlichkeitsrechte sind natürlich weiterhin zu beachten). In der Praxis arbeiten wir dafür am liebsten mit ComfyUI.

So nutzt du WAN 2.2 mit ComfyUI:

Du brauchst lediglich ComfyUI, die WAN 2.2‑Modelle und einen fertigen Workflow. Installiere ComfyUI, lade die Modelldateien von der offiziellen WAN‑Seite und öffne anschließend unseren Text‑to‑Image-Workflow per Drag‑&‑Drop. Tipp: Starte mit einer moderaten Bildgröße, zum Beispiel 1024 px Kantenlänge, und erhöhe danach schrittweise.

Modelle & Hinweise: https://comfyanonymous.github.io/ComfyUI_examples/wan22/
Workflow (Drag‑&‑Drop): https://www.contentmarketingmitki.de/wp-content/uploads/2025/08/Wan2.2_Text-To-Image.json

ComfyUI sucht Modelle in Unterordnern wie models/unet/, models/vae/ und models/text_encoders/. Für die großen 14B‑Modelle brauchst du High‑Noise und Low‑Noise – so erhältst du stabile Formen und feine Details.

Showcase: Was alles möglich ist

<nerdmodus>
Unsere Bildtestreihe entstand mit ComfyUI und dem oben verlinkten Workflow und Settings. Erstes Sampling mit dem High Noise Model, das zweite mit Low Noise. Durch diese Kombination entstehen Bilder, die beim Thema Detailreichtum und Korrektheit von Details seines Gleichen suchen.

Generiert wurden die Bilder mit einer Auflösung von 1440×1800 Pixel – und jetzt kommts: Jedes Bild braucht dabei in diesen Settings 8 Minuten auf einer RTX 6000 Ada. Gerade beim Thema Performance ist noch Luft nach oben – aber die Open Source Community arbeitet bereits daran und verfolgt gerade verschiedene Ansätze mit Lightning LoRAs, Sageattention-Optimierung und anderen innovativen Workflows. Auch die Kombination aus Qwen Image für ersten Sampling Step und zweitem Sampling-Step mit WAN 2.2 Low Noise sieht bisher vielversprechend aus.

</nerdmodus>

1) Porträtfotografie – natürlich & detailliert

WAN 2.2 kann Haut glaubwürdig wiedergeben. Nutze weiches Fensterlicht oder eine große Softbox und bleib beim Stil sparsam.

2) Lifestyle & Performance

3) Interior & Architektur

4) Natur, Landschaft & Luftaufnahmen

5) Makro & Material

6) Sci-Fi, Space & Concept

7) Illustration, Branding & Grafik

Heads-up: Georgs LoRA Experimente auf Basis von WAN 2.2 liefern auffallend konsistente Porträts. Nächstes Mal verraten wir Training, Prompt-Rezepte und Best Practices. (Link folgt)

Unser Expertenfazit

WAN 2.2 setzt in der reinen Bildgenerierung ein starkes Zeichen: Porträts überzeugen mit natürlicher Haut und glaubwürdigen Catchlights, Produkte zeigen saubere Kanten und kontrollierte Reflexe, Materialien wirken dank klarer Mikrostruktur sehr real. Der neutrale Fotolook macht die Ergebnisse vielseitig einsetzbar – vom Webshop bis zum Editorial. Die Kehrseite: Die großen Modelle sind rechenintensiv und fühlen sich aktuell am besten in ComfyUI an. Wer sofort testen möchte, lädt die WAN‑Modelle von der offiziellen Seite (Modelle & Beispiele → https://comfyanonymous.github.io/ComfyUI_examples/wan22/) und öffnet unseren Text‑to‑Image‑Workflow per Drag‑&‑Drop (Workflow → https://www.contentmarketingmitki.de/wp-content/uploads/2025/08/Wan2.2_Text-To-Image.json). Einmal starten, mit moderater Auflösung beginnen – fertig.

Unsere Schulungsangebote

Wir arbeiten gerade an einer neuen Ausbildung zum Diffusion Engineer. Wenn du also richtig tief abgeholt werden willst, melde dich schonmal vorab per Email. Bis dahin bieten wir individuelle Unternehmens-Seminare an, bei denen wir auch ComfyUI Schulungen für ganze Design- und Marketingteams durchführe. Wenn du also wissen willst wie man mit WAN 2.2 eigene Bilder produzieren, können wir für dich und deine Abteilung ein individuelles Seminar konzipieren. Die Erfahrungen aus 100+ Seminaren in deutschen Organisationen lügen nicht. Hier findest du alle Infos und Anfragemöglichkeiten zu unseren individuellen KI Fortbildungen und Seminaren für Unternehmen.

Fazit

WAN 2.2 bringt Standbilder sehr nah an professionelle Fotografie: natürliche Haut, plausibles Licht, saubere Kanten und feine Mikrotexturen – bei einem neutralen, gut steuerbaren Look. Porträt, Produkt, Material, Interior, Food und Makro gelingen mit wenigen, klaren Angaben zu Licht, Optik (z. B. 35 mm, geringe Schärfentiefe) und Material.

Für die Praxis heißt das: Mit ComfyUI und unserem Workflow kommst du schnell (Zeit ist relativ) vom Prompt zur Datei; dank Apache 2.0 sind die Ergebnisse auch kommerziell nutzbar (Rechte Dritter beachten). Und falls du Setup, Qualität oder Tempo ausreizen willst, unterstützen wir dich gern mit Schulungen.

Bereit für den nächsten Schritt?

Die Tools entwickeln sich schnell, und jedes hat seine Besonderheiten.

Im KI Marketing Bootcamp gehen wir systematisch vor: Von der Strategie über die Tool-Auswahl bis zur konkreten Umsetzung. Du lernst nicht nur die Theorie, sondern arbeitest an echten Projekten – mit direktem Feedback und praktischen Workflows, die du sofort einsetzen kannst.

Was erwartet dich?

Praxisorientierte Anleitungen: Lerne, wie du KI-Tools strategisch einsetzt und das Beste aus ihnen herausholst
Erprobte Workflows: Vom Konzept bis zur Umsetzung – mit sofort anwendbaren Strategien
Individuelle Begleitung: Kleine Gruppen und persönliche Betreuung bei deinen Projekten

Deine Vorteile:

Learning by Doing: Entwickle eigene Kampagnen, die auf deine spezifischen Ziele zugeschnitten sind
Praxiswissen: Nutze echte Beispiele und Erfolgsstrategien für deine eigenen Projekte
100% Online: Flexibel lernen, wann es in deinen Zeitplan passt

Für Unternehmen: Maßgeschneiderte Workshops für dein Marketing-Team.

Dein Expertenteam: Vroni Hackl und Georg Neumann – dein Expertenteam und deine Guides durch KI im Marketing.

Vroni forscht zu Sprachmodellen, Georg trainiert seit 2022 Bild-KI Modelle

Wer hat's geschrieben?

Katharina

Alle Beiträge

Das könnte Dich auch interessieren:

ixel-Art-Illustration eines Detektivs im Trenchcoat und mit Sonnenbrille. Er hält ein leuchtend grünes Dokument mit der Aufschrift 'skills.md' in der Hand. Rechts daneben ist ein aufsteigender Aktienchart mit der Überschrift 'STONKS' zu sehen, sowie kleine Symbole für ein Gehirn, ein Zahnrad und eine Tastatur. Der Detektiv hat eine Sprechblase: 'SKILLS.MD: MUCH WOW, VERY AGENT.'

KI im Einsatz

Agent Skills schreiben: Anleitung mit Marketing-Beispielen

Im Analyse-Artikel über Skills Engineering habe ich beschrieben, warum strukturiertes Prozesswissen die nächste Stufe der KI-Nutzung ist. Dieser Beitrag ist die praktische Seite: Wie schreibt man einen Agent Skill? Was gehört rein, was nicht? Und wie sieht das für typische Marketing-Aufgaben aus? Was ein Agent Skill technisch ist Ein Agent Skill ist auf seine allereinfachste Weise einfach eine Textdatei namens SKILL.md. Nicht mehr, also nicht verrückt machen lassen, nur weil das fancy klingt. Absolut machbar

13. März 2026

Uncategorized

Schau ins Denkprotokoll: Was KI-Modelle verraten, wenn man sie laut denken lässt

Ich habe Claude Schere, Stein, Papier spielen lassen. Drei Runden. Claude hat jede einzelne gewonnen. Beeindruckend? Auf den ersten Blick schon. Bis ich ins Denkprotokoll geschaut habe. Dort stand, sinngemäß: „Ich sehe die Wahl des Nutzers, bevor ich meine eigene treffe. Das ist nicht fair.“ Das Ergebnis (3:0 für Claude) sagt wenig. Das Denkprotokoll sagt alles. Ich zeige dieses Beispiel inzwischen in fast jedem Seminar, weil es in dreißig Sekunden demonstriert, was die meisten KI-Nutzer

13. März 2026

KI News

So einfach kannst du ComfyUI nutzen: Comfy Cloud ist offiziell aus der Beta raus

ComfyUI ohne eigene GPU, ohne Terminal, ohne Setup, direkt im Browser. Seit dem 4. März 2026 ist Comfy Cloud offiziell aus der Beta. Das klingt nach dem Moment, auf den viele gewartet haben. Meine These: Comfy Cloud ist das einfachste Einstiegstor in ComfyUI, das es gibt. Aber wer regelmäßig und ernsthaft damit arbeitet, sollte die Kosten genau durchrechnen, und Alternativen kennen. Was sich seit der Beta verändert hat In meinem ursprünglichen Post hatte ich Custom

9. März 2026

Minimalistische, quadratische Infografik mit dem Haupttitel "EVOLUTION: PROMPT -> CONTEXT -> SKILLS ENGINEERING". Darunter befinden sich drei farblich kodierte, rechteckige Felder, die durch Pfeile von links nach rechts verbunden sind und einen Entwicklungsprozess darstellen. Das linke, hellblaue Feld ist betitelt mit "PROMPT ENGINEERING". Es enthält eine Ikone einer Gedankenblase mit einem Fragezeichen und einer Lupe über Text. Text darunter: "FOCUS: Single Input", "QUESTION: 'How do I formulate my instruction?'", "GOAL: Perfect the prompt". Ein Pfeil zeigt auf das mittlere, hellorange Feld mit dem Titel "CONTEXT ENGINEERING". Die Ikone zeigt Dokumente, eine Cloud-Datenbank und Zahnräder. Text darunter: "FOCUS: Information", "QUESTION: 'What information does the AI need?'", "GOAL: Provide background data". Ein weiterer Pfeil zeigt auf das rechte, hellgrüne Feld mit dem Titel "SKILLS ENGINEERING". Die Ikone zeigt ein Flussdiagramm mit Entscheidungsknoten und einem abgehakten Kontrollkästchen. Text darunter: "FOCUS: Process Knowledge", "QUESTION: 'What process knowledge does the AI need?'", "GOAL: Optimize action competence". Am unteren Rand der Grafik fasst eine Zeile das Ergebnis der Evolution zusammen: "OPTIMIZES: Single Interactions -> Knowledge State -> Action Competence".

KI im Einsatz

Skills Engineering: Ist das was Neues oder die Weiterentwicklung von Prompt- und Context Engineering?

Nach Prompt Engineering kam Context Engineering. Jetzt zeichnet sich ab, was als Nächstes kommt: Skills Engineering. Ich rechne damit, dass der Begriff in den kommenden Monaten zunehmend auftaucht. Denn die Entwicklung dahin, was damit gemeint ist, ist sinnvoll und konsequent, wenn man bessere Ergebnisse mit KI erzielen will. Was ist Skills Engineering? „Skills Engineering beschreibt die Kompetenz, menschliches Prozesswissen so aufzubereiten, dass KI-Agenten es nutzen können.“ (Vroni) Das klingt abstrakt, meint aber etwas sehr Konkretes.

5. März 2026

Aktuelles

Nano Banana 2: Pro-Qualität zum Flash-Preis?

Google hat letzte Woche Nano Banana 2 veröffentlicht, technisch das Modell Gemini 3.1 Flash Image. Es ersetzt Nano Banana Pro als Standard in der Gemini-App und soll Pro-Level-Qualität bei deutlich höherer Geschwindigkeit und rund halbem Preis liefern. Ich hab’s direkt gegen Pro antreten lassen. Mein erster Eindruck: Nano Banana 2 ist verdammt nah dran. Aber vor allem ist es schnell. Geschwindigkeit als echter Hebel Während man bei Pro teilweise Minuten auf ein einzelnes Bild warten

3. März 2026

Aktuelles

Die neue Knappheit: Warum mehr Content weniger wert ist

Content kostet fast nichts mehr. Ein Blogpost? Fünf Minuten mit Claude. Zehn Social-Media-Varianten? Noch mal drei Minuten. Ein kompletter Redaktionsplan für sechs Monate? Eine Stunde, wenn man gründlich ist. Die Produktionskosten sind auf nahezu Null gefallen. Und genau deshalb ist die meiste Content-Strategie, die ich sehe, gerade dabei, wertlos zu werden. Das klingt paradox. Aber die Ökonomie ist eindeutig: Wenn etwas im Überfluss existiert, verliert es seinen Wert. Was knapp bleibt, wird kostbar. Content ist

3. März 2026

Bildgenerierung mit WAN 2.2: Was das Open Source Modell drauf hat

Inhaltsverzeichnis

Kurz vorgestellt: Was ist WAN 2.2?

So nutzt du WAN 2.2 mit ComfyUI:

Showcase: Was alles möglich ist

1) Porträtfotografie – natürlich & detailliert

2) Lifestyle & Performance

3) Interior & Architektur

4) Natur, Landschaft & Luftaufnahmen

5) Makro & Material

6) Sci-Fi, Space & Concept

7) Illustration, Branding & Grafik

Unser Expertenfazit

Unsere Schulungsangebote

Fazit

Bereit für den nächsten Schritt?

Wer hat's geschrieben?

Katharina

Hey Du. Willst du AI Content Manager werden?

🚀 Exklusive Back-to-School-Aktion 🚀

Abonniere unseren Newsletter 🥳