Stable Diffusion 3 Release am 12.06.2024

Edit vom 12.06.2024: Ihr könnt die Modelle jetzt bei hugging face herunterladen. Ein passender ComfyUI Workflow ist auch direkt mit hinterlegt.

Die Text-zu-Bild KI Stable Diffusion hat mit Version 3 einen großen Sprung nach vorne gemacht. Wir haben das in diesem Beitrag bereits für euch getestet. Nach monatelanger Wartezeit macht Stable Diffusion Entwickler Stability AI am 12.06.2024 den ersten Teil der neuen Weights öffentlich zugänglich – das SD3 Medium Modell mit 2 Milliarden Parametern wird released. In diesem Beitrag fassen wir alle wichtigen Infos dazu zusammen.

 

Die Neuerungen

Das SD3 Medium Modell bringt vor allem in folgenden Bereichen deutliche Verbesserungen mit sich:

 

  • Fotorealismus: Überzeugende Darstellung von Händen und Gesichtern ohne Artefakte
  • Typografie: Hervorragende Leistung bei der Darstellung von Schrift, besser als größere Modelle
  • Performance: Trotz 2 Milliarden Parametern sehr effizient auf Consumer-Hardware nutzbar
  • Anpassungsfähigkeit: Kann sehr gut auf kleine, spezifische Datensätze fein-abgestimmt werden 

Ein Schlüsselfaktor ist die neue getrennte Architektur für Text- und Bildverarbeitung, die ein besseres Verständnis der Prompts ermöglicht. 

 

Releases und Verfügbarkeit

Die Stable Diffusion 3 Medium Weights werden am 12. Juni 2024 auf Hugging Face veröffentlicht und stehen dann zum Download bereit – vorerst nur für nicht-kommerzielle Nutzung.

Das sehr gehypte 8 Milliarden Parameter Modell ist noch nicht fertig, hat wohl noch Schwierigkeiten mit der Darstellung der menschlichen Anatomie.

 

Kommerzielle Nutzung

Wer die neuen SD3 Modelle kommerziell nutzen möchte, muss eine Lizenz erwerben. Die Preise dafür sind noch nicht bekannt, man kann sich aber vorab auf einer Liste eintragen lassen.

 

Fazit

Mit dem Release der SD3 Medium Weights wird die mit Spannung erwartete neue Generation der beliebten Stable Diffusion Modelle Realität. Vor allem in Sachen Fotorealismus, Typografie und Anpassungsfähigkeit verspricht das 2 Milliarden Modell einen großen Sprung nach vorne. Für kommerzielle Nutzer gibt es voraussichtlich kostenpflichtige Lizenzen. 

 

Möchtest du bei den Neuerungen auf dem Laufenden bleiben? Dann trage dich in unseren KI Marketing Newsletter ein und verpasse keine Updates mehr zu Stable Diffusion 3 und anderen Entwicklungen der generativen KI!

 

Oder hast du vielleicht sogar vor, SD3 kommerziell einzusetzen? Registriere dich gleich auf der SD3 Warteliste von Stability: https://stability.ai/stablediffusion3

Lerne Bild-KI im KI Marketing Bootcamp

Du möchtest tiefer in den Hasenbau generativer KI eintauchen und lernen, wie du Bild-KI effektiv in deinem Marketing oder deiner kreativen Arbeit einsetzt? Dann ist unser KI Marketing Bootcamp genau das Richtige für dich!

 

In diesem intensiven Training erfährst du alles, was du über Text- und Bildgenerierung sowie weitere Bereiche der generativen KI wissen musst. Unsere Experten Vroni Hackl und Georg Neumann teilen ihr Wissen und ihre praktischen Erfahrungen mit dir. Du lernst die besten Tools kennen, probierst sie direkt aus und erhältst wertvolle Tipps für den Einsatz in deinem Arbeitsalltag.

 

Egal, ob du Marketer, Designer, Texter oder einfach KI-interessiert bist – in unserem Bootcamp findest du den perfekten Einstieg in die Welt der generativen KI. Gemeinsam finden wir heraus, wie du die Technologie für dich nutzen und deine Arbeit auf ein neues Level heben kannst.

 

Interesse geweckt? Dann melde dich jetzt für unser KI Marketing Bootcamp an und sichere dir deinen Platz! Wir freuen uns darauf, gemeinsam mit dir die Möglichkeiten der generativen KI zu entdecken.

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
ixel-Art-Illustration eines Detektivs im Trenchcoat und mit Sonnenbrille. Er hält ein leuchtend grünes Dokument mit der Aufschrift 'skills.md' in der Hand. Rechts daneben ist ein aufsteigender Aktienchart mit der Überschrift 'STONKS' zu sehen, sowie kleine Symbole für ein Gehirn, ein Zahnrad und eine Tastatur. Der Detektiv hat eine Sprechblase: 'SKILLS.MD: MUCH WOW, VERY AGENT.'
KI im Einsatz
Agent Skills schreiben: Anleitung mit Marketing-Beispielen

Im Analyse-Artikel über Skills Engineering habe ich beschrieben, warum strukturiertes Prozesswissen die nächste Stufe der KI-Nutzung ist. Dieser Beitrag ist die praktische Seite: Wie schreibt man einen Agent Skill? Was gehört rein, was nicht? Und wie sieht das für typische Marketing-Aufgaben aus? Was ein Agent Skill technisch ist Ein Agent Skill ist auf seine allereinfachste Weise einfach eine Textdatei namens SKILL.md. Nicht mehr, also nicht verrückt machen lassen, nur weil das fancy klingt. Absolut machbar

Weiterlesen »
a screenshot of a chat interface Claude
Uncategorized
Schau ins Denkprotokoll: Was KI-Modelle verraten, wenn man sie laut denken lässt

Ich habe Claude Schere, Stein, Papier spielen lassen. Drei Runden. Claude hat jede einzelne gewonnen. Beeindruckend? Auf den ersten Blick schon. Bis ich ins Denkprotokoll geschaut habe. Dort stand, sinngemäß: „Ich sehe die Wahl des Nutzers, bevor ich meine eigene treffe. Das ist nicht fair.“ Das Ergebnis (3:0 für Claude) sagt wenig. Das Denkprotokoll sagt alles. Ich zeige dieses Beispiel inzwischen in fast jedem Seminar, weil es in dreißig Sekunden demonstriert, was die meisten KI-Nutzer

Weiterlesen »
KI News
So einfach kannst du ComfyUI nutzen: Comfy Cloud ist offiziell aus der Beta raus

ComfyUI ohne eigene GPU, ohne Terminal, ohne Setup, direkt im Browser. Seit dem 4. März 2026 ist Comfy Cloud offiziell aus der Beta. Das klingt nach dem Moment, auf den viele gewartet haben. Meine These: Comfy Cloud ist das einfachste Einstiegstor in ComfyUI, das es gibt. Aber wer regelmäßig und ernsthaft damit arbeitet, sollte die Kosten genau durchrechnen, und Alternativen kennen. Was sich seit der Beta verändert hat In meinem ursprünglichen Post hatte ich Custom

Weiterlesen »
Minimalistische, quadratische Infografik mit dem Haupttitel "EVOLUTION: PROMPT -> CONTEXT -> SKILLS ENGINEERING". Darunter befinden sich drei farblich kodierte, rechteckige Felder, die durch Pfeile von links nach rechts verbunden sind und einen Entwicklungsprozess darstellen. Das linke, hellblaue Feld ist betitelt mit "PROMPT ENGINEERING". Es enthält eine Ikone einer Gedankenblase mit einem Fragezeichen und einer Lupe über Text. Text darunter: "FOCUS: Single Input", "QUESTION: 'How do I formulate my instruction?'", "GOAL: Perfect the prompt". Ein Pfeil zeigt auf das mittlere, hellorange Feld mit dem Titel "CONTEXT ENGINEERING". Die Ikone zeigt Dokumente, eine Cloud-Datenbank und Zahnräder. Text darunter: "FOCUS: Information", "QUESTION: 'What information does the AI need?'", "GOAL: Provide background data". Ein weiterer Pfeil zeigt auf das rechte, hellgrüne Feld mit dem Titel "SKILLS ENGINEERING". Die Ikone zeigt ein Flussdiagramm mit Entscheidungsknoten und einem abgehakten Kontrollkästchen. Text darunter: "FOCUS: Process Knowledge", "QUESTION: 'What process knowledge does the AI need?'", "GOAL: Optimize action competence". Am unteren Rand der Grafik fasst eine Zeile das Ergebnis der Evolution zusammen: "OPTIMIZES: Single Interactions -> Knowledge State -> Action Competence".
KI im Einsatz
Skills Engineering: Ist das was Neues oder die Weiterentwicklung von Prompt- und Context Engineering?

Nach Prompt Engineering kam Context Engineering. Jetzt zeichnet sich ab, was als Nächstes kommt: Skills Engineering. Ich rechne damit, dass der Begriff in den kommenden Monaten zunehmend auftaucht. Denn die Entwicklung dahin, was damit gemeint ist, ist sinnvoll und konsequent, wenn man bessere Ergebnisse mit KI erzielen will. Was ist Skills Engineering? „Skills Engineering beschreibt die Kompetenz, menschliches Prozesswissen so aufzubereiten, dass KI-Agenten es nutzen können.“ (Vroni) Das klingt abstrakt, meint aber etwas sehr Konkretes.

Weiterlesen »
Aktuelles
Nano Banana 2: Pro-Qualität zum Flash-Preis?

Google hat letzte Woche Nano Banana 2 veröffentlicht, technisch das Modell Gemini 3.1 Flash Image. Es ersetzt Nano Banana Pro als Standard in der Gemini-App und soll Pro-Level-Qualität bei deutlich höherer Geschwindigkeit und rund halbem Preis liefern. Ich hab’s direkt gegen Pro antreten lassen. Mein erster Eindruck: Nano Banana 2 ist verdammt nah dran. Aber vor allem ist es schnell. Geschwindigkeit als echter Hebel Während man bei Pro teilweise Minuten auf ein einzelnes Bild warten

Weiterlesen »
Aktuelles
Die neue Knappheit: Warum mehr Content weniger wert ist

Content kostet fast nichts mehr. Ein Blogpost? Fünf Minuten mit Claude. Zehn Social-Media-Varianten? Noch mal drei Minuten. Ein kompletter Redaktionsplan für sechs Monate? Eine Stunde, wenn man gründlich ist. Die Produktionskosten sind auf nahezu Null gefallen. Und genau deshalb ist die meiste Content-Strategie, die ich sehe, gerade dabei, wertlos zu werden. Das klingt paradox. Aber die Ökonomie ist eindeutig: Wenn etwas im Überfluss existiert, verliert es seinen Wert. Was knapp bleibt, wird kostbar. Content ist

Weiterlesen »

Hey Du. Willst du AI Content Manager werden?

Dann ab ins kostenfreie Info-Webinar am 25.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳