Stabilitet AI har meddelat lanseringen av Stable Diffusion 3.5, vilket innebär ett stort steg framåt för AI-bildgenereringsmodeller med öppen källkod.
De senaste modellerna från Stability AI innehåller flera varianter som är utformade för att tillgodose olika användarbehov, från hobbyister till applikationer på företagsnivå.
Tillkännagivandet följer juni månads Stable Diffusion 3 Medium release, som företaget erkänner inte uppfyllde förväntningarna.
”Den här utgåvan uppfyllde inte helt våra standarder eller våra samhällens förväntningar”, säger Stability AI.
I stället för att skynda på en snabb lösning säger Stability AI att man investerade tid i att utveckla en mer robust lösning.
Flaggskeppsmodellen, Stable Diffusion 3.5 Large, har 8 miljarder parametrar och en upplösning på 1 megapixel, vilket gör den till den mest kraftfulla i Stable Diffusion-familjen. Large Turbo-varianten erbjuder jämförbar kvalitet men genererar bilder i bara fyra steg, vilket avsevärt minskar bearbetningstiden.
Medium-versionen, som ska lanseras den 29 oktober, kommer att ha 2,5 miljarder parametrar och stödja bildgenerering med upplösningar på mellan 0,25 och 2 megapixel. Denna variant är särskilt optimerad för konsumenthårdvara.
Modellerna innehåller Query-Key-normalisering i transformatorblock, vilket förbättrar utbildningsstabiliteten och förenklar finjusteringsprocesser. Denna flexibilitet medför dock kompromisser, bland annat större variation i utdata från identiska uppmaningar med olika frön.
Stability AI har implementerat en särskilt tillåtande community-licens för releasen. Modellerna är fria för icke-kommersiellt bruk och tillgängliga för företag med årliga intäkter under 1 miljon USD. Företag som överskrider denna tröskel måste säkra separata licensavtal.
Företaget betonade sitt engagemang för ansvarsfull AI-utveckling och implementerade säkerhetsåtgärder redan i ett tidigt skede. Ytterligare funktioner, inklusive ControlNets för avancerade kontrollfunktioner, planeras att släppas efter lanseringen av Medium-modellen.
Stability AI:s senaste modeller för bildgenerering är för närvarande tillgängliga via Kramande ansikte och GitHubmed ytterligare åtkomst via plattformar som t.ex. Stabilitet AI API, Replikera, ComfyUI, och DeepInfra.
(Bildkredit: Stabilitet AI)
Se även: Anthropic presenterar nya Claude AI-modeller och ”datorstyrning
Vill du lära dig mer om AI och big data från branschledare? Kolla in AI & Big Data Expo som äger rum i Amsterdam, Kalifornien och London. Det omfattande evenemanget är samlokaliserat med andra ledande evenemang, bland annat Konferens om intelligent automation, BlockX, Veckan för digital omvandling, och Cybersäkerhet & Cloud Expo.
Utforska andra kommande evenemang och webbseminarier om företagsteknik som drivs av TechForge här.