MidJourney vs. Stable Diffusion vs. Bing Image Creator

Artificiell intelligens förändrar konstvärlden på anmärkningsvärda sätt. En av de fascinerande tillämpningarna av AI i konstsegmentet är genom användningen av beskrivande konstgeneratorer. Dessa generatorer har förmågan att undersöka och tolka bilder och generera helt nya konstverk baserat på deras analys.

I den här artikeln diskuterar vi tre sådana AI-konstgeneratorer: MidJourney, Stable Diffusion och Microsoft Bing Image Creator, och som bland de tre kommer ut på topp när det gäller att generera de bästa resultaten baserat på uppmaningar.

MidJourney

MidJourney, grundat av David Holz, är en AI-konstgenerator som använder maskininlärning för att identifiera mönster och funktioner i befintliga konstverk, som sedan kan användas för att skapa nya verk.

MidJourney gick in i öppen beta den 12 juli 2022. Innan han lanserade MidJourney var Holz med och grundade Leap Motion, en startup som förvandlade användargränssnitt genom att använda videoinspelning och handgester. 2019 sålde han Leap Motion till Ultrahaptics.

Med MidJourneys popularitet har Holz delat med sig av sina insikter om teknik och dess inflytande på konst och samhälle. Holz ser artister som kunder till MidJourney, inte konkurrenter, och tror att plattformen kan underlätta större kreativitet och experimenterande i idéfasen.

Det finns dock farhågor om potentiella upphovsrättsintrång från MidJourneys träningsuppsättning, som kan inkludera upphovsrättsskyddade verk från andra artister.

Holz betonar att MidJourney är utformad för att förbättra mänskliga förmågor snarare än att ersätta dem. Han liknar det vid bilar och förklarar att bara för att bilar är snabbare än människor betyder det inte att vi ska skära av oss benen.

Genom att använda MidJourneys AI-bildgenerering kan konstnärer utforska nya möjligheter och generera många idéer innan de skapar sina egna verk.

Stabil diffusion

Stable Diffusion är en maskininlärningsmodell med öppen källkod som kan generera bilder från text, modifiera bilder baserade på text eller fylla i detaljer på bilder med låg upplösning eller låga detaljer. Den har tränats på miljarder bilder och kan ge resultat som är jämförbara med de du skulle få från DALL-E 2 och MidJourney.

Emad Mostaque, grundare och VD för Stability AI, är företaget som ansvarar för Stable Diffusion. Stable Diffusion är en latent diffusionsmodell utvecklad av CompVis-gruppen vid LMU München, och den designades av Patrick Esser och Robin Rombach, som tidigare skapat den latenta diffusionsmodellarkitekturen som används av Stable Diffusion.

Ett samarbete mellan Stability AI, CompVis LMU, Runway, EleutherAI och LAION har gjort Stable Diffusion tillgänglig för allmänheten.

Stabil spridning kan distribueras på olika plattformar, inklusive Windows- och Apple-enheter. Användning av distribution på enheten i en app kan skydda användarnas integritet, vilket är att föredra framför ett serverbaserat tillvägagångssätt.

Microsoft Bing Image Creator

Microsoft presenterade ett nytt verktyg som heter Bing Image Creator, som ger användare möjlighet att skapa sina egna bilder direkt i Microsoft Edge. Företaget har släppt en svit med skaparverktyg utformade för att väcka kreativitet och självuttryck. Verktyget låter användare skapa personliga bilder för att dela sina livsuppdateringar eller för något annat syfte de kan behöva.

Användare kan enkelt komma åt Image Creator från sidofältet i Microsoft Edge. Microsoft har vidtagit proaktiva åtgärder för att säkerställa att verktyget används på ett ansvarsfullt sätt och inte underlättar spridningen av stötande innehåll.

Företaget har satt en innehållspolicy som förbjuder användning av Image Creator i vissa fall, och användare kan rapportera eventuella brott mot denna policy. Dessutom har Microsoft implementerat teknik för att hantera potentiella fördomar som kan uppstå i generativ bildteknik.

I den här artikeln kommer vi att ge oss ut på en resa för att utvärdera resultaten av varje beskrivande AI-bildgenerator när du uppmanas med identiska textuppmaningar.

Uppmaning 1: Modern jultomte på en släde som dras av renar en varm ljus solig dag på en motorväg

Uppmaning 2: En närbild av ett djur med stora ögon som fångar dess oskuld och söthet

Uppmaning 3: En mänsklig astronaut som spelar att landa en ny planet välkomnas av fientliga främmande varelser som drar sina vapen

Uppmaning 4: Modern abstrakt konst av ett bokomslag till en roman baserad i New York City i djärva ljusa färger

Uppmaning 5: En man som väljer mellan två tallrikar – en med pizza och en med en cheeseburgare på

Uppmaning 6: En sårad krigare rider sin häst på ett snöigt berg med ett svärd i handen

Uppmaning 7: En abstrakt bild med olika nyanser som visar vattnets rörelse och flöde

Uppmaning 8: Lax i en flod med grönskande träd i bakgrunden

Uppmaning 9: Ett glas vatten på ett bord med en citron som pressas in i det av en hand

Uppmaning 10: Utsikt över horisonten i en öken från personer som rider på en elefant i den

Uppmaning 11: En skog där papperspengar växer på träd och fåglar är gjorda av mynt

Uppmaning 12: Skål med ramen, cel shading, kvällsbelysning, fotorealistisk

Uppmaning 13: Elon Musk är fattig och arbetslös

Dom

Efter att ha utvärderat resultaten från MidJourney, Stable Diffusion och Bing Image Creator, är det uppenbart att det inte finns någon definitiv vinnare.

Varje generator tolkar uppmaningar på ett distinkt sätt, med likheter som finns i utdata från Bing Image Creator och MidJourney. Stabil diffusion är effektiv när uppmaningarna har tydliga beskrivningar men ofta tar ord för bokstavligt. Medan MidJourney och Bing Image Creator i allmänhet är framgångsrika, ger de ibland resultat som inte överensstämmer med uppmaningarna.

Noterbart är att Bing Image Creator använder försiktighet när det genererar kränkande eller hetsiga resultat, och utfärdar ett varningsmeddelande när du uppmanas att skapa en bild av en fattig och arbetslös Elon Musk. Microsofts antagande av sådana skyddsåtgärder är lovvärt.

Samtidigt genererade MidJourneys neurala nätverksexpertis en bild av en utblottad och övergiven Elon Musk. Därför kan man dra slutsatsen att varje generator kommer att tillgodose sin respektive användarbas.