Finns det en ny AI-bildgeneratorchampion?

By rik

Introduktionen av Flux.1 från Black Forest Labs har orsakat stor uppmärksamhet inom AI-området och utmanar Midjourneys position som ledande bildgenerator. Midjourney har länge ansetts vara den främsta AI-bildgeneratorn, men Flux.1, ett nytt alternativ med öppen källkod, siktar på att leverera fotorealistiska bilder av hög kvalitet. Denna artikel kommer att jämföra dessa två verktyg för att avgöra vilket som är bäst lämpat för att skapa bilder, särskilt när det gäller att återskapa mänskliga drag. Flux.1:s förmåga att generera verklighetstrogna bilder är imponerande. I denna jämförelse mellan Flux och Midjourney undersöker vi olika aspekter av båda modellerna, inklusive bildskapande, kostnad och funktionalitet, för att underlätta för användaren att fatta ett välgrundat beslut.

Vad är Flux AI Bildgenerator?

Flux.1 är en öppen källkodsmodell för AI-bildgenerering, utvecklad av tidigare ingenjörer och forskare från Stable Diffusion. Tre nya Flux.1-modeller har släppts under den nya AI-startupen Black Forest Labs. Flux.1 [pro] är den mest avancerade modellen och är endast avsedd för kommersiellt bruk.

Otroligt. Utan tvekan de mest verklighetstrogna AI-bilderna jag någonsin sett.

Vi är 99,7 % på väg mot AI-bilder som är fullständigt omöjliga att skilja från verkligheten.

(Man kan fortfarande upptäcka vissa brister när man zoomar in)

Detta är skapat med FLUX. Uncanny Valley. pic.twitter.com/5BIRmZey8B— Roberto Nickson (@rpnickson) 8 augusti 2024

Flux.1 [dev] och Flux.1 [schnell] är modeller med öppen källkod, och AI-communityn har redan förbättrat dessa för att generera fotorealistiska bilder. Med hjälp av en Realism LoRA-adapter kan Flux.1 [dev]-modellen generera visuellt realistiska bilder där händerna ser korrekta ut utan förvrängningar eller artefakter.

För att testa Flux.1-modellen har vi jämfört den med Midjourney v6.1. Vi har använt FLUX Realism LoRA-modellen på fal.ai (besök) för mänskliga motiv och FLUX.1 [pro] (besök) för landskapsbilder. Här följer en jämförelse mellan Flux och Midjourney med samma instruktioner.

Flux vs Midjourney: Bildgenerering

1. En Kvinna På Väg Till Jobbet Vid Soluppgången

I det första bildsetet kan man se att bilden genererad av Flux är mer fotorealistisk. Trots användningen av parametern –style raw i Midjourney, blev resultatet mer tecknat.

FluxMidjourney

2. Ett Äldre Par i en Park

Även här är Fluxs resultat mer realistiskt och trovärdigt jämfört med Midjourneys. Midjourneys bild påminner om en målning, medan Flux genererar en levande avbildning.

FluxMidjourney

3. Bild på en Kock

I detta test lyckas varken Flux eller Midjourney helt vid en noggrann granskning. Båda bilderna känns AI-genererade, men Midjourneys resultat hanterar reflektioner och ljussättning bättre.

Midjourney

4. Ett Fantasislott

Här föredrar jag Fluxs resultat eftersom det frammanar bilder direkt från en fantasi. Midjourneys genererade bild är också ganska detaljerad.

Midjourney

5. En Futuristisk Stad på Natten

Detta är en jämn match, men Fluxs bild är något renare, medan Midjourney har skapat en visuellt komplex bild.

Midjourney

6. En Tidning med Läsbara Texter

Slutligen, när det gäller textåtergivning, gjorde både Flux och Midjourney ett bra jobb. Detta är ett område där bildsyntesmodeller ofta har problem, men det är ett bra tecken att en öppen källkodsmodell kan konkurrera med en sluten källkodsmodell som Midjourney.

Midjourney

Vinnare: Flux

Flux vs Midjourney: Prissättning

När det gäller kostnad är Flux gratis och öppen källkod, men för att köra modellen lokalt behövs kraftfull hårdvara med en dedikerad GPU. Modellen har 12 miljarder parametrar. Det bästa sättet att köra Flux lokalt är med Pinokio (webbplats). Ladda ner appen och kom igång med Flux.

Utöver det finns det många tjänsteleverantörer som erbjuder gratis bildgenerering med Flux-modellen. Dessa kommer dock med begränsade gratis krediter, eller så kan bildgenereringen ta lång tid beroende på systembelastningen.

Du kan använda Flux.1 [dev]-modellen gratis via HuggingFace (webbplats). Dessutom kan du kolla fal.ai (webbplats) där LoRA-modeller också finns tillgängliga, men du får endast $1 i gratis krediter. Efter det måste du köpa fler krediter baserat på din användning.

Midjourney å andra sidan är dyrt och kostar 10 dollar per månad på månadsbasis. Fördelen är att bildgenereringen är ganska snabb och gränssnittet är användarvänligt.

Vinnare: Flux

Flux vs Midjourney: Funktioner

Eftersom Flux är en ny modell på marknaden erbjuder den inte många AI-bildredigeringsfunktioner från början. Men vissa tjänster som BasedLabs (webbplats) låter dig ändra bilderna och definiera bildförhållandet. Du kan också välja hur många bilder du vill generera åt gången. Om du är en teknisk användare kan du även justera frövärdet, antalet steg och inställningar för brusreducering.

Midjourney är å sin sida mer funktionsrikt och stöder många möjligheter. Till exempel kan du ställa in bildförhållandet, välja estetik och stilisering. Du kan även använda äldre Midjourney-modeller och skapa naturliga bilder med hjälp av Raw-alternativet.

Dessutom kan du efter att en bild har genererats välja att skala upp den, zooma ut och lägga till detaljer, göra inpainting med lasso-verktyget, omformulera den och mycket mer. I princip kan du modifiera en bild genom att skriva in nya instruktioner, vilket är utmärkt. För inpainting och outpainting erbjuder Midjourney fler verktyg och kontroller än Flux, för tillfället.

Vinnare: Midjourney

Flux vs Midjourney: Innehållsreferenser

Om du är en konstnär vill du att tjänsten ska stödja Content Credentials-standarden. Denna standard ger information om bildens ursprung och eventuella ändringar. Tyvärr stöder varken Midjourney eller Flux Content Credentials-standarden. Dessa tjänster lägger inte till någon form av verifierbar metadata i sina genererade AI-bilder.

Vinnare: Ingen

Det avslutar vår jämförelse mellan Flux och Midjourney. Jag är mycket imponerad av Flux-modellen som ett kapabelt och gratis alternativ till Midjourney. Det är troligt att communityn med öppen källkod kommer att fortsätta att utveckla och addera funktioner som inpainting och outpainting. Det var allt för oss den här gången. Om du har några frågor, lämna gärna en kommentar nedan.