Meta har offentliggjort källkoden för MusicGen, en ny AI-driven musikgenerator som kan omvandla textinstruktioner till fullständiga musikstycken. Denna demonstration är tillgänglig online och allt du behöver för att testa den är en webbläsare. Resultaten är imponerande, vilket visar på de stora framsteg som gjorts inom AI-musikmodeller.
Här är vad du behöver veta om MusicGen och hur du kan skapa din egen musik.
Vad är MusicGen?
I juni 2023 lanserade Meta sin AI-modell för musikgenerering, MusicGen. Det är inte första gången ett företag försöker lösa det komplexa problemet med att syntetisera originalmusik från en enkel textbeskrivning. Vi har tidigare sett liknande verktyg som OpenAIs Jukebox och MusicLM som kan skapa korta musiksnuttar.
Men Meta är det första företaget som publicerar källkoden som öppen källkod. Detta gör det möjligt för dig att köra programvaran lokalt på din dator, förutsatt att du har ett grafikkort med minst 16 GB minne. Det är värt att notera att vi lyckades få det att fungera med endast 11 GB minne.
Om du inte har tillgång till den nödvändiga hårdvaran behöver du inte oroa dig, eftersom du kan använda MusicGens webbapplikation gratis via din webbläsare. Med online-demon kan du förvänta dig att det tar drygt en minut att generera en ljudsekvens på ungefär 12 sekunder.
Hur låter MusicGen?
Enligt Meta kan MusicGen producera musikprover av hög kvalitet, men deras definition av hög kvalitet är 32 kHz. Detta ligger någonstans mellan standarden för talsyntes (16 kHz) och standarden för digital musik (44,1 kHz).
I praktiken når ljudkvaliteten inte de högsta standarder som du kanske är van vid från radio eller streamingtjänster. Jämfört med andra AI-musikgeneratorer och med tanke på den nuvarande tekniska utvecklingen är ljudkvaliteten ändå ganska bra med en låg brusnivå i filerna.
Hur väl stämmer musiken överens med de givna instruktionerna? Du kan snabbt bilda dig en uppfattning genom att lyssna på exemplen nedan. Generellt sett lyckas den hålla sig till de populära musikgenrerna, samtidigt som den behåller en mer sammanhängande musikalisk struktur jämfört med sina föregångare.
Hur man skapar musik med MusicGen
MusicGen är enkelt att använda och kräver ingen registrering. Gränssnittet är också användarvänligt, vilket gör det enkelt att experimentera och ha kul.
Så här skapar du musik med MusicGen:
- Öppna MusicGens webbapplikation.
- I textfältet med titeln ”Beskriv din musik” anger du din instruktion. Du kan börja med något enkelt som ”irländsk folkmelodi” eller vara mer detaljerad genom att specificera instrument, tempo, genre eller stämning.
- Klicka på knappen ”Generera” för att starta processen. Efter en eller två minuter visas en ljudspelare i sektionen ”Genererad musik” till höger.
- Håll muspekaren över modulen för att visa spelarkontrollerna och lyssna på filen, eller klicka på nedladdningsikonen i det övre högra hörnet för att spara filen på din dator. Observera att filerna endast kan laddas ner i MP4-format.
- Om du vill kombinera resultatet med en befintlig melodi, kan du ladda upp en inspelning i modulen bredvid textfältet. Du kan också välja ”Mic” för att spela in en melodi med din mikrofon.
Genom att ange en befintlig melodi som referens kommer MusicGen att använda både textbeskrivningen och melodin för att skapa den nya musiken. Det här är ett användbart verktyg för att styra resultaten från MusicGen.
Vilka begränsningar finns det för användningen av MusicGen-ljud?
Källkoden för MusicGen distribueras fritt under MIT-licensen med få begränsningar. Angående ljudet du genererar med modellen är det oklart vilka juridiska riktlinjer som gäller. Istället kan det vara bra att ta del av Metas varning om användningen av MusicGen:
”Modellen ska inte användas för att medvetet skapa eller sprida musikstycken som skapar fientliga eller alienerande miljöer för människor. Detta inkluderar att generera musik som människor skulle finna störande, upprörande eller stötande; eller innehåll som sprider historiska eller aktuella stereotyper.”
Meta förklarar vidare att MusicGen är avsedd för forskare som vill utforska AI-musikgenerering och inte för ”nedströmsanvändning”, vilket kan innebära aktiviteter som att ladda upp och sprida AI-musik på streamingplattformar.
De etiska aspekterna speglar diskussionen kring AI-konstgenerering. Att få samtycke till att använda data för att träna AI-modeller, samt frågan om hur man ska kompensera och ge erkännande till artister är alla skäl för Meta att vara försiktiga.
Kort sagt, att utforska modellen för skojs skull kommer sannolikt inte att orsaka problem, men det kan vara mer komplicerat om du vill använda ljudet i kommersiella sammanhang. Många undrar hur framtiden för popmusik med AI kommer att se ut.
Genom att tillhandahålla ännu en musikgenereringsmodell har Meta lanserat MusicGen, en AI-modell med öppen källkod som kan skapa råmusik från en enkel textbeskrivning. Om du är nyfiken på att testa tekniken, kan du prova demonstrationen med hjälp av en webbläsare.