Är detta det bästa ramverket för flera agenter hittills?

By rik

Artificiell intelligens: En revolution vi inte kan ignorera

Den pågående AI-revolutionen är en kraftfull förändring som vi inte får negligera. Det finns delade åsikter om artificiell intelligens. Vissa kritiker oroar sig för att AI kan utvecklas till en okontrollerbar kraft, medan andra fruktar att AI ska ta över deras arbeten.

Samtidigt finns det en grupp människor som redan utnyttjar AI för att öka sin produktivitet och effektivitet. E-handelsplattformar har använt AI för att analysera konsumentbeteenden och anpassa sina tjänster.

På senare tid har vi sett framväxten av AI-verktyg som kan skapa kod från korta instruktioner, generera reklamtexter, förklara komplex kod och producera bilder, videor och miniatyrer med imponerande precision.

Nya AI-produkter dyker upp dagligen, och MetaGPT är ett av de senaste tillskotten som har fått stor uppmärksamhet.

MetaGPT är ett ramverk för multiagent-system som analyserar en mängd olika indata och skapar API:er, användarberättelser, datastrukturer, konkurrentanalyser och mycket mer. GPT står för Generative Pretrained Transformers, en typ av AI-modell.

MetaGPT-ramverket kan inta roller som produktchef, mjukvaruingenjör och arkitekt. Det kan fungera som ett helt programvaruföretag, med välorganiserade processer som styrs av en enda kodrad.

MetaGPT integrerar mänskliga processer i sin design. Som ett resultat genererar den LLM-baserade (Large Language Model) agenten detaljerad och strukturerad dokumentation och design av hög kvalitet. Denna design gör det enkelt att skapa lösningar för komplexa uppgifter och erbjuder problemlösningsförmåga som närmar sig mänsklig intelligens.

Ramverket är uppdelat i två skikt: grundläggande komponenter och samarbetslager.

Det grundläggande komponentlagret innehåller alla byggstenar som krävs för individuella agentoperationer. Dessa byggstenar består av miljön, minnet, rollerna, åtgärderna och verktygen.

  • Miljön möjliggör delad kommunikation och arbetsytor.
  • Roller definierar de specifika arbetsflöden och färdigheter inom ett visst område.
  • Verktyg erbjuder standardverktyg och tjänster.
  • Åtgärder hanterar deluppgifter.

Samarbetslagret bygger på det grundläggande komponentskiktet. Det samordnar olika agenter för att lösa komplicerade problem tillsammans. SOP (Standard Operating Procedures) delar upp uppgifter i små, hanterbara delar, fördelar dem till lämpliga agenter och övervakar genomförandet för att säkerställa att alla riktlinjer följs. Detta lager ser också till att olika agenter delar och utbyter data, vilket skapar en delad kunskapsbas.

Vi har redan tillgång till hundratals AI-verktyg. Vad gör MetaGPT så speciellt? Här är några fördelar med att använda MetaGPT:

  • Automatiserar mjukvaruutvecklingsprocessen: MetaGPT automatiserar stora delar av kodgenereringsprocessen, vilket ger utvecklare mer tid att fokusera på strategiska och kreativa uppgifter.
  • Förtränad språkförståelse: MetaGPT använder flera GPT-modeller som redan är tränade för att utföra olika uppgifter.
  • Genererar kreativa applikationer: MetaGPT-ramverket hjälper användare att skapa fullt fungerande applikationer med bara några få kommandon.
  • Förbättrar befintliga applikationer: Ramverket kan analysera en befintlig applikation, lägga till nya funktioner eller ta bort onödig kod.
  • Underlättar kommunikation: MetaGPT hjälper olika teammedlemmar att samarbeta och kommunicera bättre när de arbetar mot ett gemensamt mål.

MetaGPT använder olika agenter (GPT) för att hantera förfrågningar. Till exempel, om du vill skapa en app som transkriberar musik, kommer MetaGPT att analysera din förfrågan, identifiera de bäst lämpade GPT-modellerna och fördela olika uppgifter. Arbetet delas sedan upp i små delar och tilldelas olika agenter som kommunicerar under hela processen.

Enligt informationen på GitHub kostar det cirka 0,2 USD (i GPT-4 API-avgifter) att generera ett exempel med design och analys. Om du vill ha ett komplett projekt behöver du cirka 2 USD. Så här fungerar MetaGPT i grunden:

  • Användaren definierar mjukvarukrav: Användaren skriver in instruktioner om vilken typ av applikation de vill bygga. Till exempel kan du instruera ramverket att bygga en hotellbokningsapp med en administratörspanel och användarfunktionalitet.
  • MetaGPT identifierar rätt GPT: MetaGPT arbetar med olika GPT-modeller. Vissa modeller kan generera bilder medan andra genererar kod.
  • GPT arbetar på indata: Efter att rätt GPT har identifierats, genererar ramverket data baserat på träningsdata.
  • Användaren granskar utdata: MetaGPT bearbetar utdata baserat på indata. Som användare granskar du dessa för att se om de uppfyller dina krav.
  • MetaGPT förfinar utdata: Om utdata fortfarande saknar vissa funktioner, kan du instruera ramverket att förfina dem tills de är tillfredsställande.

Nu när du förstår hur MetaGPT fungerar, är det dags att lära sig hur man använder det. Här är kraven du behöver uppfylla innan du börjar:

  • Node.js installerad på din lokala dator. Du kan kontrollera om den är installerad med kommandot:
node –version

Om den är installerad får du en utdata som den här:

Om den inte är installerad, kan du ladda ner Node.js.

Kontrollera Python-versionen med python3 –version (för Ubuntu) eller python –version (för Windows eller macOS).

Om Python är installerat kommer du att få något liknande detta:

Node.js installerar npm som standard. Installera mermaid-js med det här kommandot:

sudo npm install -g @mermaid-js/mermaid-cli

Det sista steget är att klona MetaGPT-förrådet till din lokala dator. Använd dessa kommandon:

git clone https://github.com/geekan/metagpt
cd metagpt
python setup.py install

Baserat på en studie publicerad av MetaGPT:s skapare, kan du använda ramverket för olika uppgifter. Här är några exempel:

Skapa spel

Du kan utveckla olika spel, från enkla spel som Snake till mer komplicerade som Flappy Bird eller Brick Breaker. Ge MetaGPT några instruktioner och börja spela dina favoritspel.

Transkribera musik

Använd MetaGPT för att bygga ett program som omvandlar musiknoter till digitalt format.

Anpassade pressmeddelanden

Användare kan skapa ett Python-skript som hämtar data om ett företag från sociala medier och webbplatser, och sedan generera personliga pressmeddelanden med den insamlade informationen.

Hur MetaGPT:s anpassningsförmåga kan förbättra komplexiteten för simulering av flera agenter

Simuleringar är virtuella experiment med modeller som imiterar verkligheten, som används för att göra prognoser och analyser. MetaGPT är anpassningsbar, vilket gör det lätt att skapa komplexa och realistiska agentbeteenden. Ramverket kan lära sig av stora mängder data och generera beteenden som troligen förekommer i verkligheten.

MetaGPT är också programmerat för att analysera och förstå en miljö och hur den påverkar agenter. Denna funktion gör det enkelt att skapa realistiska och svårförutsägbara simuleringar.

MetaGPT är inte det enda ramverket som använder flera GPT-modeller. Några populära alternativ är Python Read-Eval-Print Loop (REPL), LangChain, AutoGPT och AgentVerse. Här är en jämförelse av MetaGPT med dessa ramverk:

  • Kodgenerering: Alla nämnda verktyg kan generera kod. Det unika med MetaGPT är att det erbjuder en komplett verktygslåda för projektexekvering och hantering.
  • Kodgranskning: AgentVerse och MetaGPT är de enda ramverken som har en funktion för kodgranskning. MetaGPT går dock ett steg längre genom att införa förkompileringsexekvering, vilket gör det enkelt att identifiera fel tidigt.
  • API-generering: Av de nämnda alternativen är MetaGPT det enda ramverket som erbjuder API-genereringsfunktioner. Detta gör det enkelt att skapa prototyper av API:er under mjukvaruutvecklingsprocessen.
  • Samarbete: Rollbaserat samarbete är tillgängligt i AgentVerse och MetaGPT. Denna funktion främjar hantering och samarbete mellan flera agenter.

Trots de många möjligheter MetaGPT erbjuder, finns det också områden där det brister:

  • Fortfarande under utveckling: GitHub-sidan visar att projektet fortfarande är under aktiv utveckling. Projektet är inte perfekt ännu, men vi får se hur det utvecklas i framtiden.
  • Inte idealiskt för komplexa projekt: MetaGPT är ett bra ramverk för grundläggande applikationer. Men du behöver fortfarande mycket mänsklig input när du hanterar komplexa projekt med mycket data.
  • Begränsningar i sin träning: Generativa modeller kan bara producera data som de har tränats på. De GPT-modeller som MetaGPT använder måste uppdateras kontinuerligt för att bli mer precisa.

Vanliga frågor

Behöver man OpenAI API-nycklar för att använda MetaGPT?

Ja. MetaGPT är byggt på OpenAI:s API. Efter att ha installerat eller klonat MetaGPT till din lokala dator måste du konfigurera API-nycklarna för att börja använda det.

Finns det alternativ till MetaGPT?

Ja. Ramverk som Python Read-Eval-Print Loop (REPL), LangChain, AutoGPT och AgentVerse använder samma designprinciper. Alla dessa verktyg kan generera kod, men de skiljer sig åt i andra funktioner.

Hur fungerar MetaGPT?

Ramverket tilldelar olika agenter olika uppgifter baserat på deras styrkor och utbildning. Plattformen gör det möjligt för dessa agenter att samarbeta och dela information för att lösa komplexa utmaningar från ett och samma verktyg.

Hur mycket kostar MetaGPT?

Enligt GitHub-förrådet kostar det upp till 0,2 USD att generera ett exempel och analys. Ett fullt fungerande program kan kosta upp till 2 USD.

Vem kan använda MetaGPT?

MetaGPT fungerar som ett komplett mjukvaruutvecklingsföretag. Det kan användas av mjukvaruingenjörer, kvalitetssäkringspersonal, produktdesigners och produktchefer.

Slutsats

MetaGPT är utformat för att hantera multiagent-system genom att definiera roller, standardisera processer och dela upp uppgifter.

MetaGPT har många användningsområden. Inom mjukvaruutveckling kan du använda MetaGPT för att skapa programvara från grunden, förbättra befintlig programvara, generera användarberättelser och förbättra samarbetet.

Det är fortfarande för tidigt att säga om MetaGPT är det bästa ramverket för multiagent-system. Även om produkten fortfarande är under utveckling har den visat sig vara ett bra verktyg för mjukvaruutvecklingsprocessen.

Du kan också läsa om hur man installerar Auto-GPT på några minuter.