Googles Gemini AI är här, men är det bättre än ChatGPT?

Spread the love

Viktiga takeaways

  • Googles AI-modell Gemini har tre varianter, Ultra, Pro och Nano, fokuserade på olika uppgifter och komplexitetsnivåer.
  • Gemini Ultra visar lovande resultat på viktiga AI-riktmärken, men från och med december 2023 är den inte tillgänglig för allmänheten. Google säger att den ska vara tillgänglig i januari 2024.
  • Gemini Pro är tillgänglig och även om den presterar ganska bra, misslyckas den för närvarande med att detronisera GPT-4.

Google har konsekvent lovat att dess Gemini AI-modell skulle vara bättre än OpenAI:s GPT-4, modellen som driver ChatGPT Plus. Nu när Google Gemini har lanserats kan vi äntligen testa det och se hur Gemini kan jämföras med GPT-4.

När Google lanserade Bard i mars 2023 fanns det många anledningar att vara upphetsad. Äntligen skulle OpenAI:s ChatGPT-monopol brytas, och vi skulle få värdig konkurrens.

Men Bard var aldrig den AI-titan folk hoppades på, och GPT-4 är fortfarande den dominerande generativa AI-chattbotplattformen. Nu är Googles Gemini här – men är den efterlängtade AI-modellen bättre än ChatGPT?

Vad är Googles Gemini AI-modell?

Gemini är Googles mest kapabla generativa AI-modell, som kan förstå och fungera över olika dataformat, inklusive text, ljud, bild och video. Det är Googles försök att skapa en enhetlig AI-modell som ritar kapacitet från dess mest kapabla AI-tekniker. Gemini kommer att finnas i tre varianter:

  En guide till att använda react-router-dom
  • Gemini Ultra: Den största och mest kapabla varianten designad för att hantera mycket komplexa uppgifter.
  • Gemini Pro: Den bästa modellen för att skala och leverera hög prestanda över ett brett spektrum av uppgifter, men mindre kapabel än Ultra.
  • Gemini Nano: Den mest effektiva modellen designad för uppgiftsdistribution på enheten. Till exempel kan utvecklare använda Gemini Nano för att bygga mobilappar eller integrerade system, vilket ger kraftfull AI till det mobila rummet.
  • På sin officiella blogg, Nyckelordet, säger Google att Gemini Ultra överträffar toppmoderna i flera riktmärken. Google hävdar att Gemini Ultra slår branschledande GPT-4 i flera viktiga riktmärken.

    Med en aldrig tidigare skådad poäng på 90,0 % på det rigorösa MMLU-riktmärket, säger Google att Gemini Ultra är den första modellen som överträffar prestanda på mänsklig nivå i detta mångfacetterade test som omfattar 57 ämnen.

    Google

    Gemini Ultra kan också förstå, förklara och generera högkvalitativ kod i några av världens mest populära programmeringsspråk, inklusive Go, JavaScript, Python, Java och C++. På pappret är det alla fantastiska resultat. Men dessa är alla riktmärken, och riktmärken berättar inte alltid hela historien. Så, hur bra presterar Gemini i verkliga uppgifter?

    Hur man använder Google Gemini AI

    Av de tre varianterna av Gemini AI-modellen kan du börja använda Gemini Pro redan nu. Gemini Pro är för närvarande tillgängligt på Googles Bard chatbot. För att använda Gemini Pro med Bard, gå till bard.google.com och logga in med ditt Google-konto.

      Topp 8 föga kända användbara produkter för företag

    Google säger att Gemini Ultra kommer att rullas ut i januari 2024, så vi har fått nöja oss med att testa Gemini Pro mot ChatGPT för tillfället.

    Hur Gemini jämför med GPT-3.5 och GPT-4

    När någon ny AI-modell lanseras testas den mot OpenAI:s GPT AI-modeller, som är allmänt accepterade som den toppmoderna modellen som andra modeller bör stå emot. Så, med hjälp av Bard och ChatGPT, testade vi Geminis förmåga i matematik, kreativt skrivande, kodgenerering och exakt bearbetning av bildinmatningar.

    Vi började med den enklaste matematikfrågan vi kunde tänka oss och bad båda chatbotarna att lösa: -1 x -1 x -1.

    Bard gick först. Vi upprepade frågan två gånger, alla kom tillbaka med felaktiga svar. Vi fick visserligen svaret på tredje försöket, men det räknas inte.

    Vi testade ChatGPT som körs på GPT-3.5. Den första rättegången gjorde rätt.

    För att testa Geminis bildtolkningsförmåga gav vi den i uppdrag att tolka några populära memes. Den avböjde och sa att den inte kan tolka bilder med människor i den. ChatGPT, som körde GPT-4V, var villig och kunde göra det felfritt.

    Vi försökte ytterligare ett försök att få den att tolka en bild samtidigt som vi testade dess problemlösnings- och kodningsförmåga. Vi gav Bard, som kör Gemini Pro, en skärmdump och bad den att tolka och skriva HTML- och CSS-kod för att replikera skärmdumpen.

    Här är källans skärmdump.

    Nedan är Gemini Pros försök att tolka och replikera skärmdumpen med HTML och CSS.

      11 bästa Wireframe-verktyg för UX-designers

    Och här är GPT-4:s försök att replikera skärmdumpen. Resultatet är inte förvånande, med tanke på att GPT-4 historiskt har varit stark på kodning. Vi har tidigare demonstrerat att använda GPT-4 för att bygga en webbapp från grunden.

    Vi bad Gemini Pro att skapa en dikt om Tesla (bilmärket för elbilar). Det visade marginella förbättringar från tidigare tester vi har gjort tidigare. Här är resultatet:

    Vid det här laget trodde vi att det vore mer lämpligt att jämföra resultaten med GPT-3.5 istället för den överladdade GPT-4. Så vi bad ChatGPT som kör GPT-3.5 att skapa en liknande dikt.

    Det kan vara ett personligt val, men Gemini Pros syn på detta verkar bättre. Men vi låter dig vara domaren.

    Är Gemini bättre än ChatGPT?

    Innan Google lanserade Bard trodde vi att det skulle vara ChatGPT-tävlingen vi hade väntat på – det var det inte. Nu är Gemini här, och än så länge verkar Gemini Pro inte vara modellen för att ge ChatGPT knockout-punchen.

    Google säger att Gemini Ultra kommer att bli mycket bättre. Vi hoppas verkligen att det är det och att det uppfyller eller överträffar påståendena i Gemini Ultra-meddelandet. Men tills vi ser och testar den bästa versionen av Googles generativa AI-verktyg kommer vi inte att veta om det kan ta bort andra AI-modellkonkurrenter. Som det ser ut förblir GPT-4 den obestridda AI-modellmästaren.