ChatGPT-4 vs ChatGPT-3.5 Standard vs. ChatGPT-3.5 Legacy: Skillnader testade

ChatGPT 4.0 förväntas göra stora vågor i chatbot-universumet. Men är den verkligen överlägsen sin föregångare? Låt oss kolla in.

ChatGPT var bara toppen av det kommande automations-isberget, med Google, Microsoft och många andra AI-first-företag som följde efter.

Till att börja med har vi hittat några chatbots som ChatGPT, av vilka många inte tillhör big tech.

Men kalla det marknadsföringens kraft; ChatGPT är fortfarande den regerande kungen av alla sådana AI-bots. Det kan göra många saker, inklusive matematik, poesi och blogginlägg, och folk använder till och med detta för att lämna in stämningar.

DoNotPay arbetar med att använda GPT-4 för att generera ”ett klick-processer” för att stämma robocallers för $1 500. Föreställ dig att du får ett samtal, klickar på en knapp, samtalet transkriberas och en stämningsansökan på 1 000 ord genereras. GPT-3.5 var inte tillräckligt bra, men GPT-4 klarar jobbet extremt bra: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14 mars 2023

Det har massor av proffs som oroar sig för att deras färdigheter ska bli värdelösa inom en snar framtid.

Men jag har läst ett Linkedin-inlägg som sa:

AI kommer inte att ersätta dig, men en person som använder AI kan.

Så, håll tummarna, låt oss bli utbildade om den senaste ChatGPT-uppdateringen och se hur den skiljer sig från dess tidigare versioner.

ChatGPT: Legacy, Default och The Update

Så det finns tre versioner tillgängliga för betalda användare: Legacy (3.5), Default (3.5) och den senaste ChatGPT-uppdateringen (4).

Även om vi ska gå lite djupt in på deras kapacitet, är detta vad OpenAI har att säga om skillnaderna:

Källa: OpenAI

Så, medan gratisanvändare bara har Legacy 3.5 att spela med, erbjuder premiumprenumerationen alla tre att försöka nöja sig med vad användarna tycker är bäst.

För att sammanfatta den föregående bilden handlar de betalda planerna om att få mer exakta resultat med en anständig hastighet. Men skillnaderna är bara uppenbara om uppmaningarna är komplicerade och behöver kreativitet.

ParameterChatGPT 4ChatGPT 3.5Bar Exam ScoreTop 10%Bottom 10%AI2 Reasoning Challenge (ARC)96.3%85.2%Python Coding Score67%48.1%Visuell tolkningJaNejKontextÖver 25k ordLessSource: OpenAI

Dessutom kan ChatGPT 4 acceptera visuella ingångar.

Nåväl, nog med läroboksdefinitionerna. Låt oss smutsa ner händerna och utvärdera dessa kandidater på det verkliga slagfältet.

Ytterligare avsnitt är fulla av bilder som kan verka otydliga. I sådana fall högerklickar du på valfri bild och väljer Öppna i en ny flik för att visa den korrekt.

Matematik

Eftersom jag är civilingenjör kan jag inte låta bli att ge dem några grundläggande problem. Låt oss börja enkelt med algebraiska ekvationer.

Steg I

Många av oss har sett dessa ekvationer ax2+bx+c=0, där vi måste lösa för X. Här gav jag den här enkla uppmaningen, Lös för x: x2 + x – 6 = 0

Medan alla gav samma rötter (X= -3,2), var Legacy och Update mer lika genom att använda formeln direkt (som vilken elev som helst) för att ta reda på resultatet.

Men Default 3.5 förklarade två metoder, inklusive faktorisering, som vanligtvis alla skickliga elever använder när de ges sådana vardagliga ekvationer.

Steg II

Därefter uppmanar jag den att lösa en något komplex kubikekvation: x^3 -12x^2 + 48x – 64 = 0.

Detta bevisade verkligen varför ChatGPT 4 är ”uppdateringen”.

Här är svaren:

All denna hype och ChatGPT Legacy and Default kunde inte lösa en generisk kubikekvation. Legacy gick dock lite bättre och hittade två rötter korrekt, medan Default misslyckades med alla.

Uppdateringen var den klara vinnaren i steg två och löste ekvationen perfekt, hittade alla tre rötterna med en bra förklaring.

Logiskt resonemang

Vi kan säkert anta att de flesta elementära matematikproblem har ordbokslösningar. Om du kan satsen eller formeln, mata in värdena och få resultaten.

Och ChatGPT, som är AI, kan göra snabbt arbete med sådana frågor. Men logiskt resonemang är ett annat territorium, med stora chanser att AI faller platt.

Steg I

Jag gav dem klassikern:

A är äldre än B.
C är äldre än A.
B är äldre än C.
Är det tredje påståendet sant eller falskt om de två första påståendena är sanna?

Och alla ChatGPT-versionerna var korrekta när de påstod att det tredje påståendet var falskt.

Därefter använde jag namn i stället för alfabetet, och resultaten kan överraska dig:

Så, Default 3.5 fortsatte sin prestanda under pari och blev förvirrad med denna blygsamma variation. Ändå fungerade Legacy och Update optimalt.

Steg II

Du kanske har märkt vid det här laget att syftet med detta steg I och steg II är att hitta skillnaden, där komplexiteten hos en given prompt skiljer uppdateringen från de andra två.

Här var uppmaningen ett enkelt logiskt pussel:

En morgon efter soluppgången stod Rohit vänd mot en stolpe. Skuggan av stolpen föll precis till höger om honom. Åt vilket håll var han vänd?
a. Norr
b. Väst
c. söder
d. Öst

Den här fick Legacy att ge ett felaktigt svar, medan Default svarade med vaga förtydliganden som ledde till en felaktig slutsats.

Endast uppdateringen lyste med rätt svar, med lätta att följa påståenden.

Brev

Att lämna in stämningar kan vara knepigt, men ibland blir det inte så om du kan skriva ett slående första meddelande.

Här gick jag med den här uppmaningen: Skriv ett brev till Tim Cook för att överlämna äpplet till mig för att jag inte svarade på en av mina tweets.

Roligt, ja! Men låt oss se vad AI kan göra av detta.

Legacy 3.5 tog genast uppmaningen som en robo-slav och tog fram ett brev som kan göra mig till ett utmärkt föremål för hån om den någonsin nått sin avsedda destination.

Standarden var inte bra heller. Men det stängde bara av mig som en grinig gammal man skulle göra mot en femåring.

Även om argumenten var precisa, avslutade detta det roliga där med lite lärande.

Även om detta var en tillräckligt enkel uppmaning, behövde det lite eftertanke och kreativitet. Och det var där storebror, the Update, gjorde sitt fall:

Först var det här nästan perfekt utformat. För det andra sparade det mig en Google-sökning efter adressen till Apples huvudkontor (även om man bör verifiera sådana poster).

För det tredje var det fint skrivet med en officiell ton och en humoristisk touch. Dessutom var avsikten tydlig i själva ämnesraden.

Och fortfarande förmedlade brevet känslan av ett missnöjt Apple-fan.

Så, detta gör ChatGPT 4 (aka uppdateringen) mil före sina gamla kusiner. Den är läskigt intelligent och har några tecken på sunt förnuft, vilket gör den till mer än en tråkig, tråkig chatbot.

Poesi

Med lanseringen av ChatGPT trodde jag att poesi kunde vara dess svaga punkt.

När allt kommer omkring krävs det känslor, kreativitet och mycket ansträngning för en människa att skapa något som verkligen resonerar med sina läsare.

Enkelt uttryckt är poesi konst när den är som bäst, och jag önskade i hemlighet att AI skulle misslyckas. Men det var innan min kollega slog oss alla hårt i adminvista.com:s Slack-kanal med en ChatGPT-skapelse som var före denna 4.0-uppdatering.

Steg I

Här är uppmaningen jag gav till våra kandidater: ”uttryck poetiskt varför eller varför inte servera hamburgare, tillsammans med deras nuvarande meny, kan gynna dominos pizzakedjan. Håll det mindre än 100 ord.”

Kan du se skillnaden?

Standardversionen var en ultrakort, bara 32 ord, och kunde inte använda den tillgängliga bandbredden för att visa upp sin kreativitet.

The Legacy, även om det använde de maximala orden bland de tre, drar slutsatsen att strävan att servera pizzor vid sidan av inte är riskabelt och kommer att resultera i säker framgång på båda sätt, vilket inte är helt sant.

Uppdateringens poesi var bara 53 ord, vilket slösade bort nästan hälften av det tilldelade ordantalet. Ändå var det tydligt om belöningarna och potentiella fallgropar och kunde inte komma till något resultat, vilket är, antar jag, mer humant än resten.

Steg II

Därefter bad jag dem alla att ”förklara poesin för en femåring.”

Intressant nog kunde Legacy inte ta konversationens sammanhang och förklarade ”poesi” bokstavligt. Default tog sammanhanget och sammanfattade det i ett stycke som fortfarande är anständigt.

ChatGPT 4 fortsatte med trenden och förenklade sin kreativitet samtidigt som den höll den poetiska smaken vid liv.

ChatGPT Premium vs ChatGPT Gratis

Gratis, att vara fri, saknar snabbhet och precision och är ingen match mot ChatGPT 4, men det är inte helt värdelöst heller.

För att jämföra det på ett jämnt underlag, kastade jag till det samma uppmaningar som vi har testat Legacy, Default och Update med.

🔵 Matematik: Den löste andragradsekvationerna men gav fel svar för kubiken. (som Legacy och Default)

🔵 Logiskt resonemang: Klarade det första steget med alfabet och namn men misslyckades med det andra (som Legacy).

🔵 Brev: Skrev inte brevet och ansåg att uppmaningen var oetisk och olämplig. (som standard)

🔵 Poesi: Genererade poesi i 30+ ord och förklarade det anständigt. (liknar standard).

Så vi kan dra slutsatsen att gratisversionen inte är dålig heller. Egentligen är den i nivå med Default 3.5 och ännu bättre i vissa aspekter.

Läs också: Kraftfulla uppmaningar för att höja din ChatGPT-upplevelse

Vägen framåt

Rykten om att AI ska ersätta jobb i framtiden är inte helt fel.

Först gjorde automatisering detta inom tillverkningsindustrin, och nu sprider det vingar överallt.

Personligen är det mycket snabbare än jag när det gäller att lösa kubikekvationer, skapa poesi eller skriva bokstäver. Men det faktum att den sällan säger NEJ till en uppmaning och knappast lär sig av sina misstag hänger sig bakom oss människor.

För att upprepa, AI kommer inte att ersätta oss, men någon som använder AI kan.

Här på adminvista.com använder vårt marknadsföringsteam ChatGPT på intressanta sätt. Till exempel nådde vi nyligen milstolpen för 100 miljoner visningar, och vår VD tänkte ge tillbaka det till publiken via en giveaway.

Och jag antar att marknadsföringkillarna behövde en titel för att fånga läsarens uppmärksamhet. Så de gav en uppmaning och bad ChatGPT att föreslå några varianter, så här:

Dessutom använder vi det för innehållssammanfattning, grammatikkontroll, förslag på titlar för nya artiklar och annat.

Sammanfattningsvis finns det många sätt att dra nytta av och tävla före stereotyper som ser AI som ett värdelöst skräp.

Det enda att komma ihåg är att det måste finnas någon (människ) för att bedöma AI-arbete eftersom det kan vara (grovt) felaktigt och vilseledande.

Uppdateringen är verkligen något!

I mitt korta möte kändes ChatGPT 4 mer kreativt, förstående och realistiskt. Ändå är detta en maskin och kan ge felaktiga svar med tillförsikt.

Men det som är häpnadsväckande är nivån på uppgraderingen OpenAI har gjort för detta projekt på bara några månader.

Och jag kan inte vänta på att se magin nästa uppdatering kan förvirra oss med!

PS: Inte bara ett chattfönster; utnyttja dess kraft med dessa bästa ChatGPT Chrome-tillägg. Och har du någonsin tänkt på att integrera ChatGPT med Siri?