ChatGPT har snabbt blivit ett globalt fenomen, imponerande med sin förmåga till människoliknande konversation. Trots dess imponerande kapacitet finns det begränsningar. Även om ChatGPT kan presentera lösningar på komplexa problem, kan det inte aktivt implementera dem. Code Interpreter är OpenAI:s försök att utveckla ChatGPT från enbart en idégivare till en AI-agent som kan omsätta idéer i praktiken för att lösa problem.
Innebörden av dessa nya möjligheter är omfattande. Här följer en genomgång av vad du bör veta om ChatGPT:s Code Interpreter-funktion och varför den är så viktig.
Vad är ChatGPT:s kodtolk?
Code Interpreter är i grunden en isolerad Python-programmeringsmiljö integrerad i ChatGPT. Här kan du utföra en mängd uppgifter genom att köra Python-kod. Dess association med kodning eller programmering leder dock ofta till att funktionen förbises eller missförstås av många användare. Även om det kallas ”Code Interpreter” och använder programmeringsspråket Python för att utföra uppgifter, är det inte en funktion som enbart riktar sig till personer med programmeringskunskaper. Viss programmeringskunskap kan underlätta användningen, men det är inte nödvändigt att ha erfarenhet av kodning för att nyttja funktionen.
För att bättre förstå kodtolkningsfunktionens syfte är det bäst att analysera den ur ett operativt perspektiv.
Innan kodtolkningsfunktionen eller andra ChatGPT-plugins tillkom, behövde problemen som ChatGPT skulle lösa ha lösningar som kunde uttryckas i text. Behöver du ChatGPT förklara innebörden av generativ AI? Det är ett problem som kan lösas genom textgenerering. Eller, vill du använda ChatGPT för att översätta text till ett annat språk? Även det kan lösas genom textgenerering. I dessa exempel kan lösningen presenteras som text.
Men vad händer om du vill lösa problem som att skapa en avancerad graf, redigera en bild eller extrahera en färgkod från en bild? Det är problem vars lösningar inte kan uttryckas enbart med text – de kräver specifika åtgärder. Utan plugins som Code Interpreter kan ChatGPT endast beskriva hur du ska gå tillväga. Kodtolken fungerar som ett verktyg i bakgrunden som tar ChatGPT:s beskrivning av problemlösningen och implementerar den med Python-kod. Men hur fungerar det i praktiken?
Hur fungerar ChatGPT:s kodtolk?
Code Interpreter förenar kraften hos en stor språkmodell med kraften i Python-programmering, vilket gör att ChatGPT kan vara mer än bara en textgenerator. Dessa två komponenter är avgörande för att förstå hur kodtolkningsfunktionen fungerar. Tänk dig att du vill att ChatGPT ska dela en bild i två lika delar, invertera färgerna på den ena delen och sedan sammanfoga dem för att skapa en ny bild. Hur skulle ChatGPT hantera det?
Processen skulle antagligen se ut så här: Med hjälp av sin GPT-språkmodell kommer ChatGPT att få en idé om hur problemet ska lösas, i detta fall med Python-programmering. ChatGPT genererar ett Python-skript som kan dela bilden i två delar, invertera färgerna på en av delarna och sedan sammanfoga dem, precis som användaren har angett.
Eftersom kodtolken är en Python-programmeringsmiljö som kan köra Python-kod, matar ChatGPT in det genererade Python-skriptet till kodtolken. Efter att ha kört skriptet returnerar det den resulterande bilden till ChatGPT. Problemet är löst. Det kan liknas vid att en programmerare skriver ett program åt dig för att lösa alla problem du beskriver, i realtid.
Varför är kodtolken så viktig?
Även om lanseringen av kodtolkningsfunktionen kanske inte har fått den uppmärksamhet den förtjänar, kan det vara den enskilt viktigaste funktionen i ChatGPT-ekosystemet på lång sikt, bortsett från den underliggande modellen. Det är en mycket viktig funktion.
Trots att dess nuvarande kapacitet inte fullt ut visar dess potential, kommer kodtolkfunktionen, eller åtminstone dess operativa modell, sannolikt att vara framtiden för ChatGPT AI-chatboten. Varför det?
Nuvarande versioner av stora språkmodeller, inklusive GPT-3.5- och GPT-4-modellerna som driver ChatGPT, har inneboende begränsningar. Som tidigare nämnts kan de beskriva hur man löser ett problem, men deras förmåga att omsätta de steg de föreslår i praktiken är mycket begränsad. Det är därför LLM-drivna AI-chattbotar ännu inte har utvecklats till fullvärdiga AI-assistenter.
För att ge en tydligare bild kan vi ta Google Assistant som exempel. Du kan be Google Assistant att ringa ett samtal, skicka ett SMS, eller till och med boka en tid hos tandläkaren. Till skillnad från de nuvarande chattbotsmodellerna kommer Google Assistant inte bara att berätta hur du gör saker; den kan faktiskt göra saker.
Google Assistant är kanske inte ett fullkomligt exempel, men det ger en indikation på hur nuvarande versioner av ChatGPT-chatboten kan utvecklas tack vare kodtolkningsfunktionen. Du skulle till exempel kunna be ChatGPT att extrahera bilder på alla katter i en videofil och skicka dem till din e-postadress. Eller kanske söka igenom Twitter och samla in alla tweets där du nämns. Eller i princip vad som helst du kan tänka dig som kan göras programmatiskt. ChatGPT kommer att starta kodtolken, skriva ett program som utför uppgiften, utföra den och returnera resultatet inom några sekunder. Denna förmåga hos ChatGPT att generera konkreta resultat via kodtolken är det som gör funktionen så viktig.
Även om det är omöjligt att med säkerhet förutsäga den tekniska utvecklingen, är det lätt att föreställa sig att andra AI-företag som Google använder liknande tolkningsmodeller för sina AI-chattbotar. Liknande kodtolkar implementerade i andra framstående AI-chattbotar kan vara katalysatorn som gör AI-chattbotar till ett mer praktiskt och allmänt användbart verktyg.
En modell för AI-chattbotar
ChatGPT:s kodtolk introducerar ett nytt tankesätt för AI-chattbotar. Genom att inkludera förmågan att tolka instruktioner, skriva kod och köra program, har OpenAI gett ChatGPT möjligheten att generera konkreta resultat enbart via konversation. Detta är en praktisk modell som andra AI-chattbotar kan använda för att gå från att vara informationsleverantörer till att bli AI-assistenter som kan utföra uppgifter.
Utan tvekan är Code Interpreter-modellen en avgörande utveckling som kommer att göra ChatGPT och andra AI-chattbotar som använder liknande modeller betydligt mer kapabla och användbara.