Komplett guide för att upptäcka AI Chatbot Plagiat

Att Avslöja AI-Genererat Innehåll: En Guide

AI-drivna chattbotar, som ChatGPT, är inte enbart begränsade till att ge svar på frågor. De kan framställa texter som liknar mänskligt skapade, inklusive e-postmeddelanden, personliga brev, uppsatser, dikter, blogginlägg och mycket mer.

AI:s förmåga att skriva är anpassningsbar – den kan sömlöst integreras i olika typer av texter, vilket gör det nästintill omöjligt att skilja den från mänskligt skrivande.

Detta gör det svårt att avgöra när en text har skapats av en AI istället för en människa. Visst, vi skulle kunna följa Sherlock Holmes råd om att ”eliminera det omöjliga”, men vem har tid med det?

Tänk om jag avslöjar att stycket ovan är författat av en AI? Jag anlitade YouWrite för att skapa en kort inledning till detta inlägg, vilket resulterade i texten du läste. Ganska övertygande, eller hur? Det är just det som är problemet – det är så trovärdigt att vem som helst skulle kunna presentera det som sitt eget verk i vinningssyfte.

AI:er omformulerar inte bara text; de tillgodogör sig ämnet och presenterar det på ett naturligt sätt genom förstärkningsinlärning med mänsklig feedback (RLHF). Detta betyder att det alstrade innehållet varken känns robotaktigt eller kan jämföras med existerande online-data för att avslöja plagiat.

Att upptäcka AI-genererad text är en utmaning, och jag vill inte ge dig falska förhoppningar om 100% noggrannhet. Men med lite detektivarbete och med stöd av AI-detektionsverktyg kan man avslöja de flesta AI-verk.

Nedan följer metoder för att manuellt identifiera AI-plagiat, samt några automatiska verktyg.

Manuell Detektion av AI-Plagiat 🕵️

ChatGPT är inte det enda problemet med AI-plagiat. Det finns många andra verktyg som bygger på samma GPT-3-teknologi och är konstruerade för att skriva. Dessa är avancerade och specialiserade för att producera mänskligt klingande texter som är svåra att identifiera.

Automatiska detektionsverktyg kan variera i precision beroende på innehållstyp, längd och komplexitet. Därför är det bästa alternativet, åtminstone för närvarande, att manuellt sammanfoga ledtrådar för att avgöra om en text är AI-genererad eller inte.

Jag har listat några vanliga tecken som kan indikera AI-genererat innehåll.

#1. Föråldrad Information

ChatGPT och andra GPT-3 baserade AI:er har sina kunskaper begränsade till data från slutet av 2021. Även om vissa AI-botar har en inbyggd sökmotor för att hitta aktuell information, förlitar de sig fortfarande på äldre data för att skapa längre texter som uppsatser eller blogginlägg.

Om texten regelbundet hänvisar till föråldrad data, särskilt information före 2021, kan den vara AI-genererad.

I skärmdumpen nedan bad jag YouWrite att berätta om det senaste fotbolls-VM, och resultatet blev följande.

Den refererar till VM 2018 istället för 2022. Även om verktyget är uppdaterat för att diskutera aktuella händelser som fotbolls-VM 2022, använder det fortfarande sin äldre databas för att skapa längre texter.

#2. Återkommande Meningsstruktur i Beskrivningar

När AI skriver beskrivningar av flera produkter/appar, använder den ofta samma meningsstruktur som modifieras för varje produkt. Beskrivningarna tenderar att börja med samma ord, såsom ”Den”, ”Det”, ”En” eller produktens namn, och har ett tydligt fokus som upprepas.

Till exempel, när jag bad ChatGPT att ge information om ”webbplatser för datainmatning”, började alla beskrivningar med ”En” och hade ett specifikt fokus.

Jag ställde samma fråga till YouChat, och den uppvisade samma mönster genom att upprepa namnet på varje webbplats i början. Själva beskrivningarna verkade som omskrivna versioner av varandra.

Om texten du granskar innehåller liknande beskrivningar, är det ett tydligt tecken på AI-genererat innehåll.

#3. Korta Meningar

AI använder ofta enradiga meningar med som mest ett kommatecken. Kanske för att minimera risken för fel, men den undviker långa meningar som kan kräva kolon, semikolon eller tankstreck.

Detta är inte den mest avgörande ledtråden för att upptäcka AI-texter, men den kan stärka dina misstankar.

#4. Felaktig Information

När det gäller komplexa frågor som kräver någon form av instruktion kan AI:n missförstå avsikten och ge felaktig information. Jag talar inte om föråldrad data här, utan att den ger fel information med självförtroende, när den inte förstår ämnet.

Till exempel, när jag bad YouWrite beskriva ”hur man rootar en Android-telefon utan dator”, gav den metoder som ändå krävde en dator någon gång under processen.

#5. Avsaknad av Personliga Åsikter

När AI diskuterar ett ämne baseras den enbart på fakta. Till skillnad från människor delar den inte sina egna erfarenheter. Även om AI:er kan instrueras att skriva personligt, tenderar de att undvika det som standard.

Om texten endast berör allmänt kända fakta är chansen stor att den är skriven av en AI. Till exempel, när den beskriver en app fokuserar den på funktionerna snarare än hur lättanvänd navigeringen är eller praktisk användning av appen.

#6. Korta Förklaringar

Eftersom AI:s kunskap är begränsad till befintlig information, tenderar den att ge korta förklaringar och beskrivningar. Min erfarenhet är att om den tar upp ett ämne, som Android-rooting, hålls förklaringen till maximalt 2-3 stycken. Beskrivningar av appar eller produkter överstiger sällan ett stycke.

Människor kan gå på djupet i ett ämne, med detaljer om funktioner, begränsningar, personliga upplevelser, prissättning osv. AI fokuserar vanligtvis på de viktigaste punkterna, vilket ger korta beskrivningar. Om mer detaljer efterfrågas ökar risken för felaktigheter.

#7. Granska Författarens Tidigare Verk

Om du har tillgång till författarens tidigare arbeten kan det vara värdefullt att jämföra dem med den misstänkta texten. Det är osannolikt att en författare har en skrivstil som liknar en AI. Även om AI kan anpassa tonen är stilarna oftast generiska och kopierar inte din personliga ton.

Ta som exempel det AI-genererade stycket i början av detta inlägg. De som känner till mina tidigare inlägg märker tydligt skillnaden i skrivstil.

Läs ett par av författarens tidigare texter för att jämföra dem med den misstänkta texten.

Verktyg för AI-Plagiatdetektion

Det finns flera verktyg som kan upptäcka AI-genererat innehåll. Deras precision varierar och kan bero på typ av innehåll och dess längd.

Jag testade dessa verktyg med olika typer av innehåll från ChatGPT, GPT-3 Playground, WriteSonic, Rytr och YouWrite. De identifierade framgångsrikt alla texter från ChatGPT och GPT-3 Playground.

Resultaten för dedikerade skrivverktyg var blandade, och intressant nog misslyckades samtliga med att detektera YouWrite, troligen för att YouWrite gör misstag medvetet för att undvika upptäckt.

Jag rekommenderar att använda dessa verktyg som ett komplement till manuell granskning. Använd först ett verktyg och sök sedan manuellt efter ledtrådar för att bekräfta dina misstankar.

Nedan listas de verktyg som gav bäst resultat och är enkla att använda:

Obs: Som exempel kommer jag att använda en text om ”Fördelarna med Mangofrukter” genererad av WriteSonic.

#1. Content at Scale

AI-innehållsdetektorn från Content At Scale visade sig vara mest korrekt i mina tester. Du kan skanna upp till 2500 tecken per skanning och den ger en procentuell förutsägelse om texten är sann eller falsk.

Om resultatet visar över 60% falsk text är det troligt att den är skriven av en AI. I skärmdumpen ser vi att 96% av texten är falsk, vilket är en AI-genererad text.

#2. GPTZero

Om du vill se exakt vilka delar av texten som kan vara AI-genererade, är GPTZero ett bra alternativ. GPTZero lyfter fram det specifika innehållet som troligen är skapat av AI.

Verktyget ger också poäng för förvirring och bristfällighet för att ge en bild av slumpmässighet i texten. Det stöder 5000 tecken per skanning och kan även ladda upp filer. Skanning av långa texter ökar noggrannheten.

#3. GPT-2 Output Detector

Skaparna av ChatGPT erbjuder även en bot för att upptäcka sina egna verk. Eftersom GPT-2 och GPT-3 endast skiljer sig i mängden träningsdata, fungerar denna GPT-2-detektor väl för GPT-3-baserade AI:er.

Det finns ingen gräns för mängden text som kan skannas, vilket gör det perfekt för att analysera långa AI-genererade texter. Noggrannheten är bra, särskilt för ChatGPT-genererat innehåll. Men den är inte lika precis i sina förutsägelser, så överväg resultatet när den visar över 50% falskt innehåll.

#4. Writer AI Content Detector

Resultaten från Writer AI Content Detector är tveksamma när det gäller att upptäcka texter från AI-skrivverktyg, men fungerar bra för ChatGPT-genererat innehåll. Du kan skanna 1500 tecken per skanning eller ange webbadressen om texten redan är publicerad.

I mitt test av AI-genererad text indikerade den att 94% var mänskligt genererat, vilket är dåligt jämfört med andra verktyg. Ändå är det värt att använda för att identifiera ChatGPT-innehåll, särskilt om det redan är publicerat.

#5. Draft & Goal

Ett enkelt men kraftfullt AI-detektionsverktyg. Draft & Goal gav liknande resultat som Content At Scale i mina tester, men saknar begränsning i antalet ord, vilket gör det möjligt att skanna långa texter. Skanningstiden ökar dock beroende på textens längd.

För min exempeltext visade den att 94% av texten var AI-genererad.

Mina Slutsatser 💭

Personligen anser jag att AI kan vara ett bra hjälpmedel för att övervinna skrivkramp, samla information och hitta inspiration. Det bör dock aldrig ersätta mänskligt skrivande, eftersom AI är begränsad till befintlig kunskap.

Du kan också utforska några av de bästa verktygen för plagiatkontroll för att undvika oavsiktlig kopiering.