Komplett guide för att upptäcka AI Chatbot Plagiat

AI Chatbots som ChatGPT är inte begränsade till att bara svara på dina frågor. De kan skriva människoliknande e-postmeddelanden, följebrev, essäer, poesi, blogginlägg och mycket mer.

AI-skrivande är som en kameleont – det kan smälta in med alla andra typer av skrift så bra att du skulle bli svårt att se skillnaden.

Tyvärr gör detta det otroligt svårt för oss människor att upptäcka när en AI har skrivit något istället för en person. Visst, vi skulle alla kunna ta Sherlock Holmes råd och ”eliminera det omöjliga”, men vem har tid med det?

Vad händer om jag berättar att stycket ovan är skrivet av en AI? Ja, jag bad YouWrite att skriva en snabb introduktion till det här inlägget, vilket är vad det kom fram till. Ganska övertygande eller hur? Det är problemet, det är för övertygande att vem som helst kan presentera det som sitt eget verk för att dra nytta av det.

AI:er omformulerar inte bara innehållet; de lär sig ämnet och presenterar det på ett naturligt språk med hjälp av RLHF. Detta innebär att det genererade innehållet varken kommer att kännas robotiskt att läsa eller att det kan jämföras med data tillgänglig online för att fånga plagiat.

Att fånga AI-genererat innehåll är inte lätt, och jag tänker inte ge dig falska förhoppningar om att du kan fånga det med 100 % noggrannhet. Men med lite detektivarbete och lite hjälp från AI-skrivdetekteringsverktyg kan du fånga de flesta verk av AI.

Nedan hittar du manuella sätt att upptäcka AI-plagiat och några automatiska verktyg också.

Innehållsförteckning

Upptäck AI-plagiat manuellt 🕵️

ChatGPT är inte ens ett stort problem när det kommer till AI-plagiat. Det finns många alternativa verktyg som bygger på samma GPT-3-teknik och är byggda för att skriva. Dessa är mycket avancerade och speciellt gjorda för att skapa mänskligt innehåll som är svårt att fånga.

Automatiska upptäcktsverktyg är lite hit eller miss beroende på innehållstyp, längd och komplexitet. Så åtminstone för närvarande är det bästa sättet att manuellt ansluta prickarna för att ta reda på om uppskrivningen är AI-genererad eller inte.

Nedan har jag listat några vanliga ledtrådar som du kan leta efter för att fånga AI-genererat innehåll.

#1. Föråldrad information

ChatGPT och annan GPT-3-baserad AI fick sina kunskaper minskade i slutet av 2021. Även om vissa AI-botar har en inbyggd sökmotor för att leta efter den senaste informationen, förlitar de sig fortfarande på gammal data för att skriva innehåll i långa format som t.ex. uppsatser eller blogginlägg.

Om du märker att texten ständigt talar om föråldrad data, särskilt före 2021, kan den vara AI-genererad.

I skärmdumpen nedan bad jag YouWrite berätta om det senaste fotbolls-VM, och det här är vad det kom fram till.

Den talar om VM 2018 istället för det senaste 2022. Även om verktyget är uppdaterat för att prata om senaste händelser som fotbolls-VM 2022, för att skriva långa inlägg, använder det fortfarande den föråldrade informationen som den bygger på.

#2. Använder samma meningsstruktur för beskrivningar

När du skriver beskrivningar av flera produkter/appar använder AI vanligtvis samma meningsstruktur som den redigerar för att passa beskrivningen av en produkt. Beskrivningarna börjar vanligtvis med samma ord, som The, It, A eller produktens namn. Beskrivningarna har också ett dedikerat fokus som det upprepas.

Till exempel, nedan, bad jag ChatGPT att berätta om ”webbplatser för datainmatning”. Du kan se alla beskrivningar som börjar med ”A” och har ett strikt fokus.

Jag ställde också samma fråga till YouChat, och det gjorde samma sak och upprepade namnet på varje webbplats i början, och själva beskrivningarna ser ut som en omformulerad version av varje.

Om texten du analyserar har en beskrivning av något liknande, är det ett bra sätt att fånga AI-skrivande.

#3. Använder korta meningar

För de flesta uppskrivningar kommer AI att använda enradiga meningar med högst ett kommatecken. Kanske försöker de minimera risken för fel, men de undviker att skriva långa meningar som kan kräva användning av kolon, semikolon eller tunga horisontella linjer.

Jag vet att detta inte är den bästa ledtråden för att fånga AI-skrivande, men det är värt att överväga för att ytterligare bevisa din misstanke.

#4. Kan ge felaktig information

För komplexa frågor som vanligtvis involverar någon form av instruktion kan AI:n misslyckas med att förstå avsikten och ge felaktig information. Jag pratar inte om föråldrad information här, de berättar bara med tillförsikt fel information när de inte förstår ämnet.

Till exempel bad jag YouWrite berätta för mig ”hur man rotar en Android-telefon utan en PC”. Det visade mig fortfarande metoder som involverar användning av en PC någon gång i instruktionen.

#5. Lägger inte till en personlig åsikt

När man pratar om något talar AI bara om kända fakta. Till skillnad från människor kommer den inte att prata om sin personliga erfarenhet av den. Även om AI:er kan instrueras att skapa en praktisk skrivning, tenderar de att undvika att göra det som standard.

Om du märker att texten bara handlar om välkända fakta, är det en god chans att den är skriven av en AI. Till exempel, när den pratar om en app kommer den att prata om dess funktioner istället för hur smidig navigeringen är eller hur man faktiskt använder appen.

#6. Korta förklaringar

Eftersom AI begränsas av den kunskap som för närvarande finns tillgänglig, tenderar de att skriva korta förklaringar och beskrivningar. Enligt min erfarenhet, om de pratar om ett visst ämne – som Android-rotning – håller de förklaringen inom max 2-3 stycken. Och för saker som appar eller produkter överstiger beskrivningen vanligtvis inte 1 stycke.

Människor kan skriva på djupet om något, inklusive funktioner, begränsningar, personlig erfarenhet, prissättning, etc. Å andra sidan fokuserar AI vanligtvis på huvuddragen eller höjdpunkterna, så beskrivningen är också kort. Om instruktören ber om mer detaljer ökar chansen avsevärt för felaktig information.

#7. Kontrollera författarens historia

Om du som lärare eller webbmaster har tillgång till skribentens tidigare arbeten eller uppgifter, kan det vara en bra idé att jämföra det med det du är misstänksam mot. Det är högst osannolikt att författaren har en liknande skrivstil som en AI. Även om AI kan ändra skrivtoner, men stilar den väljer är ganska generiska, och den kan inte kopiera din ton.

Ta exemplet med det AI-genererade stycket i inledningen av det här inlägget. Alla som har läst mina tidigare inlägg kan lätt se att min skrivstil är helt annorlunda jämfört med den.

Du kan bara läsa 2-3 tidigare verk av författaren och se om det stämmer överens med skrivstilen för den misstänkta skrivningen.

Verktyg för att upptäcka AI-plagiat

Det finns ett gäng verktyg tillgängliga som kan upptäcka AI-skrivet innehåll. Men deras noggrannhet skiljer sig från varandra och kan misslyckas beroende på typ av innehåll och längd.

Jag testade dessa verktyg med hjälp av olika typer av innehåll som genererats av ChatGPT, GPT-3 Playground, WriteSonic, Rytr och YouWrite. De lyckades upptäcka alla typer av innehåll som genererats av ChatGPT och GPT-3 Playground.

Även om de hade blandade resultat för dedikerade skrivverktyg, intressant nog, misslyckades de alla med att upptäcka YouWrite, jag antar att det beror på att YouWrite gör mänskliga misstag i syfte att undvika upptäckt.

Jag rekommenderar att du använder dessa verktyg tillsammans med att manuellt kontrollera innehållet. Analysera först innehållet med ett av dessa verktyg och kontrollera sedan manuellt efter några ledtrådar för att bekräfta misstanken ytterligare.

Nedan listar jag de som gav bäst resultat och som är enklast att använda:

Obs: För demonstration kommer jag att använda genererad text från WriteSonic om ”Benefits of Mangoes”.

#1. Innehåll i skala

Jag tyckte att AI-innehållsdetektorn från Content At Scale var den mest exakta för de flesta tester jag körde. Den låter dig skanna upp till 2500 tecken per skanning och gör en procentuell förutsägelse som visar verkligt eller falskt innehåll.

Innehåll som är över 60 % falskt är säkert att anta är skrivet av AI-innehåll, åtminstone det mesta. I skärmdumpen nedan kan du se att 96 % innehåll är falskt, vilket jag genererade helt med AI.

#2. GPTZero

Om du vill se exakt vilket innehåll som genereras av AI är GPTZero ett bra alternativ. GPTZero ger inget innehåll. Istället lyfter den fram det exakta innehållet som förmodligen genereras av AI.

Även om det visar förvirring och bristfällighet poäng för att få en uppfattning om slumpmässighet i texten, ännu viktigare, det stöder 5000 tecken per skanning och kan även ladda upp filer. Att skanna stort innehåll hjälper till att förbättra noggrannheten.

#3. GPT-2 utgångsdetektor

Skaparna av ChatGPT erbjuder också en bot för att upptäcka sitt eget arbete. Eftersom GPT-2 och GPT-3 bara är olika i den totala data som används för träning, fungerar denna GPT-2-detektor också bra för GPT-3-baserade AI:er.

Det finns ingen gräns för hur mycket innehåll den kan skanna, så den är perfekt för att upptäcka mycket långt AI-genererat innehåll. Jag tyckte också att dess noggrannhet var bra, särskilt för ChatGPT-genererat innehåll. Det är dock lite förlorat i förutsägelser, så överväg bara dess resultat när det visar över 50 % av innehållet som falskt.

#4. Writer AI Content Detector

Writer AI Content Detector-resultat är tveksamma när man upptäcker innehåll från AI-skrivverktyg, men det fungerar utmärkt för ChatGPT-genererat innehåll. Du kan skanna 1500 tecken per skanning och till och med lägga till webbadressen till innehållet om det redan är publicerat.

För min test av AI-genererad text stod det att 94% av innehållet är mänskligt genererat, vilket är ganska dåligt jämfört med andra verktyg. Ändå är det fortfarande värt att använda för att upptäcka ChatGPT-innehåll, särskilt om det redan är publicerat.

#5. Utkast och mål

Ett enkelt men kraftfullt AI-skrivdetekteringsverktyg. Enligt min erfarenhet erbjöd Draft & Goal liknande resultat som Content At Scale, men det har ingen gräns för antal ord så att du kan skanna långa uppskrivningar. Skanningstiden ökar dock beroende på hur mycket innehåll du skannar.

För min exempeltext står det att 94% av texten är AI-genererad.

Mina tankar 💭

Jag tycker personligen att AI-hjälp faktiskt är ett bra sätt att ta bort writer’s block, få all information på ett ställe och hitta inspiration. Det bör dock aldrig ersätta mänskligt skrivande eftersom AI är begränsad till den kunskap som redan är känd.

Du kan också utforska några bästa plagiatkontrollverktyg för att förhindra kopiering.