Här är varför det inte fungerar (ännu!)

Introduktion till AI i nyhetsförmedling

Artificiell intelligens (AI) har genomgått en remarkabel utveckling och påverkat många aspekter av våra liv, inklusive hur vi konsumerar nyheter. AI-drivna chattrobotar, som ChatGPT, Chatsonic, Perplexity, Copilot och Gemini, erbjuder nya vägar för att få tillgång till nyhetsuppdateringar. Trots dessa möjligheter är det viktigt att vara medveten om begränsningar och etiska frågor som uppstår när AI används för nyhetsinsamling. Många av dessa chatbots kan ha svårigheter att ge precisa, enhetliga och detaljrika nyhetsrapporter, ofta på grund av hur väl de kan tolka användarfrågor, begränsningar i realtidsinformation och bristfällig kontextförståelse. I den här analysen undersöks hur fem av de ledande AI-chattbottarna presterar när det kommer till nyhetsrapportering, med fokus på de potentiella fördelarna och utmaningarna med att använda AI för daglig nyhetskonsumtion.

Viktiga observationer

  • Svaren från AI-chattbottar som ChatGPT, Chatsonic, Perplexity, Copilot och Gemini varierar avsevärt när det gäller nyhetsrapportering.
  • Dessa AI-verktyg kan ha problem med att leverera korrekta, konsistenta och nyanserade nyhetsuppdateringar, vilket beror på svårigheter i tolkningen av användarfrågor.

AI erbjuder många fördelar men genererar samtidigt utmaningar och etiska överväganden, särskilt när det gäller daglig nyhetsinhämtning. AI-botar som ChatGPT, Chatsonic, Perplexity, Copilot och Gemini uppvisar skillnader i hur de hämtar och presenterar dagens nyheter.

Kan man lita på generativ AI för dagliga nyheter? En jämförelse av fem tjänster

Jag har testat de mest populära generativa AI-botarna för att se hur de hanterar dagliga nyheter, vilket resulterat i en bred variation av svar. Skillnader i hur de tolkar uppmaningar, begränsningar i realtidsinformation och den kontextuella förståelsen hos AI-chatbottar som ChatGPT, Chatsonic, Perplexity, Copilot och Gemini leder till varierande nyhetsuppdateringar.

Här följer en jämförelse av deras prestanda:

ChatGPT (Gratis)

Den kostnadsfria versionen av ChatGPT använder nu GPT-4o, OpenAIs senaste AI-modell. Även om denna version har tillgång till internet, finns det en begränsning på 16 frågor inom en 24-timmarsperiod, efter vilken den återgår till den äldre GPT-3.5-modellen.

GPT-4o är ofta användbar för att få en snabb överblick över dagens nyheter. Genom att ställa enkla frågor, som ”Ge mig dagens nyhetsrubriker”, kan man effektivt använda den kraftfulla modellen utan att överskrida den fria tilldelningen. Specifika frågor kan också ställas, men det påverkar den dagliga begränsningen.

Det är viktigt att notera att om den dagliga tilldelningen för GPT-4o-meddelanden är uttömd, är det inte meningsfullt att fråga GPT-3.5 efter en daglig nyhetsuppdatering, eftersom den saknar internetanslutning och har träningsdata som sträcker sig till april 2023.

Frågor om dagens nyheter eller rubriker gav i allmänhet användbara resultat, men med tydliga begränsningar vad gäller källval, korrekt angivelse av källor och variation. ChatGPT kunde snabbt leverera några av de ledande rubrikerna, men de angivna URL:erna som källor ledde inte till specifika sidor, trots att de refererade till särskilda händelser.

Vidare föreslog ChatGPT även gammal information, vilket inte berodde på datakutoff-punkten. Som exempel, se bilden ovan, där ChatGPT föreslår att ”Cybersäkerhet i AI-eran förblir en kritisk fråga, med branschexperter som Amazons Chief Security Officer Steve Schmidt som diskuterar utmaningar och strategier för att skydda data,” med GeekWire som källa. En närmare granskning avslöjade att GeekWire publicerade denna artikel den 15 juni 2024, nästan en månad tidigare.

Chatsonic

Liksom ChatGPT, hanterade Chatsonic förfrågningar om nyhetsrubriker och dagliga uppdateringar ganska väl. Den täckte ett brett utbud av ämnen som aktuella händelser, politik, affärer, teknik och underhållning. Den korta sammanfattningen av nyhetshistorierna var också praktisk för att få en snabb överblick.

Chatsonics urval av källor var dock lite oklart. Till exempel användes Hindustan Times (en indisk dagstidning) som källa i en sökning. En annan källa var Dryden Wire, en ”digital nyhetskanal” från nordvästra Wisconsin. Det är tydligt att dessa källor har mycket olika räckvidd och målgrupper.

En möjlig förklaring är att en nyhetsrubrik den dagen relaterade till primärvalet i Wisconsin den 13 augusti 2024. Chatsonic använde en rubrik från den händelsen, trots att dess inverkan på det amerikanska presidentvalet var begränsad.

Perplexity

Perplexity gav också till viss del användbara dagliga nyheter; vid varje förfrågan om dagliga nyheter genererades en lista med rubriker från de senaste veckorna, varav en del var dagsaktuella.

Genom en specifik fråga som ”Kan du ge mig dagens nyhetsrubriker från USA?” fick jag en topprubrik om skjutningen vid ett Donald Trump-kampanjmöte den 13 juli 2024 – en hel månad före min sökning. Å andra sidan täckte nästa rubrik att United Auto Workers-facket hade lämnat in anklagelser mot Donald Trump och Elon Musk, vilket hände några timmar före min förfrågan (den 13 augusti 2024).

Sökningar efter nyhetsrubriker från Storbritannien gav liknande blandade resultat. Rubrikerna inkluderade en tragisk attack och fällande domar mot en kontroversiell person, båda från flera veckor tillbaka.

Med Perplexity kan det vara nödvändigt att experimentera med olika formuleringar för att få fram den mest korrekta nyhetsrapporteringen. När den rätta kombinationen hittades, förutom den felaktiga rubriken, var de flesta rubrikerna korrekta och relaterade till händelser samma dag eller de föregående 24-48 timmarna.

Microsoft Copilot

Jag imponerades av Copilots val av rubriker och källor, men dess ämnesval och antal rubriker var begränsat jämfört med Perplexity. Varje rubrik var dock aktuell och täckte antingen nyheter från den aktuella dagen eller de föregående 24-48 timmarna.

Dess beskrivningar var dock extremt korta, vilket inte är användbart för djupare nyhetskonsumtion. Visst, det fungerar som en utgångspunkt, men en sammanfattning på en rad gör inte rättvisa åt en komplex nyhetshändelse.

Den presterade sämre vid kontroll av tekniknyhetsrubriker, och täckte berättelser från den senaste veckan och, intressant nog, tog en rubrik från en podcast. Så, inte helt värdelöst, men inte heller ”breaking news” samma dag.

Gemini

Av alla AI-chattbottar som testades för dagliga nyheter är Gemini potentiellt den bästa, men som med de andra alternativen, beror det på hur frågan formuleras.

En generell förfrågan om dagens nyhetsrubriker ger inte mycket information och brukar generera fyra eller fem rubriker utan nämnvärd analys. Men om man ber om mer detaljer eller information med lite mer bakgrund gör den det. På samma sätt, när jag bad Gemini om allmänna tekniknyhetsrubriker, fick jag gammal information från flera veckor tillbaka. Men genom att ändra min fråga till ”Vilka är tekniknyhetsrubrikerna från idag, tack?”, fick jag den mest precisa listan över aktuella och nyligen publicerade nyheter bland alla chattbottar jag testade.

Det enda negativa är Geminis källhantering. Istället för att ge individuella länkar till varje nyhetshistoria lämnas en lista med källor i slutet av svaret, vilket kräver att man själv letar upp den specifika URL:en.

Fyra anledningar till varför man inte bör förlita sig på AI-chattbottar för nyheter

Även om AI kan vara en bra startpunkt för nyhetsinhämtning, är det viktigt att vara medveten om de betydande begränsningar som AI-chattbottar medför. Här är fyra anledningar till varför du inte enbart bör förlita dig på AI-chattbottar för dina dagliga nyhetsuppdateringar:

  • Bristande nyanser: AI kan ha svårt att erbjuda omfattande och korrekta sammanfattningar av nyhetshändelser. Dagliga nyhetsuppdateringar saknar kontext, missar historiers emotionella vikt och AI har svårt att fånga mänskliga känslor som sorg, glädje eller ilska.
  • Inkonsekvens: Trots förbättringar kan man inte förvänta sig samma resultat från samma fråga, även med samma AI-verktyg. Du riskerar att missa rubriker och se felaktiga rubriker.
  • Begränsad täckning: Utbudet av nyheter som en AI-chatbot erbjuder är begränsat, även med internetanslutning. AI-chatboten kan även använda tvivelaktiga källor. Du kommer sannolikt att missa nischade ämnen (vilket delvis kan åtgärdas genom att justera frågan).
  • Hallucinationer: Ett av de största problemen är AI-hallucinationer, där AI-modellen hittar på information och presenterar den som fakta. Även om hallucinationer minskar i takt med att generativa AI-modeller utvecklas, är det viktigt att informationen som presenteras är korrekt, särskilt när det gäller nyheter.

Jag observerade inga hallucinationer under mina tester. Trots att alla fem AI-chattbottarna hade problem med att ge aktuella nyheter, var ingen av de tillhandahållna uppgifterna påhittade.

Sammanfattningsvis var det en blandad erfarenhet att använda AI för att hämta mina dagliga nyheter. Resultaten var okej efter att jag hade justerat mina frågor, men vid det laget hade jag lika gärna kunnat öppna min föredragna nyhetssajt, läsa nyheterna och gå vidare med min dag.