• Viktigt meddelande:

    Viktigt meddelande till allmänheten i Skelleftehamn och Örviken i Skellefteå kommun, Västerbottens län. Det brinner i ett industriområde med kraftig rökutveckling till följd. Räddningsledaren uppmanar alla i området att gå inomhus och stänga dörrar, fönster och ventilation. För mer information lyssna på Sveriges Radio P4 Västerbotten.

Javascript är avstängt

Javascript måste vara påslaget för att kunna spela video
Om artificiella intelligensen tränas på nazistiska webbsidor, eller rysk propaganda – hur påverkar det vilka svar den ger? Se videon för expertens förklaring. Foto: SVT/Midjourney/Faksimil

Googles AI tränas på svensk nazistisk webbsida

Uppdaterad
Publicerad

Den artificiella intelligensen öppnar gapet stort, och sväljer glupskt data skrapad från webbsidor på nätet – och ut på andra sidan kommer något som ska utge sig för att vara fakta. Men vad händer om data-tuggan innehållit högerextremism, konspirationsteorier och rysk propaganda?

Artificiell intelligens tränas på enorma mängder data taget från internet. Det är denna data som är primära källan till AI:ns ”kunskap och världsbild”.

Flera techföretag har hållit hemligt vad exakt de matat sin AI med – OpenAI har till exempel inte offentliggjort vilka datamängder dess populära verktyg ChatGPT har tränats på.

Forskningsinstitutet Allen Institute for AI har nu tillsammans med tidningen Washington Post analyserat Google's C4 dataset för att se vilka webbsidor data har hämtats från.

5G, antivaccin och Kina

När SVT Nyheter tittar på listan hittar vi flera svenska sajter.

Många nyhetssajter finns med så som svt.se och sverigesradio.se. Men även nazistiska Nordiska motståndsrörelsens sajt Nordfront.

Det vänsterextrema nätverket Antifascistisk aktions webbsida finns med, också Strålskyddsstiftelsen som sprider budskapet om den påstådda hälsofaran med trådlösa nätverk och 5G, och vaken.se, en sajt med stora mängder antivaccin-innehåll.

Ett axplock av webbsidor vars data finns med i Google's C4 dataset. Foto: Faksimil

Googles lista med patent är den sajt som enskilt mest data har hämtats från, med Wikipedia på andra plats. Men högt rankade på listan finns även sidor med kopplingar till Kreml och kinesiska kommunistpartiet, som det statskontrollerade ryska mediehuset RT som är blockerat inom EU sedan början av Ukraina-kriget, och China Daily som ägs av Kinas kommunistiska partis publicitetsdepartement.

Andrea Lewis Åkerman, kommunikationsansvarig på Google Sverige, skriver till SVT Nyheter att företaget ”arbetar hårt för att minimera potentiella risker för användare”.

”Vi har utvecklat en rad olika metoder och teknologier för att förhindra dåliga resultat vid användningen av dessa modeller”, skriver hon.

Men hur påverkar denna typ av sajter AI:n? Dess syn på Förintelsen, på vaccin, på situationen i Xinjiang – eller Ukrainakriget?

Thomas Nygren är professor i didaktik vid Uppsala Universitet och forskar om digital källkritik.

Se hans svar i videon ovan.

Googles svar till SVT

På SVT Nyheters frågor svarar Andrea Lewis Åkerman, kommunikationsansvarig på Google Sverige:

”Vi granskar alla tillämpningar av dessa teknologier i linje med våra AI-principer, och arbetar hårt för att minimera potentiella risker för användare. Vi har utvecklat en rad olika metoder och teknologier för att förhindra dåliga resultat vid användningen av dessa modeller.”

Googles AI-verktyg Bard är tillgängligt i flera länder, men enligt Andrea Lewis Åkerman ”har vi ingen tidslinje att dela med oss av vad det gäller Sverigelansering i dagsläget.”  

Så arbetar vi

SVT:s nyheter ska stå för saklighet och opartiskhet. Det vi publicerar ska vara sant och relevant. Vid akuta nyhetslägen kan det vara svårt att få alla fakta bekräftade, då ska vi berätta vad vi vet – och inte vet. Läs mer om hur vi arbetar.