Artificiell intelligens tränas på enorma mängder data taget från internet. Det är denna data som är primära källan till AI:ns ”kunskap och världsbild”.
Flera techföretag har hållit hemligt vad exakt de matat sin AI med – OpenAI har till exempel inte offentliggjort vilka datamängder dess populära verktyg ChatGPT har tränats på.
Forskningsinstitutet Allen Institute for AI har nu tillsammans med tidningen Washington Post analyserat Google's C4 dataset för att se vilka webbsidor data har hämtats från.
5G, antivaccin och Kina
När SVT Nyheter tittar på listan hittar vi flera svenska sajter.
Många nyhetssajter finns med så som svt.se och sverigesradio.se. Men även nazistiska Nordiska motståndsrörelsens sajt Nordfront.
Det vänsterextrema nätverket Antifascistisk aktions webbsida finns med, också Strålskyddsstiftelsen som sprider budskapet om den påstådda hälsofaran med trådlösa nätverk och 5G, och vaken.se, en sajt med stora mängder antivaccin-innehåll.
Googles lista med patent är den sajt som enskilt mest data har hämtats från, med Wikipedia på andra plats. Men högt rankade på listan finns även sidor med kopplingar till Kreml och kinesiska kommunistpartiet, som det statskontrollerade ryska mediehuset RT som är blockerat inom EU sedan början av Ukraina-kriget, och China Daily som ägs av Kinas kommunistiska partis publicitetsdepartement.
Andrea Lewis Åkerman, kommunikationsansvarig på Google Sverige, skriver till SVT Nyheter att företaget ”arbetar hårt för att minimera potentiella risker för användare”.
”Vi har utvecklat en rad olika metoder och teknologier för att förhindra dåliga resultat vid användningen av dessa modeller”, skriver hon.
Men hur påverkar denna typ av sajter AI:n? Dess syn på Förintelsen, på vaccin, på situationen i Xinjiang – eller Ukrainakriget?
Thomas Nygren är professor i didaktik vid Uppsala Universitet och forskar om digital källkritik.
Se hans svar i videon ovan.
Googles svar till SVT
På SVT Nyheters frågor svarar Andrea Lewis Åkerman, kommunikationsansvarig på Google Sverige:
”Vi granskar alla tillämpningar av dessa teknologier i linje med våra AI-principer, och arbetar hårt för att minimera potentiella risker för användare. Vi har utvecklat en rad olika metoder och teknologier för att förhindra dåliga resultat vid användningen av dessa modeller.”
Googles AI-verktyg Bard är tillgängligt i flera länder, men enligt Andrea Lewis Åkerman ”har vi ingen tidslinje att dela med oss av vad det gäller Sverigelansering i dagsläget.”