– Den kan fungera som alltifrån skrivstöd till att klassificera texter och hjälpa till med programmering, säger Ariel Ekgren, forskare på AI Sweden, ett nationellt centrum för tillämpad AI som är både privat och offentligt finansierat.
Modellen har tagits fram i ett forskningsprojekt och har tränats på svenska internet med källor som till exempel det digitala vetenskapliga arkivet Diva, 1177, läkemedelsdatabasen FASS och Litteraturbanken. Men också på öppna forum som till exempel Flashback.
– Vi har ju haft en ambition att få med så mycket som möjligt och då kan det ju ingå en del kontroversiellt material. Men vi tror inte att det är vår plats att ta censurbeslut. Det tror vi att man gör bäst när man vet vad man ska använda de här modellerna till, säger Ariel Ekgren.
Inte aktuellt att träna bort fördomar
Chat SW3 är en grundmodell som skulle kunna användas både inom offentlig sektor och som grund för kommersiella produkter.
Kommersiella chattrobotar som chatGPT och sökmotorn Bing har tidigare fått kritik för att de har genererat rasistisk och på andra sätt olämplig text. Men att träna bort fördomar hos AI:n redan i grundstadiet är inte aktuellt, enligt Ekgren.
– Både Bing och Chat GPT är vidareutvecklingar och produkter som bygger på språkmodeller. När man utvecklar sådana produkter är det jätteviktig att kontrollera vad de säger och förstå om de har någon bias. Men vi är ett steg före det så det är inte något vi behöver jobba aktivt med.