En person står och pekar mot en dator medan en annan person sitter och arbetar på en laptop. Området ser ut att vara en kontorsmiljö med dagsljus som kommer in genom fönstret.

Javascript är avstängt

Javascript måste vara påslaget för att kunna spela video
Leonora Vesterbacka och Agnes Toftgård på Kungliga Biblioteket håller på att träna en AI-modell till att förstå olika svenska dialekter. Foto: Rebecka Haglund

Här lär sig AI skånska – förstår inte att det är svenska

Uppdaterad
Publicerad

Att förstå talad svenska och omvandla det till text är helt avgörande för att framtidens AI-tjänster ska bli effektiva. Men dagens tjänster klarar inte av breda dialekter särskilt bra.

– Den sydligaste skånskan är svårast att förstå, säger Agnes Toftgård som är Data Scientist på KB.

Kungliga bibliotekets (KB) specialavdelning för artificiell intelligens håller på att utveckla en AI-modell. En hårddisk har nyss anlänt till ”labbet”. Den innehåller digitaliserade inspelningar av gamla riksdagsanföranden

– Ett utmärkt träningsmaterial för att träna tal-till-textmodeller, säger Leonora Vesterbacka som är Senior Data Scientist på KB.

AI

Samlar på dialekter

KB försöker nu in massor av exempel på olika dialekter, brytningar och andra udda sätt att tala. Syftet är att tillhandahålla en AI-modell som är öppen och fri att använda för alla som vill göra tal-till-texttjänster på svenska.

– Till exempel att diktera och transkribera journaler inom sjukvården, säger Leonora Vesterbacka.

100 år gamla inspelningar

KB har inlett ett samarbete med Institutet för språk- och och folkminnen (Isof) i Uppsala. Här finns tiotusentals timmar inspelat tal arkiverat. De äldsta inspelningarna är över 100 år gamla.

– Det finns ju gamla människor kvar som kanske behöver ringa in ett talsvar till sjukhuset eller beställa något via en telefontjänst, säger Isofs arkivchef Annette Torensjö.

Saknar utländsk brytning

Tjocka dialekter finns det gott om i arkiven. Värre är det med material med svenskar som inte har svenska som förstaspråk.

– Det går inte att ha en transkriberingstjänst som ska funka för alla Sveriges invånare om den bara fungerar för de som pratar rikssvenska, säger Leonora Vesterbacka.

Hör när SVT försöker låta AI:n diktera skånska i klippet.

Så arbetar vi

SVT:s nyheter ska stå för saklighet och opartiskhet. Det vi publicerar ska vara sant och relevant. Vid akuta nyhetslägen kan det vara svårt att få alla fakta bekräftade, då ska vi berätta vad vi vet – och inte vet. Läs mer om hur vi arbetar.

AI

Mer i ämnet